Comprendre l'URL
Chaque document sur le Web a une adresse unique. Cette adresse est connue sous le nom deUniform Resource Locator (URL).
Plusieurs balises HTML / XHTML incluent une valeur d'attribut d'URL, y compris des hyperliens, des images intégrées et des formulaires. Tous utilisent la même syntaxe pour spécifier l'emplacement d'une ressource Web, quel que soit le type ou le contenu de cette ressource. C'est pourquoi il est connu comme un localisateur de ressources uniformes.
Éléments d'URL
Une URL est composée de plusieurs parties, chacune offrant des informations au navigateur Web pour aider à trouver la page. Il est plus facile d'apprendre les parties d'une URL, si vous regardez l'exemple d'URL ci-dessous, il y a trois parties clés: le schéma, l'adresse de l'hôte et le chemin du fichier. La section suivante abordera chacun d'entre eux:
http://www.tutorialspoint.com/index.htm
Le régime
Le schéma identifie le type de protocole et l'URL vers lesquels vous créez un lien et, par conséquent, comment la ressource doit être récupérée. Par exemple, la plupart des navigateurs Web utilisent le protocole HTTP (Hypertext Transfer Protocol) pour transmettre des informations afin de communiquer avec les serveurs Web et c'est la raison pour laquelle une URL commence par http: //.
Il existe d'autres schémas disponibles et vous pouvez utiliser l'un ou l'autre en fonction de vos besoins:
Sr.Non | Schéma et description |
---|---|
1 | http:// Le protocole HTTP (Hypertext Transfer Protocol) est utilisé pour demander des pages aux serveurs Web et les renvoyer des serveurs Web aux navigateurs. |
2 | https:// Le protocole HTTPS (Secure Hypertext Transfer Protocol) crypte les données envoyées entre le navigateur et le serveur Web à l'aide d'un certificat numérique. |
3 | ftp:// Le protocole de transfert de fichiers est une autre méthode de transfert de fichiers sur le Web. Bien que HTTP soit beaucoup plus populaire pour la visualisation de sites Web en raison de son intégration avec les navigateurs, FTP est encore un protocole couramment utilisé pour transférer des fichiers volumineux sur le Web et pour télécharger des fichiers sources sur votre serveur Web. |
4 | file:// Utilisé pour indiquer qu'un fichier se trouve sur le disque dur local ou dans un répertoire partagé sur un réseau local. |
L'adresse de l'hôte
L'adresse de l'hôte est l'endroit où un site Web peut être trouvé, soit l'adresse IP (quatre ensembles de nombres entre 0 et 255, par exemple 68.178.157.132) ou plus communément le nom de domaine d'un site tel que www.tutorialspoint.com. Notez que "www" ne fait pas partie du nom de domaine bien qu'il soit souvent utilisé dans l'adresse de l'hôte.
Le chemin du fichier
Le chemin d'accès au fichier commence toujours par une barre oblique et peut se composer d'un ou plusieurs noms de répertoire ou de dossier. Chaque nom de répertoire est séparé par des barres obliques et le chemin du fichier peut se terminer par un nom de fichier à la fin. Ici, index.htm est le nom de fichier disponible dans le répertoire html:
https://www.tutorialspoint.com/html/index.htm
Autres parties de l'URL
L'utilisation des informations d'identification est un moyen de spécifier un nom d'utilisateur et un mot de passe pour une partie protégée par mot de passe d'un site. Les informations d'identification viennent avant l'adresse de l'hôte et sont séparées de l'adresse de l'hôte par un signe @. Notez comment le nom d'utilisateur est séparé du mot de passe par deux points. L'URL suivante montre le nom d'utilisateur admin et le mot de passe admin123 :
https://admin:[email protected]/admin/index.htm
En utilisant l'URL ci-dessus, vous pouvez authentifier l'administrateur et si l'ID et le mot de passe fournis sont corrects, l'administrateur aura accès au fichier index.htm disponible dans le répertoire admin.
Vous pouvez utiliser une URL telnet pour vous connecter à un serveur comme suit:
telnet://user:[email protected]:port/
Une autre information importante est le numéro de port du serveur Web . Par défaut, le serveur HTTP fonctionne sur le port numéro 80. Mais si vous exécutez un serveur sur un autre numéro de port, il peut être proposé comme suit, en supposant que le serveur fonctionne sur le port 8080:
https://www.tutorialspoint.com:8080/index.htm
Les identificateurs de fragment peuvent être utilisés après un nom de fichier pour indiquer une partie spécifique de la page qu'un navigateur doit consulter immédiatement. Voici un exemple pour atteindre le haut de la page html_text_links.htm.
https://www.tutorialspoint.com/html/html_text_links.htm#top
Vous pouvez transmettre certaines informations au serveur à l'aide de l'URL. Lorsque vous utilisez un formulaire sur une page Web, tel qu'un formulaire de recherche ou un formulaire de commande en ligne, le navigateur peut ajouter les informations que vous fournissez à l'URL pour transmettre les informations de votre navigateur au serveur comme suit -
https://www.tutorialspoint.com/cgi-bin/search.cgi?searchTerm=HTML
Ici, searchTerm=HTML est passé au serveur où le script search.cgi est utilisé pour analyser ces informations transmises et prendre des mesures supplémentaires.
URL absolues et relatives
Vous pouvez adresser une URL de l'une des deux manières suivantes:
Absolute - Une URL absolue est l'adresse complète d'une ressource. Par exemple http://www.tutorialspoint.com/html/html_text_links.htm
Relative - Une URL relative indique où se trouve la ressource par rapport à la page actuelle. L'URL donnée est ajoutée avec l'élément <base> pour former une URL complète. Par exemple /html/html_text_links.htm
Caractères réservés et dangereux
Les caractères réservés sont ceux qui ont une signification spécifique dans l'URL. Par exemple, le caractère barre oblique sépare les éléments d'un chemin dans une URL. Si vous devez inclure une barre oblique dans une URL qui n'est pas destinée à être un séparateur d'élément, vous devez l'encoder en tant que% 2F:
Les caractères non sécurisés sont ceux qui n'ont pas de signification particulière dans l'URL mais peuvent avoir une signification particulière dans le contexte dans lequel l'URL est écrite. Par exemple, des guillemets doubles ("") délimitent les valeurs d'attribut d'URL dans les balises. Si vous avez besoin d'inclure un guillemet double directement dans une URL, vous risquez de confondre le navigateur. Au lieu de cela, vous devez encoder le guillemet double pour éviter tout conflit éventuel.
Tu peux vérifier HTML URL Encoding tutoriel pour comprendre cet encodage, caractères réservés et non sécurisés.