L'url


Nous allons nous attacher à analyser l'url à partir de la partie www.aaa.bb/ddd.eee?fff.gg .

Les 3 premiers www ne sont pas obligatoires. Dans certains cas, vous pouvez avoir directement le nom du site (http://servicepublic.fr). A la suite du nom, qui est libre de choix, vous avez le TLD (Top Level Domain). Pour la France, les TLD sont gérés par l'AFNIC (http://www.nic.fr), qui est une association loi 1901. Au niveau international, c'est l'Internic (http://www.internic.net) qui gère cela.

Parmi les noms de domaine vous pouvez voir les suffixes suivants :

com : site à caractère commercial org : organisation internationale, gouvernementale ou non net : site lié au NTIC
gov : site gouvernemental américain edu : site d'université américaine mil : site militaire américain
fr : site français gouv : site gouvernemental français ca : site canadien
es : site espagnol de : site allemand uk : site anglais (United Kingdom)
info : site d'information (journaux en ligne) name : site personnel biz : site purement commercial


A la suite du nom de domaine, vient, suivant le cas, un nom de répertoire ou de fichier. Le répertoire est composé en général d'un seul terme quelques fois précédé d'un tilde (~) alors que le fichier est composé d'un nom et d'une extension. L'extension la plus connue est html, cependant vous pouvez dorénavant en trouver d'autres (xml, pl, asp, php). Dans ces derniers cas, elles sont suivies d'un point d'interrogation. En effet, ce ne sont pas à proprement parlé des fichiers mais des programmes qui appellent les fichiers qui suivent le ?.

ex : http://larecherche.service-public.fr/ladoc.cgi?text=pr%E9fecture - dans ce cas, vous avez un programme qui se nomme ladoc.cgi et qui prend comme paramètre 1 seul argument dont le nom est text et dont la valeur est préfecture (le é est codé).