L'url
Nous allons nous attacher à analyser l'url à partir de la partie www.aaa.bb/ddd.eee?fff.gg .
Les 3 premiers www ne sont pas obligatoires. Dans certains cas, vous pouvez avoir directement le nom du site (http://servicepublic.fr). A la suite du nom, qui est libre de choix, vous avez le TLD (Top Level Domain). Pour la France, les TLD sont gérés par l'AFNIC (http://www.nic.fr), qui est une association loi 1901. Au niveau international, c'est l'Internic (http://www.internic.net) qui gère cela.
Parmi les noms de domaine vous pouvez voir les suffixes suivants :
com : site à caractère commercial | org : organisation internationale, gouvernementale ou non | net : site lié au NTIC |
gov : site gouvernemental américain | edu : site d'université américaine | mil : site militaire américain |
fr : site français | gouv : site gouvernemental français | ca : site canadien |
es : site espagnol | de : site allemand | uk : site anglais (United Kingdom) |
info : site d'information (journaux en ligne) | name : site personnel | biz : site purement commercial |
A la suite du nom de domaine, vient, suivant le cas, un nom de répertoire
ou de fichier. Le répertoire est composé en général
d'un seul terme quelques fois précédé d'un tilde (~) alors
que le fichier est composé d'un nom et d'une extension. L'extension la
plus connue est html, cependant vous pouvez dorénavant en trouver
d'autres (xml, pl, asp, php). Dans ces derniers cas, elles sont suivies d'un
point d'interrogation. En effet, ce ne sont pas à proprement parlé
des fichiers mais des programmes qui appellent les fichiers qui suivent le ?.
ex : http://larecherche.service-public.fr/ladoc.cgi?text=pr%E9fecture - dans ce cas, vous avez un programme qui se nomme ladoc.cgi et qui prend comme paramètre 1 seul argument dont le nom est text et dont la valeur est préfecture (le é est codé).