Man page - wget(1)

Packages contains this manual

    Package:  wget
    apt-get install wget
    Manuals in package:
    Documentations in package:

Available languages:

en fr pl ro

Manual

WGET

NOM
SYNOPSIS
DESCRIPTION
OPTIONS
Syntaxe d’option
Options de base pour démarrer
Options de journalisation et de fichier d’entrĂ©e
Options de téléchargement
Options de répertoire
Options HTTP
Options HTTPS (SSL/TLS)
Options FTP
Options FTPS
Options de récupération récursive
Options accepter/rejeter de maniÚre récursive
ENVIRONNEMENT
CODE DE RETOUR
FICHIERS
BOGUES
VOIR AUSSI
AUTEUR
COPYRIGHT
TRADUCTION

NOM

Wget - L’outil de tĂ©lĂ©chargement rĂ©seau non interactif.

SYNOPSIS

wget [ option ]... [ URL ]...

DESCRIPTION

GNU Wget est un utilitaire libre pour le téléchargement non interactif de fichiers sur le Web. Il prend en charge les protocoles HTTP, HTTPS, et FTP, ainsi que le téléchargement au travers des mandataires HTTP.

Wget est non interactif, c’est-Ă -dire qu’il peut travailler en arriĂšre-plan, sans intervention de l’utilisateur. Cela permet de lancer un tĂ©lĂ©chargement et de se dĂ©connecter du systĂšme, laissant wget finir le travail. En revanche, la plupart des navigateurs Web requiĂšrent la prĂ©sence constante de l’utilisateur, ce qui est particuliĂšrement pĂ©nible lorsqu’il y a beaucoup de donnĂ©es Ă  transfĂ©rer.

wget peut suivre les liens des pages HTML et XHTML, et CSS, pour crĂ©er des copies locales de sites web distants, en rĂ©crĂ©ant complĂštement la structure du site original. Cela est parfois dĂ©signĂ© sous le nom de « tĂ©lĂ©chargement rĂ©cursif ». En faisant cela, wget respecte le standard d’exclusion de robots ( /robots.txt ). wget peut aussi ĂȘtre chargĂ© de convertir les liens dans les fichiers tĂ©lĂ©chargĂ©s pour pointer sur des fichiers locaux, pour une consultation hors-ligne.

wget a Ă©tĂ© conçu pour ĂȘtre robuste en dĂ©pit des connexions rĂ©seaux lentes ou instables ; si un tĂ©lĂ©chargement Ă©choue suite Ă  un problĂšme rĂ©seau, il rĂ©essayera jusqu’à ce que l’intĂ©gralitĂ© du fichier soit rĂ©cupĂ©rĂ©e. Si le serveur gĂšre la reprise, il lui demandera de reprendre lĂ  oĂč le tĂ©lĂ©chargement s’est interrompu.

OPTIONS

Syntaxe d’option

Comme wget utilise GNU getopt pour traiter les arguments de la ligne de commande, chaque option a une forme longue en plus de la forme courte. Les options longues sont plus pratiques Ă  retenir, mais prennent du temps Ă  taper. Vous ĂȘtes libre de mĂ©langer diffĂ©rentes formes d’options, ou d’indiquer les options aprĂšs les arguments de la ligne de commande. Ainsi, vous pouvez Ă©crire :

wget -r --tries=10 http://fly.srk.fer.hr/ -o log

L’espace entre l’option acceptant un argument et l’argument peut ĂȘtre omise. Vous pouvez Ă©crire -olog au lieu de -o log .

Vous pouvez mettre ensemble plusieurs options ne nĂ©cessitant pas d’arguments, comme :

wget -drc <URL>

Cela est absolument équivalent à :

wget -d -r -c <URL>

Comme les options peuvent ĂȘtre indiquĂ©es aprĂšs les arguments, vous pouvez les terminer avec -- . Ainsi, ce qui suit va essayer de tĂ©lĂ©charger URL -x , en signalant l’échec Ă  log :

wget -o log -- -x

Les options qui acceptent des listes sĂ©parĂ©es par des virgules respectent toutes la convention selon laquelle spĂ©cifier une liste vide efface sa valeur. Cela peut ĂȘtre utile pour nettoyer les rĂ©glages de .wgetrc . Par exemple, si .wgetrc indique "exclude_directories" Ă  /cgi-bin , l’exemple suivant le rĂ©initialisera d’abord, puis lui indiquera d’exclure /˜nobody et /˜somebody . Vous pouvez aussi effacer les listes dans .wgetrc .

wget -X "" -X /˜nobody,/˜somebody

La majoritĂ© des options qui n’acceptent pas d’arguments sont des options de type boolĂ©en , ainsi nommĂ©es car leur Ă©tat peut ĂȘtre capturĂ© avec une variable oui-ou-non (« boolĂ©enne »). Par exemple, --follow-ftp indique Ă  wget de suivre les liens FTP de fichiers HTML et, d’un autre cotĂ©, --no-glob lui dit de ne pas effectuer le « globbing » de fichiers sur les URL FTP. Une option boolĂ©enne peut ĂȘtre affirmative ou nĂ©gative (commençant par --no ). Toutes ces options partagent plusieurs propriĂ©tĂ©s.

Sauf indication contraire, il est supposĂ© que le comportement par dĂ©faut soit l’opposĂ© de ce que l’option rĂ©alise. Par exemple, l’existence documentĂ©e de --follow-ftp suppose que le comportement par dĂ©faut est de ne pas suivre les liens FTP des pages HTML.

Les options affirmatives peuvent ĂȘtre niĂ©es en antĂ©posant le --no au nom de l’option ; les options nĂ©gatives peuvent ĂȘtre niĂ©es en ommettant le prĂ©fixe --no . Cela peut sembler superflu : si le comportement par dĂ©faut d’une option affirmative est de ne pas faire quelque chose, alors pourquoi lui fournir un moyen pour ne pas le faire ? Mais le fichier de dĂ©marrage peut en fait changer le comportement par dĂ©faut. Par exemple, l’utilisation de "follow_ftp = on" dans .wgetrc fait suivre les liens FTP Ă  wget par dĂ©faut, et l’utilisation de --no-follow-ftp est la seule maniĂšre de restaurer le comportement par dĂ©faut d’origine depuis la ligne de commande.

Options de base pour démarrer

-V

--version

Afficher la version de wget .

-h

--help

Afficher un message d’aide dĂ©crivant toutes les options en ligne de commande de wget .

-b

--background

Passer en arriĂšre-plan aussitĂŽt aprĂšs le dĂ©marrage. Si aucun fichier de sortie n’est indiquĂ© avec -o , la sortie est redirigĂ©e dans wget-log .

-e commande
--execute
commande

ExĂ©cuter la commande comme faisant partie de .wgetrc . Une commande invoquĂ©e ainsi sera exĂ©cutĂ©e aprĂšs les commandes dans .wgetrc , par consĂ©quent prĂ©valant sur elles. Si vous avez besoin d’indiquer plus d’une commande dans wgetrc, utilisez plusieurs instances de -e .

Options de journalisation et de fichier d’entrĂ©e

-o fichier_journal
--output-file=
fichier_journal

Enregistrer tous les messages dans fichier_journal . Les messages sont habituellement affichĂ©s sur la sortie d’erreur standard.

-a fichier_journal
--append-output=
fichier_journal

Ajouter dans fichier_journal . Cela est Ă©quivalent Ă  -o , mais ajoute au fichier_journal au lieu d’écraser l’ancien fichier fichier_journal . Si fichier_journal n’existe pas, un nouveau fichier est créé.

-d

--debug

Activer la sortie de dĂ©bogage, c’est-Ă -dire des informations importantes pour les dĂ©veloppeurs de wget si quelque chose ne fonctionne pas correctement. Votre administrateur systĂšme peut avoir choisi de compiler wget sans l’option de dĂ©bogage, dans ce cas -d ne fonctionnera pas. Remarquez que compiler avec l’option de dĂ©bogage est toujours sĂ»r, wget compilĂ© sans la prise en charge du dĂ©bogage n’affichera pas d’informations de dĂ©bogage, Ă  moins de le demander avec -d .

-q

--quiet

Désactiver la sortie de wget .

-v

--verbose

Activer le mode verbeux, avec toutes les données disponibles. Ce mode est activé par défaut.

-nv

--no-verbose

DĂ©sactiver le mode verbeux sans ĂȘtre totalement silencieux (utilisez -q pour cela), signifiant que les messages d’erreur et les informations de base seront encore affichĂ©s.

--report-speed= type

Bande passante de sortie comme type . La seule valeur acceptée est bits .

-i fichier
--input-file=
fichier

Lire les URL depuis un fichier local ou externe. Si - est indiquĂ© comme fichier , les URL sont lues depuis l’entrĂ©e standard. (Utilisez ./- pour lire Ă  partir d’un fichier nommĂ© - ).

Si cette fonction est utilisĂ©e, aucune URL n’a besoin d’ĂȘtre prĂ©sente sur la ligne de commande. S’il y a des URL Ă  la fois sur la ligne de commande et dans le fichier d’entrĂ©e, celles sur la ligne de commande seront les premiĂšres Ă  ĂȘtre extraites. Si --force-html n’est pas indiquĂ©, alors le fichier devrait consister en une suite d’URL, une par ligne.

Cependant, si vous indiquez --force-html , le document sera considéré comme html . Dans ce cas, vous pourriez avoir des problÚmes avec les liens relatifs, que vous pouvez résoudre en ajoutant « <base href= url > » aux documents ou en indiquant --base= url sur la ligne de commande.

Si le fichier est externe, le document sera automatiquement traitĂ© comme du html si le type de contenu correspond Ă  text/html . Par ailleurs, l’emplacement du fichier sera implicitement utilisĂ© comme href de base si aucun n’est indiquĂ©.

Si le fichier est un fichier local, sur les systĂšmes qui prennent en charge cela, il sera ouvert avec le drapeau "O_NONBLOCK" pour permettre des lectures non bloquantes du fichier. wget tentera de continuer Ă  lire le fichier jusqu’à ce que la fin de ficher soit atteinte (EOF) ou qu’il soit fermĂ©. Cela permet de transfĂ©rer une liste de fichiers Ă  rĂ©cupĂ©rer, la liste Ă  rĂ©cupĂ©rer Ă©tant gĂ©nĂ©rĂ©e dynamiquement pendant l’exĂ©cution du processus. Actuellement, cette fonction n’est pas disponible sur les plateformes Windows.

--input-metalink= fichier

Télécharger les fichiers couverts par le fichier Metalink local. Metalink versions 3 et 4 sont pris en charge.

--keep-badhash

Garder les fichiers Metalink téléchargés avec un mauvais hachage. Cela ajoute .badhash aux noms de fichiers Metalink qui sont incohérents avec la somme de contrÎle, sans écraser les fichiers existants.

--metalink-over-http

Émettre une requĂȘte HTTP HEAD au lieu de GET et extraire les mĂ©tadonnĂ©es Metalink des en-tĂȘtes de rĂ©ponse. Ensuite, il passe au tĂ©lĂ©chargement de Metalink. Si aucune mĂ©tadonnĂ©e Metalink n’est trouvĂ©e, il revient au tĂ©lĂ©chargement ordinaire HTTP. Cela permet le tĂ©lĂ©chargement et le traitement des fichiers Content-Type: application/metalink4+xml .

--metalink-index= numéro

DĂ©finir le NUMÉRO ordinal de la mĂ©ta-url application/metalink4+xml de Metalink. De 1 au nombre total de « application/metalink4+xml » disponibles. SpĂ©cifier 0 ou inf pour choisir la premiĂšre qui est bonne. Les mĂ©ta-url, telles que celles d’un --metalink-over-http , peuvent avoir Ă©tĂ© triĂ©es par une valeur de clĂ© de priorité ; gardez cela Ă  l’esprit pour choisir le bon NUMÉRO.

--preferred-location

DĂ©finir l’emplacement prĂ©fĂ©rĂ© pour les ressources Metalink. Cela est utile si plusieurs ressources ayant la mĂȘme prioritĂ© sont disponibles.

--xattr

Activer l’utilisation des attributs Ă©tendus du systĂšme de fichiers pour sauvegarder la valeur l’URL d’origine et la valeur de l’en-tĂȘte Referer HTTP si elle est utilisĂ©e.

Gardez Ă  l’esprit que les URL pourraient contenir des informations privĂ©es telles que des jetons d’accĂšs ou des identifiants.

-F

--force-html

Lorsque l’entrĂ©e lue est un fichier, le forcer Ă  ĂȘtre traitĂ© comme un fichier HTML. Cela vous permet de retrouver des liens relatifs de fichiers HTML sur votre disque local, en ajoutant "<base href=" url ">" Ă  HTML ou en utilisant l’option de la ligne de commande --base .

-B URL
--base=
URL

RĂ©soudre les liens relatifs en utilisant URL comme point de rĂ©fĂ©rence, lors de la lecture de liens d’un fichier HTML spĂ©cifiĂ© Ă  l’aide de l’option -i / --input-file (conjointement avec --force-html , ou lorsque le fichier d’entrĂ©e a Ă©tĂ© rĂ©cupĂ©rĂ© Ă  distance depuis un serveur le dĂ©crivant comme HTML). Cela est Ă©quivalent Ă  la prĂ©sence d’un drapeau "BASE" dans le fichier en entrĂ©e, avec URL comme valeur de l’attribut "href".

Par exemple, si vous indiquez http://machin/truc/a.html pour URL , et que wget lit ../bidule/b.html sur le fichier d’entrĂ©e, il sera rĂ©solu en http://machin/bidule/b.html .

--config= FILE

Indiquer l’emplacement du fichier d’initialisation que vous voulez utiliser Ă  la place de celui ou ceux par dĂ©faut. Utiliser --no-config pour dĂ©sactiver la lecture des fichiers de configuration. Si Ă  la fois --config et --no-config sont donnĂ©s, --no-config est ignorĂ©.

--rejected-log= fichier_journal

Enregistrer tous les rejets d’URL dans fichier_journal avec des valeurs sĂ©parĂ©es par des virgules. Les valeurs incluent la raison du rejet, l’URL et l’URL parent dans lequel il a Ă©tĂ© trouvĂ©.

Options de téléchargement

--bind-address= ADDRESS

Lors des connexions TCP/IP client, l’attacher Ă  ADDRESS sur la machine locale. ADDRESS peut ĂȘtre indiquĂ©e comme un nom d’hĂŽte ou une adresse 1IP. Cette option peut ĂȘtre utile si votre machine est attachĂ©e Ă  plusieurs IP.

--bind-dns-address= ADDRESS

[seulement avec libcares] Cette adresse surcharge la route pour les requĂȘtes DNS. Si vous avez besoin de contourner les rĂ©glages standard de /etc/resolv.conf , cette option avec --dns-servers est votre amie. ADDRESS doit ĂȘtre spĂ©cifiĂ©e comme une adresse soit IPV4, soit IPV6. wget doit ĂȘtre construit avec libcares pour que cette option soit disponible.

--dns-servers= ADDRESSES

[seulement avec libcares] Les adresses donnĂ©es Ă©crasent les adresses du serveur de noms standard, par exemple comme configurĂ© dans /etc/resolv.conf . Les ADDRESSES doivent ĂȘtre spĂ©cifiĂ©es en adresses IPV4 ou IPV6 sĂ©parĂ©es par des virgules. wget a besoin d’ĂȘtre construit avec libcares pour que cette option soit disponible.

-t nombre
--tries=
nombre

DĂ©finir le nombre d’essais Ă  nombre . SpĂ©cifier 0 ou inf pour rĂ©essayer indĂ©finiment. Par dĂ©faut, la commande rĂ©essaie 20 fois, Ă  l’exception des erreurs fatales comme connection refused ou not found (404), qui ne sont pas rĂ©essayĂ©es.

-O fichier
--output-document=
fichier

Les documents ne seront pas écrits dans les fichiers appropriés, mais seront tous concaténés et écrits dans fichier . Si - est utilisé comme fichier , les documents seront écrits sur la sortie standard, désactivant la conversion de liens. (Utilisez ./- pour écrire dans un fichier littéralement appelé - .)

L’utilisation de -O ne signifie pas simplement « utiliser le nom fichier au lieu de celui dans l’URL » ; Cela est similaire Ă  une redirection d’interprĂ©teur : wget -O fichier http://truc est destinĂ© Ă  fonctionner comme wget -O - http://truc > fichier ; fichier sera tronquĂ© immĂ©diatement, et tout le contenu tĂ©lĂ©chargĂ© sera Ă©crit lĂ .

Pour cette raison, -N (pour le contrĂŽle d’horodatage) n’est pas pris en charge en combinaison avec -O : dans la mesure oĂč fichier est tout le temps nouvellement créé, il aura toujours un horodatage trĂšs rĂ©cent. Un avertissement sera affichĂ© si la combinaison des deux est utilisĂ©e.

De mĂȘme, l’utilisation de -r ou -p avec -O peut ne pas fonctionner comme vous voudriez : wget ne tĂ©lĂ©chargera pas seulement le premier fichier dans fichier et ensuite le reste dans leurs noms courants : tout le contenu tĂ©lĂ©chargĂ© sera placĂ© dans fichier . Cela a Ă©tĂ© dĂ©sactivĂ© dans la version 1.11, mais a Ă©tĂ© rĂ©implantĂ© (avec un avertissement) dans la version 1.11.2, puisqu’il y a des cas oĂč ce fonctionnement peut avoir une certaine utilitĂ©.

Une combinaison avec -nc n’est acceptĂ©e que si le fichier donnĂ© en sortie n’existe pas.

Remarquez qu’une combinaison avec -k n’est permise que lors du tĂ©lĂ©chargement d’un seul document, car dans ce cas il convertira seulement toutes les URl relatives en URL externes ; -k n’a pas de sens pour des URl multiples lorsqu’elles sont toutes tĂ©lĂ©chargĂ©es dans un seul fichier ; -k ne peut ĂȘtre utilisĂ© que lorsque la sortie est un fichier normal.

-nc

--no-clobber

Si un fichier est tĂ©lĂ©chargĂ© plus d’une fois dans le mĂȘme rĂ©pertoire, le comportement de wget dĂ©pend de quelques options, incluant -nc . Dans certains cas, le fichier local sera corrompu ou Ă©crasĂ© aprĂšs un tĂ©lĂ©chargement rĂ©pĂ©tĂ©. Dans d’autres cas, il sera prĂ©servĂ©.

Lorsque wget est lancĂ© sans -N , -nc , -r ou -p , le tĂ©lĂ©chargement du mĂȘme fichier dans le mĂȘme rĂ©pertoire prĂ©servera la copie d’origine de fichier et la seconde copie sera nommĂ©e fichier .1 . Si ce fichier est Ă  nouveau tĂ©lĂ©chargĂ©, la troisiĂšme copie sera nommĂ©e fichier .2 , et ainsi de suite. (Cela est aussi le comportement avec -nd , mĂȘme si -r ou -p sont effectifs.) Lorsque -nc est spĂ©cifiĂ©, ce comportement est supprimĂ©, et wget refusera de tĂ©lĂ©charger de nouvelles copies de fichier . Par consĂ©quent, « no-clobber » est en fait un terme mal choisi dans ce mode -- ce n’est pas la corruption qui est empĂȘchĂ©e (comme les suffixes numĂ©riques empĂȘchent dĂ©jĂ  la corruption), mais plutĂŽt l’enregistrement de plusieurs versions qui est empĂȘchĂ©.

Lorsque wget est lancĂ© avec -r ou -p , mais sans -N , -nd ou -nc , tĂ©lĂ©charger Ă  nouveau un fichier rĂ©sultera en ce que la nouvelle copie Ă©crasera simplement la prĂ©cĂ©dente. Ajouter -nc empĂȘchera ce comportement, provoquant plutĂŽt la prĂ©servation de la version originale et faisant que les copies plus rĂ©centes sur le serveur seront ignorĂ©es.

Lors du lancement de wget avec -N , avec ou sans -r ou -p , la dĂ©cision de tĂ©lĂ©charger ou non une copie plus rĂ©cente d’un fichier dĂ©pend de l’horodatage local et distant et de la taille du fichier. -nc peut ne pas ĂȘtre spĂ©cifiĂ© au mĂȘme moment que -N .

Une combinaison avec -O / --output-document n’est acceptĂ©e que si le fichier donnĂ© en sortie n’existe pas.

Notez que lorsque -nc est spĂ©cifiĂ©, les fichiers avec les suffixes .html ou .htm seront chargĂ©s depuis le disque local et analysĂ©s comme s’ils avaient Ă©tĂ© rĂ©cupĂ©rĂ©s sur le Web.

--backups= sauvegardes

Avant d’écrire ou d’écraser un fichier, faire une sauvegarde du fichier existant en ajoutant un suffixe .1 ( _1 sur VMS) au nom de fichier. De tels fichiers de sauvegarde sont numĂ©rotĂ©s .2 , .3 , et ainsi de suite, jusqu’à sauvegardes (en perdant ce qui vient aprĂšs).

--no-netrc

Ne pas essayer d’obtenir des identifiants du fichier .netrc . Par dĂ©faut les identifiants sont recherchĂ©s dans le fichier .netrc dans le cas oĂč aucun n’ait Ă©tĂ© passĂ© sur la ligne de commande et qu’une authentification serait nĂ©cessaire.

-c

--continue

Continuer Ă  rĂ©cupĂ©rer un fichier partiellement tĂ©lĂ©chargĂ©. Cela est utile lorsque vous voulez finir un tĂ©lĂ©chargement commencĂ© lors d’une prĂ©cĂ©dente instance de wget , ou par un autre programme. Par exemple :

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z

S’il y a un fichier nommĂ© ls-lR.Z dans le rĂ©pertoire actuel, wget supposera qu’il s’agit de la premiĂšre partie du fichier distant, et demandera au serveur de poursuivre la rĂ©cupĂ©ration Ă  partir d’un dĂ©calage Ă©gal Ă  la longueur du fichier local.

Remarquez que vous n’avez pas besoin d’indiquer cette option si vous voulez simplement que l’invocation actuelle de wget rĂ©essaie de tĂ©lĂ©charger un fichier si la connexion est perdue en cours de route. C’est le comportement par dĂ©faut. -c n’affecte que la reprise des tĂ©lĂ©chargements commencĂ©s avant cette invocation de wget , et dont les fichiers locaux sont toujours en attente.

Sans -c , l’exemple prĂ©cĂ©dent devrait juste tĂ©lĂ©charger le fichier distant dans ls-lR.Z.1 , laissant seul le fichier tronquĂ© ls-lR.Z .

Si vous utilisez -c sur un fichier non vide, et que le serveur ne prend pas en charge la reprise du téléchargement, wget relancera le téléchargement depuis le début et écrasera entiÚrement le fichier existant.

À partir de Wget 1.7, si vous utilisez -c sur un fichier ayant une taille Ă©gale Ă  celui sur le serveur, wget refusera de tĂ©lĂ©charger le fichier et affichera un message explicatif. La mĂȘme chose arrive lorsque le fichier est plus petit sur le serveur que celui en local (probablement parce qu’il a Ă©tĂ© modifiĂ© sur le serveur depuis votre derniĂšre tentative de tĂ©lĂ©chargement) -- parce que « continuing » n’est pas assez explicite, aucun tĂ©lĂ©chargement n’est lancĂ©.

D’un autre cotĂ©, en utilisant -c , tout fichier qui est plus gros sur le serveur qu’en local sera considĂ©rĂ© comme un tĂ©lĂ©chargement incomplet et seulement (longueur(distante) - longueur(locale)) octets seront tĂ©lĂ©chargĂ©s et ajoutĂ©s Ă  la fin du fichier local. Ce comportement est apprĂ©ciable dans quelques cas. Par exemple, vous pouvez utiliser wget -c pour tĂ©lĂ©charger uniquement la nouvelle partie qui a Ă©tĂ© ajoutĂ©e Ă  une collection de donnĂ©es ou Ă  un fichier journal.

En tout cas, si le fichier est plus gros sur le serveur parce qu’il a Ă©tĂ© modifiĂ© , contrairement Ă  juste ajoutĂ© , vous vous retrouverez avec un fichier brouillĂ©. wget n’a pas la possibilitĂ© de vĂ©rifier que le fichier local est rĂ©ellement un dĂ©but valable du fichier distant. Vous devez ĂȘtre particuliĂšrement attentif Ă  cela lors de l’utilisation de -c en combinaison avec -r , vu que tout fichier sera considĂ©rĂ© comme un « tĂ©lĂ©chargement incomplet » potentiel.

Un autre cas oĂč vous obtiendrez un fichier brouillĂ© si vous essayez d’utiliser -c , est celui oĂč vous avez un mandataire HTTP bancal qui insĂšre une chaĂźne « transfer interrupted » dans le fichier local. Dans le futur, une option « rollback » (retour Ă  l’état prĂ©cĂ©dent) devrait ĂȘtre ajoutĂ©e pour gĂ©rer ce cas de figure.

Prenez en compte que -c ne fonctionne qu’avec les serveurs FTP et les serveurs HTTP qui prennent en charge l’en-tĂȘte "Range".

--start-pos= OFFSET

Commencer le tĂ©lĂ©chargement Ă  la position d’ OFFSET par rapport Ă  zĂ©ro. Le dĂ©calage doit ĂȘtre exprimĂ© en octets, kilooctets avec le suffixe k ou mĂ©gaoctets avec le suffixe m , etc.

--start-pos a la priorité sur --continue . Lorsque --start-pos et --continue sont toute deux indiquées, wget émettra un avertissement et procÚdera comme si --continue était absent.

La prise en charge du serveur pour la poursuite du téléchargement est nécessaire, sinon --start-pos ne pourra pas aider. Voir -c pour les détails.

--progress= type

SĂ©lectionnez le type d’indicateur de progression que vous dĂ©sirez utiliser. Les indicateurs classiques sont « dot » et « bar ».

L’indicateur « bar » est utilisĂ© par dĂ©faut. Il dessine un graphique de barre de progression ASCII (comme un affichage « thermomĂštre ») indiquant l’état de la rĂ©cupĂ©ration. Si la sortie n’est pas une console TTY, la barre « dot » sera utilisĂ©e par dĂ©faut.

Utilisez --progress=dot pour passer Ă  l’affichage « dot » (pointillĂ©s). Il retrace la rĂ©cupĂ©ration en affichant des points sur l’écran, chaque point reprĂ©sentant une quantitĂ© fixe de donnĂ©es tĂ©lĂ©chargĂ©es.

Le type de progression peut aussi prendre un ou plusieurs paramÚtres. Les paramÚtres varient suivant le type sélectionné. Les paramÚtres sont passés au type en les ajoutant au type, séparés par un deux-points ( : ) comme ceci : --progress= type : paramÚtre1 : paramÚtre2 .

Lorsque vous utilisez la reprĂ©sentation de la rĂ©cupĂ©ration par points, vous pouvez dĂ©finir le style en spĂ©cifiant le type comme dot: style . Les diffĂ©rents styles assignent diffĂ©rents rĂŽles Ă  un point. Avec le style « default » chaque point reprĂ©sente 1Ko, il y a dix points par grappe et 50 points sur une ligne. Le style « binary » a plus une orientation du genre « ordinateur » : points de 8Ko, 16 points par grappe et 48 points par ligne (ce qui fait des lignes de 384Ko). Le style « mega » est adaptĂ© au tĂ©lĂ©chargement de gros fichiers : chaque point reprĂ©sentant 64Ko de rĂ©cupĂ©ration, il y a huit points dans une grappe, et 48 points sur chaque ligne (chaque ligne contenant 3Mo). Si « mega » n’est pas suffisant, alors vous pouvez utiliser le style « giga » -- chaque point reprĂ©sente 1 Mo rĂ©cupĂ©rĂ©s, il y a huit points par grappe, et 32 points par ligne (donc chaque ligne contient 32Mo).

Avec --progress=bar , il y a actuellement deux paramĂštres possibles, force et noscroll .

Lorsque la sortie n’est pas une console TTY, la barre de progression retombe toujours sur « dot », mĂȘme si --progress=bar a Ă©tĂ© passĂ© Ă  wget lors de l’invocation. Ce comportement peut ĂȘtre outrepassĂ© et la sortie « bar » forcĂ©e avec le paramĂštre « force » comme --progress=bar:force .

Par dĂ©faut, la barre de progression du style bar fait dĂ©filer le nom du fichier de gauche Ă  droite pour le fichier en cours de tĂ©lĂ©chargement si le nom du fichier dĂ©passe la longueur maximale allouĂ©e Ă  son affichage. Dans certains cas, comme avec --progress=bar:force , il peut ne pas y avoir de dĂ©filement du nom de fichier dans la barre de progression. En passant le paramĂštre « noscroll », wget peut ĂȘtre forcĂ© Ă  afficher la plus grande partie possible du nom de fichier sans le faire dĂ©filer.

Remarquez que vous pouvez indiquer le style par dĂ©faut en utilisant la commande "progress" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande. Par exemple, pour forcer la barre de sortie Ă  ne pas dĂ©filer, utilisez --progress=bar:force:noscroll .

--show-progress

Forcer wget à afficher la barre de progression quelque soit le niveau de détail.

Par dĂ©faut, wget affiche seulement la barre de progression en mode dĂ©taillĂ©. Il est possible de vouloir que wget affiche la barre de progression en accord avec un autre mode de dĂ©tail comme --no-verbose ou --quiet . Cela peut ĂȘtre dĂ©sirable lors de l’invocation de wget pour tĂ©lĂ©charger plusieurs petits et/ou grands fichiers. Dans un tel cas, wget pourrait simplement ĂȘtre invoquĂ© avec ce paramĂštre pour avoir une sortie plus propre sur l’écran.

Cette option forcera Ă©galement la barre de progression Ă  ĂȘtre affichĂ©e dans stderr lorsqu’elle est utilisĂ©e avec l’option --output-file .

-N

--timestamping

Activer l’horodatage.

--no-if-modified-since

Ne pas envoyer d’en-tĂȘte If-Modified-Since en mode -N . Envoyer d’abord une rĂ©ponse HEAD Ă  la place. Cela n’est effectif qu’en mode -N .

--no-use-server-timestamps

Ne pas rĂ©gler l’horodatage du fichier local sur celui du serveur.

Par dĂ©faut, lorsqu’un fichier est tĂ©lĂ©chargĂ©, son horodatage est rĂ©glĂ© pour correspondre Ă  celui du fichier distant. Cela permet l’utilisation de --timestamping sur les invocations suivantes de wget . Cependant, il est parfois nĂ©cessaire de baser l’horodatage du fichier local sur celui de son tĂ©lĂ©chargement ; l’option --no-use-server-timestamps a Ă©tĂ© fournie dans ce but.

-S

--server-response

Afficher les en-tĂȘtes envoyĂ©s par les serveurs HTTP et les rĂ©ponses envoyĂ©es par les serveurs FTP.

--spider

Lorsqu’il est invoquĂ© avec cette option, wget se comportera comme un robot d’indexation, il ne tĂ©lĂ©chargera pas les pages, il vĂ©rifiera simplement leur prĂ©sence. Par exemple, vous pouvez utiliser wget pour vĂ©rifier vos marque-pages :

wget --spider --force-html -i marque-pages.html

Cette caractĂ©ristique nĂ©cessite encore quelques travaux pour se rapprocher des fonctionnalitĂ©s de vĂ©ritables robots d’indexation.

-T secondes
--timeout=
secondes

DĂ©finir le dĂ©lai d’attente du rĂ©seau Ă  secondes . Cela est Ă©quivalent Ă  spĂ©cifier --dns-timeout , --connect-timeout et --read-timeout , tous en mĂȘme temps.

Lorsqu’il interagit avec le rĂ©seau, wget peut vĂ©rifier le dĂ©lai d’attente et annuler l’opĂ©ration si cela dure trop. Cela permet d’éviter les anomalies telles que les lectures suspendues et les connexions infinies. Le seul dĂ©lai d’attente activĂ© par dĂ©faut est un dĂ©lai d’attente de lecture de 900 secondes (15 min). DĂ©finir un dĂ©lai d’attente Ă  0 dĂ©sactive l’ensemble. À moins de savoir ce que vous faites, il vaut mieux ne pas changer les rĂ©glages du dĂ©lai d’attente par dĂ©faut.

Toutes les options liĂ©es au dĂ©lai d’attente acceptent les valeurs dĂ©cimales, ainsi que les valeurs en dixiĂšme de seconde. Par exemple, 0.1 seconde est un choix classique (bien que peu judicieux) du dĂ©lai d’attente. Les temps d’attente en dixiĂšmes de seconde sont utiles pour la vĂ©rification des temps de rĂ©ponse du serveur ou pour tester la latence du rĂ©seau.

--dns-timeout= secondes

DĂ©finir le dĂ©lai de consultation de DNS Ă  secondes . Les recherches DNS qui ne sont pas terminĂ©es dans le dĂ©lai spĂ©cifiĂ© Ă©chouent. Par dĂ©faut, il n’y a pas de dĂ©lai sur les recherches DNS autre que celui implĂ©mentĂ© par les bibliothĂšques du systĂšme.

--connect-timeout= secondes

DĂ©finir le dĂ©lai de connexion Ă  secondes . Les connexions TCP qui mettent trop longtemps Ă  s’établir seront annulĂ©es. Il n’y a pas de dĂ©lai de connexion par dĂ©faut, autre que celui qui est implĂ©mentĂ© par les bibliothĂšques du systĂšme.

--read-timeout= secondes

DĂ©finir le dĂ©lai de lecture (et d’écriture) Ă  secondes . Le « temps » de ce dĂ©lai correspond Ă  idle time : si, Ă  quelque moment du tĂ©lĂ©chargement, aucune donnĂ©e n’est reçue durant plus que le nombre spĂ©cifiĂ© de secondes, la lecture Ă©choue et le tĂ©lĂ©chargement est recommencĂ©. Cette option n’influe pas directement sur la durĂ©e totale du tĂ©lĂ©chargement.

Bien sûr, le serveur distant peut choisir de terminer la connexion plus tÎt que requis par cette option. Le délai de lecture est de 900 secondes (15 min) par défaut.

--limit-rate= quantité

Limiter la vitesse de tĂ©lĂ©chargement Ă  quantitĂ© octets par seconde. Cette quantitĂ© doit ĂȘtre exprimĂ©e en octets, kilooctets (avec le suffixe k ), ou mĂ©gaoctets (avec le suffixe m ). Par exemple, --limit-rate=20K limitera le dĂ©bit de rĂ©cupĂ©ration Ă  20 ko/s. Cela est utile lorsque, pour une raison quelconque, vous ne voulez pas que wget consomme toute la bande passante disponible.

Cette option autorise l’usage de nombres dĂ©cimaux, habituellement en conjonction avec des suffixes de puissance ; par exemple, --limit-rate=2.5k est une valeur classique.

Remarquez que wget implĂ©mente la limitation en dormant pendant la durĂ©e appropriĂ©e aprĂšs une rĂ©ception depuis le rĂ©seau qui a pris moins de temps que spĂ©cifiĂ© par le dĂ©bit. Éventuellement cela peut causer le ralentissement du transfert TCP jusqu’à approximativement le dĂ©bit spĂ©cifiĂ©. Cependant, il se peut que cela prenne un peu de temps avant de se stabiliser ; ne soyez pas surpris si cette limite n’est pas vraiment respectĂ©e lors du transfert de trĂšs petits fichiers.

-w secondes
--wait=
secondes

Attendre le nombre de secondes spĂ©cifiĂ© entre deux rĂ©cupĂ©rations. L’utilisation de cette option est encouragĂ©e, car elle allĂšge le travail du serveur en diminuant la frĂ©quence des requĂȘtes. Au lieu de secondes, le temps peut ĂȘtre indiquĂ© en minutes en utilisant le suffixe "m", en heures avec le suffixe "h", ou en jours avec le suffixe "d".

L’indication d’une grande valeur pour cette option est pratique si le rĂ©seau ou l’hĂŽte de destination est Ă©teint, ainsi wget peut attendre assez longtemps pour raisonnablement espĂ©rer que l’erreur rĂ©seau soit rĂ©parĂ©e d’ici le prochain essai. L’intervalle de temps d’attente indiquĂ© par cette fonction est influencĂ© par "--random-wait" qui surveille.

--waitretry= secondes

Si vous ne voulez pas que wget attende entre chaque rĂ©cupĂ©ration, mais seulement entre les nouvelles tentatives suite Ă  des Ă©checs de tĂ©lĂ©chargement, vous pouvez utiliser cette option. wget utilisera linear backoff , en attendant une seconde aprĂšs le premier Ă©chec sur un fichier donnĂ©, puis deux secondes aprĂšs le second Ă©chec sur ce fichier, jusqu’au nombre maximal de secondes indiquĂ©.

Par défaut, wget prendra une valeur de dix secondes.

--random-wait

Certains sites web peuvent effectuer une analyse des journaux pour identifier les programmes d’extraction tels que wget en recherchant des similitudes statistiquement significatives dans le dĂ©lai entre les requĂȘtes. Cette option fait varier entre 0,5 et 1,5 * secondes d’attente , oĂč secondes d’attente est indiquĂ©e par l’usage de l’option --wait , pour masquer la prĂ©sence de wget Ă  partir de ce type d’analyse.

Un article est paru en 2001 dans une publication consacrĂ©e au dĂ©veloppement sur une plate-forme populaire grand public qui fournissait un code permettant d’effectuer cette analyse Ă  la volĂ©e. Son auteur a suggĂ©rĂ© un blocage au niveau des adresses de classe C pour s’assurer que les programmes d’extraction automatique soient bloquĂ©s malgrĂ© le changement des adresses fournies par le DHCP.

L’option --random-wait a Ă©tĂ© inspirĂ©e par cette recommandation peu judicieuse qui consiste Ă  bloquer l’accĂšs Ă  un site web Ă  de nombreux utilisateurs non concernĂ©s en raison des actions d’un seul.

--no-proxy

Ne pas utiliser de mandataire, mĂȘme si la variable d’environnement appropriĂ©e *_proxy est dĂ©finie.

-Q quota
--quota=
quota

Indiquer le quota de tĂ©lĂ©chargement pour l’extraction automatique. Cette valeur peut ĂȘtre indiquĂ©e en octets (par dĂ©faut), kilooctets (avec le suffixe k ) ou mĂ©gaoctets (avec le suffixe m ).

Remarquez que le quota n’affectera jamais le tĂ©lĂ©chargement d’un seul fichier. Donc si vous indiquez wget -Q10k https://example.com/ls-lR.gz , tout le fichier ls-lR.gz sera tĂ©lĂ©chargĂ©. C’est la mĂȘme chose lorsque plusieurs URL sont indiquĂ©es sur la ligne de commande. Le quota n’est seulement vĂ©rifiĂ© qu’à la fin de chaque fichier tĂ©lĂ©chargĂ©, donc il ne provoquera jamais le tĂ©lĂ©chargement partiel d’un fichier. Ainsi vous pouvez tranquillement taper wget -Q2m -i sites , le tĂ©lĂ©chargement s’arrĂȘtera aprĂšs que le fichier qui dĂ©passe le quota a Ă©tĂ© complĂštement tĂ©lĂ©chargĂ©.

Définir le quota à 0 ou à inf retire la limite du quota de téléchargement.

--no-dns-cache

DĂ©sactiver la mise en cache des recherches de DNS. Normalement, wget se souvient des adresses IP qu’il a recherchĂ© auprĂšs de DNS afin de ne pas avoir Ă  contacter de maniĂšre rĂ©pĂ©tĂ©e le serveur DNS pour le mĂȘme (gĂ©nĂ©ralement petit) ensemble d’hĂŽtes qu’il rĂ©cupĂšre. Ce cache n’existe qu’en mĂ©moire ; un nouveau lancement de wget recontactera encore le DNS.

Cela dit, il a Ă©tĂ© rapportĂ© que dans quelques situations, il n’est pas dĂ©sirable de mettre en cache les noms d’hĂŽtes, mĂȘme pour la durĂ©e d’une application brĂšve et rapide comme wget . Avec cette option, wget effectue une nouvelle recherche DNS (plus prĂ©cisĂ©ment, un nouvel appel Ă  "gethostbyname" ou "getaddrinfo") Ă  chaque nouvelle connexion. Veuillez prendre en compte que cette option n’affectera pas la mise en cache qui pourrait ĂȘtre effectuĂ©e par la bibliothĂšque de rĂ©solution ou par une couche de mise en cache externe, telle que NSCD.

Si vous ne comprenez pas exactement ce que fait cette option, vous n’en avez probablement pas besoin.

--restrict-file-names= modes

Modifier les caractĂšres trouvĂ©s dans les URL distants qui doivent ĂȘtre protĂ©gĂ©s lors de la gĂ©nĂ©ration des noms de fichiers locaux. Les caractĂšres qui sont restreints par cette option sont protĂ©gĂ©s, c’est Ă  dire remplacĂ©s par %HH , oĂč HH est le nombre hexadĂ©cimal qui correspond au caractĂšre restreint. Cette option peut aussi ĂȘtre utilisĂ©e pour forcer les caractĂšres alphabĂ©tiques Ă  ĂȘtre soit en minuscules, soit en capitales.

Par dĂ©faut, wget protĂšge les caractĂšres qui ne sont pas valables ou sĂ»rs dans les noms de fichiers pour votre systĂšme d’exploitation, ainsi que pour les caractĂšres de contrĂŽle habituellement impossibles Ă  afficher. Cette option est utile pour changer ce comportement par dĂ©faut, peut ĂȘtre parce que vous tĂ©lĂ©chargez dans une partition non native, ou parce que vous voulez dĂ©sactiver la protection des caractĂšres de contrĂŽle, ou parce que vous voulez restreindre encore plus de caractĂšres Ă  ceux de la plage de valeurs ASCII.

Les modes sont un ensemble de valeurs textuelles sĂ©parĂ©es par des virgules. Les valeurs acceptĂ©es sont unix , windows , nocontrol , ascii , lowercase et uppercase . Les valeurs unix et windows sont mutuellement exclusives (l’une Ă©crasera l’autre), de mĂȘme pour lowercase et uppercase . Ces deux derniĂšres sont des cas spĂ©ciaux, car elles ne changent pas l’ensemble des caractĂšres qui devraient ĂȘtre protĂ©gĂ©s, mais plutĂŽt forcent les chemins de fichier local Ă  ĂȘtre converti soit en minuscules ou en capitales.

Lorsque « unix » est indiquĂ©, wget protĂšge le caractĂšre / et les caractĂšres de contrĂŽle dans les plages de 0 à 31 et de 128 à 159. C’est le comportement par dĂ©faut pour les systĂšmes d’exploitation de type Unix.

Lorsque « windows » est indiquĂ©, wget protĂšge les caractĂšres \ , | , / , : , ? , " , * , < , > , et les caractĂšres contrĂŽle dans les plages de 0 à 31 et de 128 à 159. En plus de cela, wget en mode Windows utilise + au lieu de : pour sĂ©parer l’hĂŽte et le port dans les noms de fichiers locaux, et utilise @ au lieu de ? pour sĂ©parer la partie requĂȘte du nom de fichier du reste. Par consĂ©quent, une URL qui aurait Ă©tĂ© sauvegardĂ©e en www.xemacs.org:4300/search.pl?input=blabla en mode Unix pourrait l’ĂȘtre en www.xemacs.org+4300/search.pl@input=blabla en mode Windows. C’est le mode par dĂ©faut sur Windows.

Si vous indiquez nocontrol , alors la protection des caractĂšres de contrĂŽle est aussi dĂ©sactivĂ©e. Cette option est utile lorsque vous tĂ©lĂ©chargez des URL avec des noms contenant des caractĂšres UTF-8 sur un systĂšme qui peut sauvegarder et afficher les noms de fichiers en UTF-8 (certaines valeurs d’octets possibles utilisĂ©es dans les sĂ©quences d’octets UTF-8 tombent dans la plage de valeurs dĂ©signĂ©e par wget comme des « contrĂŽles »).

Le mode ascii est utilisĂ© pour spĂ©cifier que tous les octets dont la valeur est en dehors de la plage de caractĂšres ASCII (c’est-Ă -dire supĂ©rieure Ă  127) doivent ĂȘtre protĂ©gĂ©s. Cela est utile lors de la sauvegarde des noms de fichiers dont l’encodage ne correspond pas Ă  celui utilisĂ© en local.

-4

--inet4-only

-6

--inet6-only

Forcer la connexion vers les adresses IPv4 ou IPv6. Avec --inet4-only ou -4 , wget ne se connectera qu’à des hĂŽtes IPv4, ignorant les enregistrements AAAA du DNS, et refusant de se connecter aux adresses IPv6 indiquĂ©es dans les URL. Au contraire, avec --inet6-only ou -6 , wget ne se connectera qu’aux hĂŽtes IPv6 et ignorera les enregistrements A et les adresses IPv4.

Aucune de ces options ne devrait ĂȘtre normalement nĂ©cessaire. Par dĂ©faut, un wget prenant en charge IPv6 utilisera la famille d’adresses spĂ©cifiĂ©e par l’enregistrement DNS de l’hĂŽte. Si le DNS rĂ©pond avec Ă  la fois des adresses IPv4 et IPv6, wget les essaiera dans l’ordre jusqu’à ce qu’il en trouve une pour se connecter. Consultez aussi l’option "--prefer-family" dĂ©crite ci-dessous.

Ces options peuvent ĂȘtre utilisĂ©es pour forcer dĂ©libĂ©rĂ©ment l’usage des familles d’adresses IPv4 ou IPv6 sur les systĂšmes avec les deux familles, habituellement pour aider au dĂ©bogage ou s’occuper d’une configuration rĂ©seau dĂ©faillante. Seulement l’une des options --inet6-only et --inet4-only peut ĂȘtre indiquĂ©e au mĂȘme moment. Aucune option n’est disponible si wget a Ă©tĂ© compilĂ© sans la prise en charge de IPv6.

--prefer-family=none/IPv4/IPv6

Lors d’un choix avec plusieurs adresses, se connecter d’abord aux adresses indiquĂ©es dans la famille d’adresses. Par dĂ©faut, l’ordre des adresses renvoyĂ© par DNS est utilisĂ© sans changement.

Cela permet d’éviter les erreurs et les tentatives de connexion intempestives lors de l’accĂšs Ă  des hĂŽtes dont l’adresse est Ă  la fois IPv6 et IPv4 Ă  partir de rĂ©seaux IPv4. Par exemple, www.kame.net se rĂ©sout en 2001:200:0:8002:203:47ff:fea5:3085 et en 203.178.141.194 . Lorsque la famille souhaitĂ©e est "IPv4", l’adresse IPv4 sera utilisĂ©e en premier ; lorsque la famille souhaitĂ©e est "IPv6", l’adresse IPv6 sera utilisĂ©e en premier ; si la valeur indiquĂ©e est "none", l’ordre des adresses renvoyĂ© par DNS est utilisĂ© sans changement.

Contrairement Ă  -4 et -6 , cette action n’empĂȘche pas l’accĂšs Ă  une quelconque famille d’adresse, elle change juste l’ ordre dans lequel on accĂšde aux adresses. Remarquez aussi que le rĂ©ordonnancement effectuĂ© par cette option est stable : il n’affecte pas l’ordre des adresses de la mĂȘme famille. C’est-Ă -dire que l’ordre relatif de toutes les adresses IPv4 et de toutes les adresses IPv6 reste intact dans tous les cas.

--retry-connrefused

ConsidĂ©rer « connection refused » comme une erreur passagĂšre et rĂ©essayer. Normalement, wget abandonne une URL lorsqu’il ne parvient pas Ă  se connecter au site, car l’échec de la connexion est considĂ©rĂ© comme un signe que le serveur ne fonctionne pas du tout et que de nouvelles tentatives ne seraient d’aucune utilitĂ©. Cette option est destinĂ©e Ă  la mise en miroir de sites peu fiables dont les serveurs ont tendance Ă  disparaĂźtre pendant de courtes pĂ©riodes.

--user= utilisateur
--password=
mot_de_passe

Indiquer le nom d’utilisateur utilisateur et le mot de passe mot_de_passe pour la rĂ©cupĂ©ration des fichiers Ă  la fois FTP et HTTP. Ces paramĂštres peuvent ĂȘtre Ă©crasĂ©s par l’utilisation des options --ftp-user et --ftp-password pour les connexions FTP et les options --http-user et --http-password pour les connexions HTTP.

--ask-password

Demander un mot de passe pour chaque connexion Ă©tablie. Ne peut pas ĂȘtre indiquĂ© quand --password est dĂ©jĂ  utilisĂ©, car ils sont mutuellement exclusifs.

--use-askpass= commande

Demander un utilisateur et un mot de passe en utilisant la commande indiquĂ©e. Si aucune commande n’est indiquĂ©e, alors la commande dans la variable d’environnement WGET_ASKPASS est utilisĂ©e. Si WGET_ASKPASS n’est pas dĂ©finie, alors la commande dans la variable d’environnement SSH_ASKPASS est utilisĂ©e.

Vous pouvez dĂ©finir la commande par dĂ©faut pour use-askpass dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande.

--no-iri

DĂ©sactiver la prise en charge des URI internationalisĂ©s (IRI). Utiliser --iri pour l’activer. La prise en charge des IRI est activĂ©e par dĂ©faut.

Vous pouvez dĂ©finir l’état par dĂ©faut de la prise en charge des IRI en utilisant la commande "iri" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande.

--local-encoding= encodage

Forcer wget Ă  utiliser encodage comme systĂšme d’encodage par dĂ©faut. Cela influe sur la maniĂšre dont wget convertit les URL indiquĂ©s comme arguments de paramĂštres rĂ©gionnaux vers UTF-8 pour la prise en charge d’IRI.

wget utilise la fonction nl_langinfo()" et donc la variable d’environnement "CHARSET" pour obtenir les paramĂštres rĂ©gionaux. Si cela Ă©choue, ASCII est utilisĂ©.

Vous pouvez dĂ©finir l’encodage local par dĂ©faut en utilisant la commande "local_encoding" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande.

--remote-encoding= encodage

Forcer wget Ă  utiliser l’ encodage comme encodage par dĂ©faut du serveur distant. Cela affecte la façon dont wget convertit les URI trouvĂ©s dans les fichiers de l’encodage distant en UTF-8 lors d’une rĂ©cupĂ©ration rĂ©cursive. Cette option n’est utile que pour la prise en charge d’IRI, pour interprĂ©ter les caractĂšres qui ne sont pas ASCII.

Pour HTTP, l’encodage distant peut ĂȘtre trouvĂ© dans l’en-tĂȘte HTTP "Content-Type" et dans les mĂ©ta-Ă©tiquettes HTML "Content-Type http-equiv".

Vous pouvez dĂ©finir l’encodage par dĂ©faut avec la commande "remoteencoding" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© en ligne de commande.

--unlink

Forcer wget Ă  dĂ©lier le fichier au lieu d’écraser le fichier existant. Cette option est utile pour le tĂ©lĂ©chargement dans le rĂ©pertoire avec des liens en dur (« hardlinks »).

Options de répertoire

-nd

--no-directories

Ne pas crĂ©er de hiĂ©rarchie de rĂ©pertoires lors d’une rĂ©cupĂ©ration rĂ©cursive. Avec cette option activĂ©e, tous les fichiers sont sauvegardĂ©s dans le rĂ©pertoire actuel, sans Ă©crasement (si un nom apparait plus d’une fois, les noms de fichiers auront l’extension .n ).

-x

--force-directories

L’opposĂ© de -nd : crĂ©er une hiĂ©rarchie de rĂ©pertoires, mĂȘme si une n’aurait pas Ă©tĂ© créée autrement. Par exemple, wget -x http://fly.srk.fer.hr/robots.txt sauvegardera les fichiers tĂ©lĂ©chargĂ©s dans fly.srk.fer.hr/robots.txt .

-nH

--no-host-directories

DĂ©sactiver la gĂ©nĂ©ration de rĂ©pertoires prĂ©fixĂ©s par le nom d’hĂŽte. Par dĂ©faut, l’invocation de wget avec -r http://fly.srk.fer.hr/ crĂ©era une structure de rĂ©pertoires commençant par fly.srk.fer.hr/ . Cette option dĂ©sactive un tel comportement.

--protocol-directories

Utiliser le nom de protocole comme composant du répertoire des noms de fichiers locaux. Par exemple, avec cette option, wget -r http:// hÎte sera sauvegardé en http/ hÎte /... plutÎt que seulement en hÎte /... .

--cut-dirs= nombre

Ignorer un certain nombre de composants du rĂ©pertoire. Cela est utile pour obtenir un contrĂŽle fin sur le rĂ©pertoire oĂč la rĂ©cupĂ©ration rĂ©cursive sera enregistrĂ©e.

Prenons comme exemple le rĂ©pertoire Ă  l’adresse ftp://ftp.xemacs.org/pub/xemacs/ . Si vous le rĂ©cupĂ©rez avec -r , il sera sauvegardĂ© localement sous ftp.xemacs.org/pub/xemacs/ . Bien que l’option -nH peut supprimer la partie ftp.xemacs.org/ , vous ĂȘtes encore coincĂ© avec pub/xemacs . C’est lĂ  oĂč --cut-dirs est vraiment pratique : il permet Ă  wget de ne pas « voir » le nombre de composants de rĂ©pertoire distant. Voici quelques exemples de la maniĂšre dont l’option --cut-dirs fonctionne.

Pas d’options -> ftp.xemacs.org/pub/xemacs/
-nH -> pub/xemacs/
-nH --cut-dirs=1 -> xemacs/
-nH --cut-dirs=2 -> .
--cut-dirs=1 -> ftp.xemacs.org/xemacs/
...

Si vous voulez simplement vous dĂ©barrasser de la structure du rĂ©pertoire, cette option est similaire Ă  une combinaison de -nd et -P . Par contre, contrairement Ă  -nd , --cut-dirs ne se perd pas avec des sous-rĂ©pertoires (par exemple, avec -nH --cut-dirs=1 , un sous-rĂ©pertoire beta/ sera placĂ© sur xemacs/beta , comme on pourrait l’espĂ©rer.

-P préfixe
--directory-prefix=
préfixe

DĂ©signer le prĂ©fixe de rĂ©pertoire Ă  prĂ©fixe . Le prĂ©fixe de rĂ©pertoire est le rĂ©pertoire oĂč tous les autres fichiers et sous-rĂ©pertoires vont ĂȘtre sauvegardĂ©s, c’est-Ă -dire le haut de l’arbre de rĂ©cupĂ©ration. C’est . (le rĂ©pertoire actuel) par dĂ©faut.

Options HTTP

--default-page= nom

Utiliser nom comme nom de fichier par dĂ©faut quand il n’est pas connu (c’est-Ă -dire pour les URL finissants avec une barre oblique), au lieu de index.html .

-E

--adjust-extension

Si un fichier de type application/xhtml+xml ou text/html est tĂ©lĂ©chargĂ© et que l’URL ne finit pas par l’expression rationnelle \.[Hh][Tt][Mm][Ll]? , cette option provoquera le rajout du suffixe .html au nom de fichier local. C’est utile, par exemple, lorsque vous mettez en miroir un site distant qui utilise des pages .asp , mais que vous voulez que les pages mises en miroir puissent ĂȘtre visualisĂ©es sur votre serveur Apache standard. Un autre usage apprĂ©ciable pour cela est quand vous tĂ©lĂ©chargez du matĂ©riel gĂ©nĂ©rĂ© par CGI. Une URL telle que http://site.com/article.cgi?25 sera sauvegardĂ©e comme article.cgi?25.html .

Notez que les noms de fichiers modifiĂ©s ainsi seront tĂ©lĂ©chargĂ©s Ă  nouveau chaque fois que vous remettrez en miroir un site, car wget ne peut pas dire que le fichier local X.html correspond Ă  l’URL X distante (Ă©tant donnĂ© qu’il ne sait pas encore que l’URL produit une sortie sous forme text/html ou application/xhtml+xml .

Avec la version 1.12 wget s’assure aussi que tous les fichiers tĂ©lĂ©chargĂ©s de forme text/css se terminent par le suffixe .css , et l’option a Ă©tĂ© renommĂ©e de --html-extension , pour mieux reflĂ©ter son nouveau comportement. L’ancien nom de l’option est encore acceptable, mais devrait ĂȘtre considĂ©rĂ© comme obsolĂšte.

Depuis la version 1.19.2, wget s’assure aussi que tout fichier tĂ©lĂ©chargĂ© avec un "Content-Encoding" de type br , compress , deflate ou gzip finisse avec le suffixe .br , .Z , .zlib et .gz respectivement.

À l’avenir, cette option devrait ĂȘtre assez Ă©tendue pour englober les suffixes d’autres types de contenus, incluant ceux qui ne sont pas analysĂ©s par wget .

--http-user= utilisateur
--http-password=
mot_de_passe

Indiquer le nom d’utilisateur utilisateur et le mot de passe mot_de_passe sur un serveur HTTP. Selon le type d’authentification par question-rĂ©ponse, wget encodera en utilisant Ă  la fois le schĂ©ma d’authentification «"basic" (non-sĂ©curisĂ©), "digest" ou "NTLM" de Windows.

Une autre maniĂšre d’indiquer le nom d’utilisateur et le mot de passe est de les spĂ©cifier dans l’URL. Les deux mĂ©thodes rĂ©vĂšlent votre mot de passe Ă  quiconque se donne la peine d’exĂ©cuter "ps"). Pour empĂȘcher que les mots de passe ne soient vus, utilisez --use-askpass ou stockez-les dans .wgetrc ou .netrc , et assurez vous de protĂ©ger ces fichiers des autres utilisateurs avec "chmod". Si les mots de passe sont trĂšs importants, ne les laissez pas traĂźner dans ces fichiers non plus (Ă©ditez les fichiers et effacez-les aprĂšs que wget a commencĂ© le tĂ©lĂ©chargement).

--no-http-keep-alive

DĂ©sactiver la fonction « keep-alive » pour les tĂ©lĂ©chargements HTTP. Normalement, wget demande au serveur de laisser la connexion ouverte pour que, lorsque vous tĂ©lĂ©chargez plus d’un document sur le mĂȘme serveur, ils soient transfĂ©rĂ©s sur la mĂȘme connexion TCP. Cela Ă©conomise du temps et aussi rĂ©duit la charge sur le serveur.

Cette option a son utilitĂ© quand, pour une raison quelconque, les connexions persistantes (keep-alive) ne fonctionnent pas pour vous, dĂ» par exemple Ă  un bogue du serveur ou en raison de l’incapacitĂ© des scripts cĂŽtĂ© serveur Ă  gĂ©rer les connexions.

--no-cache

Désactiver le cache coté serveur. Dans ce cas, wget enverra les directives appropriées ( Cache-Control: no-cache et Pragma: no-cache ) au serveur distant pour recevoir les fichier du service distant, au lieu de renvoyer la version mise en cache. Cela est surtout utile pour retrouver et vider les documents obsolÚtes sur des serveurs mandataires.

La mise en cache est autorisée par défaut.

--no-cookies

DĂ©sactiver l’utilisation des cookies. Les cookies sont un mĂ©canisme permettant de conserver l’état du serveur. Le serveur envoie au client un cookie utilisant l’en-tĂȘte "Set-Cookie" et le client rĂ©pond avec le mĂȘme cookie lors de requĂȘtes supplĂ©mentaires. Comme les cookies autorisent les propriĂ©taires du serveur Ă  garder une trace des visiteurs et pour les sites de s’échanger ces informations, certains considĂšrent cela comme une atteinte Ă  la vie privĂ©e. Par dĂ©faut, les cookies sont utilisĂ©s ; cependant, il n’y a pas de stockage de cookies par dĂ©faut.

--load-cookies fichier

Charger les cookies d’un fichier avant la premiĂšre rĂ©cupĂ©ration HTTP. fichier est un fichier texte dans le format utilisĂ© Ă  l’origine par les fichiers cookies.txt de Netscape.

Vous utiliserez gĂ©nĂ©ralement cette option pour la mise en place d’un miroir de sites qui exigent que vous soyez connectĂ© pour accĂ©der Ă  tout ou partie de leur contenu. Le processus de connexion fonctionne gĂ©nĂ©ralement de la maniĂšre suivante : le serveur Web Ă©met un cookie HTTP aprĂšs avoir reçu et vĂ©rifiĂ© vos identifiants. Le cookie est alors renvoyĂ© par le navigateur pour accĂ©der Ă  cette partie du site, et prouve ainsi votre identitĂ©.

La mise en miroir d’un tel site nĂ©cessite que wget renvoie les mĂȘme cookies que ceux envoyĂ©s par le navigateur lors de la communication avec le site. Cela est fait par --load-cookies ; il suffit d’indiquer Ă  wget l’emplacement du fichier cookies.txt et il enverra les mĂȘmes cookies que votre navigateur enverrait dans la mĂȘme situation. Les diffĂ©rents navigateurs conservent les fichiers cookies textuels Ă  des endroits diffĂ©rents :
"Netscape 4.x."

Les cookies sont dans ˜/.netscape/cookies.txt .

"Mozilla and Netscape 6.x."

Le fichier de cookies de Mozilla se nomme aussi cookies.txt et se trouve quelque part sous ˜/.mozilla , dans le rĂ©pertoire de votre profil. Le nom de chemin se termine gĂ©nĂ©ralement en quelque chose comme ˜/.mozilla/default/chaĂźne_bizarre/cookies.txt .

"Internet Explorer."

Vous pouvez produire un fichier cookie que wget peut utiliser en utilisant le menu Fichier, Import et Export, Export de cookies. Cela a Ă©tĂ© testĂ© avec Internet Explorer 5 ; il n’est pas garanti que cela fonctionne avec des versions plus rĂ©centes.

"Other browsers."

Si vous utilisez un autre navigateur pour créer vos cookies, --load-cookies ne pourra fonctionner que si vous pouvez situer ou créer un fichier cookie dans le format Netscape comme attendu par wget .

Si vous ne pouvez pas utiliser --load-cookies , il devrait exister une alternative. Si votre navigateur prend en charge un « gestionnaire de cookie », vous pouvez l’utiliser pour visualiser les cookies utilisĂ©s pour accĂ©der au site que vous mettez en miroir. Écrire le nom et la valeur du cookie, et donner des instructions manuellement Ă  wget pour qu’il envoie ces cookies, en contournant le gestionnaire de cookie « officiel » :

wget --no-cookies --header "Cookie: <nom>=<valeur>"

--save-cookies fichier

Sauvegarder les cookies dans fichier avant de quitter. Cela ne sauvegardera pas les cookies qui ont expirĂ©s ou qui n’ont pas de dĂ©lai d’expiration (nommĂ©s les « cookies de session »), mais voir aussi --keep-session-cookies .

--keep-session-cookies

Lorsque indiquĂ©, fait que --save-cookies sauvegarde aussi les cookies de session. Les cookies de session ne sont normalement pas sauvegardĂ©s, car ils sont sensĂ©s ĂȘtre gardĂ©s en mĂ©moire et oubliĂ©s lorsque vous quittez le navigateur. Les sauvegarder est utile sur les sites qui nĂ©cessitent une identification ou une visite de la page d’accueil avant que vous puissiez accĂ©der Ă  certaines pages. Avec cette option, de multiples exĂ©cutions de wget sont considĂ©rĂ©es comme une seule session de navigateur tant que le site est concernĂ©.

Comme le format de fichier de cookie ne contient gĂ©nĂ©ralement pas les cookies de session, wget les marque avec un dĂ©lai d’expiration de 0 . --load-cookies de wget les reconnaĂźt comme cookies de session, mais cela pourrait ĂȘtre confus pour d’autres navigateurs. Prenez en compte aussi que les cookies chargĂ©s ainsi seront traitĂ©s comme d’autres cookies de session, donc si vous voulez que --save-cookies les conserve Ă  nouveau, vous devez utiliser --keep-session-cookies Ă  nouveau.

--ignore-length

HĂ©las, quelques serveurs HTTP (les programmes CGI, pour ĂȘtre prĂ©cis) envoient de faux en-tĂȘtes "Content-Length", ce qui rend wget fou, car il pense que tout le document n’a pas Ă©tĂ© rĂ©cupĂ©rĂ©. Vous pouvez repĂ©rer ce syndrome si wget tente Ă  plusieurs reprises de rĂ©cupĂ©rer le mĂȘme document, en affirmant Ă  chaque fois que la connexion (par ailleurs normale) a Ă©tĂ© fermĂ©e au mĂȘme instant prĂ©cis.

Avec cette option, wget ignorera l’en-tĂȘte "Content-Length", comme s’il n’avait jamais existĂ©.

--header= header-line

Envoyer l’en-tĂȘte de ligne header-line avec le reste des en-tĂȘtes dans chaque requĂȘte HTTP. L’en-tĂȘte fourni est envoyĂ© tel quel, ce qui signifie qu’il doit contenir le nom et la valeur sĂ©parĂ©s par un deux-points, et ne doit pas contenir de passage Ă  la ligne.

Vous pouvez dĂ©finir plus d’un en-tĂȘte additionnel en indiquant --header plus d’une fois.

wget --header='Accept-Charset: iso-8859-2' \
--header='Accept-Language: hr' \
http://fly.srk.fer.hr/

L’indication d’une chaĂźne vide comme valeur d’en-tĂȘte effacera tous les en-tĂȘtes prĂ©cĂ©demment dĂ©finis par l’utilisateur.

Avec wget 1.10, cette option peut ĂȘtre utilisĂ©e pour Ă©craser les en-tĂȘtes qui autrement auraient Ă©tĂ© gĂ©nĂ©rĂ©s automatiquement. Cet exemple donne l’instruction Ă  wget de se connecter Ă  l’hĂŽte local, mais en indiquant truc.machin dans l’en-tĂȘte "Host" :

wget --header="Host: truc.machin" http://localhost/

Dans les versions de wget antĂ©rieures à 1.10, une telle utilisation de --header provoquait l’envoi d’en-tĂȘtes en double.

--compression= type

Choisir le type de compression Ă  utiliser. Les valeurs permises sont auto , gzip et none .

Si auto ou gzip sont indiquĂ©s, wget demande au serveur de compresser le fichier en utilisant le format gzip de compression. Si le serveur compresse le fichier et rĂ©pond avec le champ d’en-tĂȘte "Content-Encoding" configurĂ© de maniĂšre adĂ©quate, le fichier sera dĂ©compressĂ© automatiquement.

Si none est indiquĂ©, wget ne demandera pas au serveur de compresser le fichier et ne dĂ©compressera aucune rĂ©ponse du serveur. C’est le comportement par dĂ©faut.

La prise en charge de la compression est actuellement expĂ©rimentale. Au cas oĂč la compression est activĂ©e, merci de rapporter tout bogue Ă  "bug-wget@gnu.org".

--max-redirect= nombre

Indique le nombre maximal de redirections Ă  suivre pour une ressource. Par dĂ©faut, c’est 20, ce qui est gĂ©nĂ©ralement largement plus que suffisant. Cependant, en certaines occasions oĂč vous voulez en autoriser plus (ou moins), c’est l’option Ă  utiliser.

--proxy-user= utilisateur
--proxy-password=
mot_de_passe

Indiquer le nom d’utilisateur utilisateur et le mot de passe mot_de_passe pour l’authentification sur un serveur mandataire. wget les encodera en utilisant le schĂ©ma d’authentification "basic".

Des considérations de sécurité similaires à celles avec --http-password sont pertinentes ici aussi.

--referer= url

Inclure l’en-tĂȘte « Referer: url » dans la requĂȘte HTTP. Cela est utile pour rĂ©cupĂ©rer des documents avec un traitement de serveur qui suppose qu’ils sont toujours rĂ©cupĂ©rĂ©s par des navigateurs web interactifs et ne s’en sortent correctement que lorsque le Referer est rĂ©glĂ© sur l’une des pages qui pointent vers eux.

--save-headers

Sauvegarder les en-tĂȘtes envoyĂ©s par le serveur HTTP au fichier, prĂ©cĂ©dant le contenu actuel, avec une ligne vide comme sĂ©parateur.

-U agent-string
--user-agent=
agent-string

S’identifier comme agent-string pour le serveur HTTP.

Le protocole HTTP autorise les clients Ă  s’identifier eux-mĂȘmes en utilisant un champ d’en-tĂȘte "User-Agent". Cela permet de diffĂ©rencier les logiciels WWW, gĂ©nĂ©ralement dans des buts de statistiques ou pour retracer les violations de protocole. Normalement, wget s’identifie comme Wget/ version , oĂč version est le numĂ©ro de la version actuelle de wget .

Cependant, certains sites sont connus pour imposer la politique d’adaptation de la sortie en fonction des informations fournies par le "User-Agent". Bien que ce ne soit pas une si mauvaise idĂ©e en thĂ©orie, il y a eu des abus par des serveurs refusant l’information Ă  des clients autres que Netscape (historiquement), ou plus frĂ©quemment, Microsoft Internet Explorer. Cette option vous permet de changer la ligne "User-Agent" fournie par wget . Utiliser cette option est dĂ©conseillĂ©, Ă  moins de savoir rĂ©ellement ce que vous faites.

Indiquer un user agent vide avec --user-agent="" demandera Ă  wget de ne pas envoyer d’en-tĂȘte "User-Agent" dans les requĂȘtes HTTP.

--post-data= chaĂźne
--post-file=
fichier

Utiliser POST comme mĂ©thode pour toutes les requĂȘtes HTTP et les envoyer dans le corps de requĂȘtes dĂ©sirĂ©. --post-data envoie chaĂźne comme donnĂ©es, alors que --post-file envoie le contenu de fichier . À part cela, ces options fonctionnent exactement de la mĂȘme maniĂšre. En particulier, les deux s’attendent Ă  du contenu sous la forme "clĂ©1=valeur1&clĂ©2=valeur2", avec un encodage-pourcent (percent encoding) des caractĂšres spĂ©ciaux ; la seule diffĂ©rence est que l’une attend son contenu comme paramĂštre de ligne de commande et l’autre accepte son contenu d’un fichier. En particulier --post-file n’est pas fait pour transmettre des fichiers sous forme de piĂšces jointes : ceux-lĂ  doivent apparaitre comme des donnĂ©es "clĂ©=valeur" (avec l’encodage-pourcent adĂ©quat) juste comme tout le reste. wget ne prend pas actuellement en charge "multipart/form-data" pour transmettre des donnĂ©es POST, mais seulement "application/x-www-form-urlencoded". Seule une des options --post-data ou --post-file doit ĂȘtre spĂ©cifiĂ©e.

Veuillez noter que wget n’exige pas que le contenu soit de la forme "clĂ©1=valeur1&clĂ©2=valeur2", et ne le teste pas non plus. wget transmettra simplement toutes les donnĂ©es qui lui sont fournies. La plupart des serveurs s’attendent toutefois Ă  ce que les donnĂ©es POST soient dans le format ci-dessus lors du traitement des formulaires HTML.

Lors de l’envoi d’une requĂȘte POST Ă  l’aide de l’option --post-file , wget traite le fichier comme un fichier binaire et envoie chaque caractĂšre de la requĂȘte POST sans supprimer les caractĂšres de fin de ligne ou de saut de page. Tout autre caractĂšre de contrĂŽle dans le texte sera aussi envoyĂ© tel quel dans la requĂȘte POST.

Merci de prendre en compte que wget doit connaĂźtre la taille des donnĂ©es POST Ă  l’avance. C’est pourquoi l’argument Ă  "--post-file" doit ĂȘtre un fichier normal ; spĂ©cifier une FIFO ou quelque chose comme /dev/stdin ne fonctionnera pas. La façon de contourner cette limite inhĂ©rente Ă  HTTP/1.0 n’est pas trĂšs claire. Bien que HTTP/1.1 introduise le transfert morcelĂ© qui ne nĂ©cessite pas de connaĂźtre la longueur Ă  l’avance, un client ne peut pas utiliser le tronçonnage avant de savoir qu’il parle Ă  un serveur HTTP/1.1. Et il ne peut pas le savoir avant d’avoir reçu une rĂ©ponse, qui a son tour nĂ©cessite qu’une requĂȘte ait abouti (le problĂšme de l’Ɠuf et de la poule).

Note : Depuis la version 1.15 si wget est redirigĂ© aprĂšs que la requĂȘte POST a terminĂ©, son comportement dĂ©pendra du code de la rĂ©ponse renvoyĂ© par le serveur. Dans le cas d’un 301 Moved Permanently, 302 Moved Temporarily ou 307 Temporary Redirect, wget en accord avec la RFC2616, continuera Ă  envoyer une requĂȘte POST. Dans le cas oĂč un serveur veut que le client change la mĂ©thode de requĂȘte lors de la redirection, il devrait envoyer un code de rĂ©ponse 303 See Other.

Cet exemple montre comment se connecter à un serveur en utilisant POST et ensuite procéder au téléchargement des pages souhaitées, vraisemblablement accessibles uniquement aux utilisateurs autorisés :

# Se connecter au serveur. Cela ne peut ĂȘtre fait qu’une fois.
wget --save-cookies cookies.txt \
--post-data 'user=truc&password=machin' \
http://example.com/auth.php
# Maintenant prendre la ou les pages qui nous intéressent.
wget --load-cookies cookies.txt \
-p http://example.com/interesting/article.php

Si le serveur utilise des cookies de session pour tracer l’authentification de l’utilisateur, l’exemple ci-dessus ne fonctionnera pas car --save-cookies ne les sauvegardera pas (comme aucun navigateur) et le fichier cookies.txt sera vide. Dans ce cas, utiliser --keep-session-cookies avec --save-cookies pour forcer la sauvegarde des cookies de session.

--method= HTTP-Method

Pour les besoins des scripts RESTful, wget permet l’envoi d’autres mĂ©thodes HTTP sans avoir besoin de les dĂ©finir explicitement en utilisant --header=Header-Line . wget utilisera n’importe quelle chaĂźne qui lui sera passĂ© aprĂšs --method comme mĂ©thode HTTP pour le serveur.

--body-data= chaßne-données
--body-file=
Fichier-données

Doit ĂȘtre positionnĂ© lorsque des donnĂ©es additionnelles nĂ©cessitent d’ĂȘtre envoyĂ©es au serveur avec la mĂ©thode prĂ©conisĂ©e par l’utilisation de --method . --body-data envoie une chaĂźne comme donnĂ©es, alors que --body-file envoie le contenu de fichier . Autrement, ils fonctionnent exactement pareil.

Actuellement, --body-file ne transmet pas les fichiers comme un tout. wget ne prend actuellement pas en charge "multipart/form-data" pour la transmission de donnĂ©es, mais seulement "application/x-www-form-urlencoded". Dans le futur, cela devrait changer pour que wget puisse envoyer le fichier --body-file comme un fichier complet, au lieu d’envoyer son contenu au serveur. Veuillez prendre en compte que wget nĂ©cessite de connaĂźtre le contenu des donnĂ©es BODY Ă  l’avance et donc l’argument de --body-file devrait ĂȘtre un fichier ordinaire. Voir --post-file pour des explications plus dĂ©taillĂ©es. Une seule des options --body-data et --body-file devra ĂȘtre spĂ©cifiĂ©e.

Si wget est redirigĂ© aprĂšs la fin de la requĂȘte, wget suspend la mĂ©thode en cours et envoie une requĂȘte GET jusqu’à ce que la redirection soit terminĂ©e. Cela est vrai pour tous les codes de rĂ©ponse Ă  l’exception de 307 Temporary Redirect qui est utilisĂ© pour indiquer explicitement que la mĂ©thode de requĂȘte ne devrait pas changer. Une autre exception est quand la mĂ©thode est positionnĂ©e Ă  "POST", auquel cas les rĂšgles de redirection indiquĂ©es avec --post-data sont suivies.

--content-disposition

Si l’option est positionnĂ©e, la prise en charge expĂ©rimentale (pas complĂštement fonctionnelle) des en-tĂȘtes "Content-Disposition" est activĂ©e. Cela peut actuellement entraĂźner des allers-retours supplĂ©mentaires vers le serveur pour une requĂȘte "HEAD", et souffre de quelques bogues connus, c’est pourquoi ce n’est pas actuellement activĂ© par dĂ©faut.

Cette option est utile pour quelques programmes de tĂ©lĂ©chargement CGI qui utilisent des en-tĂȘtes "Content-Disposition" pour dĂ©crire Ă  quoi devrait ressembler le nom d’un fichier tĂ©lĂ©chargĂ©.

Quand il est combinĂ© avec --metalink-over-http et --trust-server-names , un fichier Content-Type: application/metalink4+xml est nommĂ© en utilisant le champ de nom de fichier de "Content-Disposition", s’il est disponible.

--content-on-error

Si cela est activĂ©, wget ne sautera pas le contenu lorsque le serveur rĂ©pond avec un code d’état http qui indique une erreur.

--trust-server-names

Si cela est activĂ©, lors d’une redirection, le nom du fichier local sera basĂ© sur l’URL de redirection. Par dĂ©faut le nom du fichier local est basĂ© sur l’URL d’origine. Lors d’une recherche rĂ©cursive, cela peut ĂȘtre utile car dans de nombreux sites web, les URL redirigĂ©es correspondent Ă  une structure de fichiers sous-jacente, alors que les URL de liens ne le font pas.

--auth-no-challenge

Si cette option est passĂ©e, wget enverra une information d’authentification HTTP basique (nom d’utilisateur et mot de passe en texte clair) pour toutes les requĂȘtes, comme le fait par dĂ©faut wget 1.10.2 et antĂ©rieurs.

L’utilisation de cette option est dĂ©conseillĂ©e, et est destinĂ©e uniquement Ă  la prise en charge de quelques serveurs obscurs, qui n’envoient jamais d’authentification par question-rĂ©ponse HTTP, mais acceptent les informations d’authentification non sollicitĂ©es, disons, en plus de l’authentification par formulaire.

--retry-on-host-error

ConsidĂ©rer les erreurs de l’hĂŽte, telles que « Échec temporaire dans la rĂ©solution du nom », comme des erreurs non fatales et transitoires.

--retry-on-http-error= code[,code,...]

ConsidĂ©rer les codes de rĂ©ponse HTTP donnĂ©s comme des erreurs non-fatales et transitoires. Fournir une liste de codes de rĂ©ponse HTTP Ă  trois chiffres sĂ©parĂ©s par des virgules comme argument. Utile pour travailler dans certaines circonstances oĂč les rĂ©essais sont nĂ©cessaires, mais oĂč le serveur rĂ©pond avec un code d’erreur que wget ne rĂ©essaye pas normalement. Ces erreurs devraient ĂȘtre 503 (Service non disponible) et 429 (Trop de requĂȘtes). Les tentatives activĂ©es par cette option sont effectuĂ©es sous rĂ©serve des limitations normales de wget en matiĂšre de dĂ©lais et de nombre de tentatives.

L’utilisation de cette option n’est prĂ©vue que pour des cas d’utilisation particuliers et n’est gĂ©nĂ©ralement pas recommandĂ©e, car elle peut forcer des tentatives mĂȘme dans les cas oĂč le serveur essaie rĂ©ellement de rĂ©duire sa charge. Veuillez l’utiliser Ă  bon escient et seulement si vous savez ce que vous faites.

Options HTTPS (SSL/TLS)

Pour la prise en charge des tĂ©lĂ©chargements HTTP (HTTPS) chiffrĂ©s, wget doit ĂȘtre compilĂ© avec une bibliothĂšque SSL externe. Habituellement par dĂ©faut c’est GnuTLS. En plus, wget prend aussi en charge HSTS (HTTP Strict Transport Security). Si wget est compilĂ© sans la prise en charge de SSL, aucune de ces options n’est disponible.
--secure-protocol=
protocole

Choisir le protocole de sĂ©curitĂ© Ă  utiliser. Les valeurs autorisĂ©es sont auto , SSLv2 , SSLv3 , TLSv1 , TLSv1_1 , TLSv1_2 , TLSv1_3 et PFS . Si auto est utilisĂ©, le choix est donnĂ© Ă  la bibliothĂšque SSL de choisir le protocole appropriĂ© automatiquement, qui s’achĂšve par l’envoi d’un salut TLSv1. C’est le comportement par dĂ©faut.

Indiquer SSLv2 , SSLv3 , TLSv1 , TLSv1_1 , TLSv1_2 ou TLSv1_3 force l’utilisation du protocole correspondant. Cette fonction est utile lorsque l’on s’adresse Ă  des implĂ©mentations de serveur SSL anciennes et boguĂ©es qui rendent le choix de la version correcte du protocole difficile pour la bibliothĂšque SSL sous-jacente. Heureusement, de tels serveurs sont assez rares.

La spĂ©cification de PFS impose l’utilisation des suites de chiffrement dites « Perfect Forward Security ». Pour faire court, PFS ajoute une sĂ©curitĂ© en crĂ©ant une clĂ© Ă  usage unique pour chaque connexion SSL. Cela a un impact un peu plus important sur le CPU du client et du serveur. Nous utilisons des chiffrements connus pour ĂȘtre sĂ»rs (par exemple, pas de MD4) et le protocole TLS. Ce mode exclut Ă©galement de maniĂšre explicite les mĂ©thodes d’échange de clĂ©s non SFP, telles que RSA.

--https-only

En mode récursif, seuls les liens HTTPS sont suivis.

--ciphers

DĂ©finir la chaĂźne de listes de chiffrement. Normalement cette chaĂźne dĂ©finit les suites de chiffrement et autres options SSL/TLS que l’utilisateur voudrait utiliser, avec un ordre de prĂ©fĂ©rence (GnuTLS l’appelle « chaĂźne prioritaire »). Cette chaĂźne sera envoyĂ©e littĂ©ralement au moteur SSL/TLS (OpenSSL ou GnuTLS) et donc son format et sa syntaxe en dĂ©pendront. wget ne la traitera ni ne la manipulera en aucune façon. Se rĂ©fĂ©rer Ă  la documentation d’OpenSSL ou de GnuTLS pour de plus amples informations.

--no-check-certificate

Ne pas vĂ©rifier le certificat du serveur auprĂšs des autoritĂ©s de certification disponibles. Ne pas requĂ©rir non plus que le nom d’hĂŽte de l’URL corresponde au nom commun prĂ©sentĂ© par le certificat.

Par dĂ©faut, wget 1.10 vĂ©rifie le certificat du serveur auprĂšs des autoritĂ©s de certification reconnues, cassant l’établissement de la liaison SSL et stoppant le tĂ©lĂ©chargement si la vĂ©rification Ă©choue. Aussi, mĂȘme si cela procure des tĂ©lĂ©chargements plus sĂ»rs, cela casse l’interopĂ©rabilitĂ© avec certains sites qui fonctionnent avec des versions prĂ©cĂ©dentes de wget , en particulier ceux qui utilisent des certificats auto-signĂ©s, expirĂ©s ou non valables. Cette option force le mode « insecure » qui transforme les erreurs de vĂ©rification de certificats en avertissements, permettant ainsi de poursuivre.

Si vous rencontrez des erreurs « certificate verification » ou qui indiquent « le nom courant ne correspond pas au nom d’hĂŽte demandé », vous pouvez utiliser cette option pour outrepasser la vĂ©rification. N’utilisez cette option que si vous ĂȘtes convaincu par un autre moyen de l’authenticitĂ© du site, ou si vraiment peu vous importe la validitĂ© de son certificat. C’est presque toujours une mauvaise idĂ©e de ne pas vĂ©rifier les certificats lors de la transmission de donnĂ©es confidentielles ou importantes. Pour les certificats auto-signĂ©s, vous devriez tĂ©lĂ©charger le certificat pour le vĂ©rifier au lieu de forcer en mode non sĂ©curisĂ©. Si vous ĂȘtes vraiment sĂ»r de ne vouloir aucune vĂ©rification de certificat, vous pouvez indiquer --check-certificate=quiet pour dire Ă  wget de ne pas afficher d’avertissements au sujet des certificats non valables, bien que dans la plupart des cas ce soit la mauvaise chose Ă  faire.

--certificate= fichier

Utiliser le certificat du client stockĂ© dans fichier . Cela est nĂ©cessaire pour les serveurs qui sont configurĂ©s pour demander les certificats des clients qui s’y connectent. Normalement, un certificat n’est pas demandĂ© et cette option est optionnelle.

--certificate-type= type

Indiquer le type de certificat du client. Les valeurs autorisées sont PEM (par défaut) et DER , aussi connu comme ASN1 .

--private-key= fichier

Lire la clé privée dans fichier . Cela vous permet de fournir la clé privée dans un fichier séparé du certificat.

--private-key-type= type

Indiquer le type de la clé privée. Les valeurs acceptées sont PEM (par défaut) et DER .

--ca-certificate= fichier

Utiliser fichier comme fichier contenant le paquet d’autoritĂ©s de certification (« CA ») pour vĂ©rifier les pairs. Les certificats doivent ĂȘtre au format PEM.

Sans cette option wget cherche les certificats CA aux endroits spécifiés par le systÚme, choisis par OpenSSL lors de son installation.

--ca-directory= répertoire

Indiquer le rĂ©pertoire contenant les certificats CA au format PEM. Chaque fichier contient un certificat CA, et le nom du fichier est basĂ© sur une valeur de hachage dĂ©rivĂ©e du certificat. Cela est rĂ©alisĂ© en traitant un rĂ©pertoire de certificats avec l’utilitaire "c_rehash" fourni avec OpenSSL. L’utilisation de --ca-directory est plus efficace que --ca-certificate lorsque plusieurs certificats sont installĂ©s car cela permet Ă  wget de rĂ©cupĂ©rer les certificats sur demande.

Sans cette option wget cherche les certificats CA aux endroits spécifiés par le systÚme, choisis par OpenSSL lors de son installation.

--crl-file= fichier

Indiquer un fichier CRL dans fichier . Cela est nécessaire pour les certificats révoqués par les Autorités de Certifications.

--pinnedpubkey=file/hashes

Dire Ă  wget d’utiliser la clĂ© publique indiquĂ©e (ou les hachages) pour vĂ©rifier le pair. Cela peut ĂȘtre un chemin qui contient une seule clĂ© publique au format PEM ou DER, ou tout nombre de hachage sha256 encodĂ© en base64 prĂ©cĂ©dĂ© de « sha256 » et sĂ©parĂ© par « ; »

Lors de la nĂ©gociation d’une connexion TLS ou SSL, le serveur envoie un certificat prouvant son identitĂ©. Une clĂ© publique est extraite de ce certificat et si cela ne correspond pas exactement Ă  une des clĂ©s publique fournies Ă  cette option, wget annulera la connexion avant l’envoi ou la rĂ©ception de donnĂ©es.

--random-file= fichier

[OpenSSL et LibreSSL seulement] Utiliser fichier comme source de données aléatoires pour ensemencer le générateur de nombres pseudo-aléatoires sur les systÚmes sans /dev/urandom .

Sur de tels systĂšmes, la bibliothĂšque SSL a besoin d’une source extĂ©rieure de donnĂ©es alĂ©atoires pour s’initialiser. Les donnĂ©es alĂ©atoires pouvaient ĂȘtre fournies par EGD (voir --egd-file ci-dessous) ou lues sur une source extĂ©rieure spĂ©cifiĂ©e par l’utilisateur. Si cette option n’est pas indiquĂ©e, wget cherchera les donnĂ©es alĂ©atoires dans $RANDFILE ou, s’il n’est pas dĂ©fini, dans $HOME/.rnd.

Si vous obtenez l’erreur « Could not seed OpenSSL PRNG; disabling SSL », vous devriez fournir des donnĂ©es alĂ©atoires en utilisant l’une des mĂ©thodes dĂ©crites ci-dessus.

--egd-file= fichier

[seulement pour OpenSSL] Utiliser fichier comme socket EGD. EGD signifie Entropy Gathering Daemon , un programme de l’espace utilisateur qui collecte des donnĂ©es Ă  partir de diverses sources systĂšme imprĂ©visibles et les met Ă  la disposition d’autres programmes qui pourraient en avoir besoin. Les logiciels de chiffrement, tels que la bibliothĂšque SSL, ont besoin de sources d’alĂ©as non rĂ©pĂ©titifs pour ensemencer le gĂ©nĂ©rateur de nombres alĂ©atoires utilisĂ© pour produire des clĂ©s cryptographiques solides.

OpenSSL autorise l’utilisateur Ă  indiquer sa propre source d’entropie en utilisant la variable d’environnement "RAND_FILE". Si cette variable n’est pas dĂ©finie, ou si le fichier indiquĂ© ne produit pas assez de caractĂšres alĂ©atoires, OpenSSL lira les donnĂ©es alĂ©atoires du socket EGD indiquĂ© en utilisant cette option.

Si cette option n’est pas indiquĂ©e (et que la commande Ă©quivalente de dĂ©marrage n’est pas utilisĂ©e), EGD n’est jamais contactĂ©. EGD n’est pas nĂ©cessaire sur les systĂšmes Unix modernes qui prennent en charge /dev/urandom .

--no-hsts

wget prend en charge HSTS (HTTP Strict Transport Security, RFC 6797) par dĂ©faut. Utiliser --no-hsts pour faire que wget se comporte comme un UA non compatible avec HSTS. Comme consĂ©quence wget ignorera tous les en-tĂȘtes "Strict-Transport-Security", et ne voudra appliquer aucune politique HSTS existante.

--hsts-file= fichier

Par dĂ©faut, wget stocke sa base de donnĂ©es HSTS dans ˜/.wget-hsts . Vous pouvez utiliser --hsts-file pour Ă©craser cela. wget utilisera le fichier fourni comme base de donnĂ©es HSTS. Un tel fichier doit ĂȘtre conforme au format de base de donnĂ©es HSTS utilisĂ© par wget . Si wget ne peut pas analyser le fichier fourni, le comportement est indĂ©terminĂ©.

La base de donnĂ©es HSTS de wget est un fichier en texte brut. Chaque ligne contient une entrĂ©e HSTS (c’est-Ă -dire le site qui a fourni un en-tĂȘte "Strict-Transport-Security" et a nĂ©anmoins indiquĂ© une politique concrĂšte HSTS Ă  appliquer). Les lignes commençant par un croisillon ("#") sont ignorĂ©es par wget . Veuillez noter qu’en dĂ©pit de cette facilitĂ© de lecture, la crĂ©ation manuelle de la base de donnĂ©es HSTS n’est gĂ©nĂ©ralement pas une bonne idĂ©e.

Une entrée de ligne HSTS consiste en plusieurs champs séparés par un ou plusieurs espaces blancs :

"<hostname> SP [<port>] SP <include subdomains> SP <created> SP <max-age>"

Les champs hostname et port indiquent le nom de l’hĂŽte et le port sur lequel est appliquĂ©e la politique HSTS indiquĂ©e. Le champ port peut ĂȘtre zĂ©ro, et le sera, dans la majoritĂ© des cas. Cela signifie que le numĂ©ro de port ne sera pas pris en compte lors de la dĂ©cision d’appliquer telle ou telle politique HSTS pour une requĂȘte donnĂ©e (seul le nom d’hĂŽte sera Ă©valuĂ©). Lorsque port est diffĂ©rent de zĂ©ro, Ă  la fois le nom d’hĂŽte et le port seront Ă©valuĂ©s et la politique HSTS sera appliquĂ©e si les deux correspondent. Cette option a Ă©tĂ© incluse Ă  des fins de test et de dĂ©veloppement surtout. La suite de tests de wget (dans testenv/ ) crĂ©e des bases de donnĂ©es HSTS avec des ports explicites dans le but d’assurer un comportement correct Ă  wget . L’utilisation de politiques HSTS sur des ports autres que ceux par dĂ©faut est dĂ©conseillĂ©e par la RFC 6797 (voir l’appendice B « Differences between HSTS Policy and Same-Origin Policy »). Ainsi, cette option ne devrait pas ĂȘtre utilisĂ©e dans des environnements en production et le port sera typiquement zĂ©ro. Les trois derniers champs font ce qu’on attend d’eux. Le champ include_subdomains peut ĂȘtre 1 ou 0 et indique si les sous-domaines du domaine cible devraient aussi faire partie de la politique HSTS donnĂ©e. Les champs create et max-age portent l’horodatage de la crĂ©ation de l’entrĂ©e (comme vu par wget ) et la valeur dĂ©finie par HSTS « max-age », qui dĂ©finit combien de temps la politique HSTS devrait rester activĂ©e, mesurĂ© en secondes Ă©coulĂ©es depuis le dĂ©lai stockĂ© dans created . Une fois ce temps Ă©coulĂ©, la politique HSTS ne sera plus valable et sera finalement enlevĂ©e de la base de donnĂ©es.

Si vous fournissez votre propre base de donnĂ©es HSTS Ă  l’aide de --hsts-file , sachez que wget peut modifier le fichier fourni si un changement se produit entre les politiques HSTS demandĂ©es par les serveurs distants et celles du fichier. Quand wget se termine, il met effectivement Ă  jour la base de donnĂ©es HSTS en réécrivant le fichier de base de donnĂ©es avec les nouvelles entrĂ©es.

Si le fichier fourni n’existe pas, wget en crĂ©era un. Ce fichier contiendra les nouvelles entrĂ©es HSTS. Si aucune entrĂ©e HSTS n’a Ă©tĂ© crĂ©e (aucun en-tĂȘte "Strict-Transport-Security" n’a Ă©tĂ© envoyĂ© par aucun des serveurs) alors aucun fichier n’est créé, mĂȘme pas un vide. Ce comportement s’applique aussi au fichier de base de donnĂ©es par dĂ©faut ( ˜/.wget-hsts ) : il ne sera pas créé, sauf par un serveur qui force la politique HSTS.

L’attention est mise sur le fait de ne pas Ă©craser de possibles changements faits par d’autres wget au mĂȘme moment sur la base de donnĂ©es HSTS. Avant de dĂ©poser les entrĂ©es HSTS mises Ă  jour dans le fichier, wget le relit et fusionne les modifications.

Il est dĂ©conseillĂ© d’utiliser une base de donnĂ©es HSTS personnalisĂ©e ou de modifier une base existante. Pour plus d’informations sur les menaces de sĂ©curitĂ© potentielles dĂ©coulant d’une telle pratique, consultez la section 14 « ConsidĂ©rations de sĂ©curité » de la RFC 6797 en particulier la section 14.9 « Manipulation crĂ©ative du stockage de politique HSTS  ».

--warc-file= fichier

Utiliser fichier comme fichier WARC de destination.

--warc-header= chaĂźne

Utiliser chaüne dans l’enregistrement warcinfo.

--warc-max-size= taille

Définir la taille maximale des fichiers WARC à taille .

--warc-cdx

Écrire les fichiers index CDX.

--warc-dedup= fichier

Ne pas conserver les documents répertoriés dans ce fichier CDX.

--no-warc-compression

Ne pas compresser les fichiers WARC avec GZIP.

--no-warc-digests

Ne pas calculer les sommes de contrĂŽle SHA1.

--no-warc-keep-log

Ne pas stocker le fichier journal dans un enregistrement WARC.

--warc-tempdir= répertoire

Indiquer l’emplacement des fichiers temporaires créés par le rĂ©dacteur WARC.

Options FTP

--ftp-user= utilisateur
--ftp-password=
mot_de_passe

Indiquer le nom de l’utilisateur utilisateur et le mot de passe mot_de_passe sur un serveur FTP. Sans cela ou l’option de dĂ©marrage adĂ©quate, le mot de passe par dĂ©faut est -wget@ , normalement utilisĂ© pour un FTP anonyme.

Le nom d’utilisateur et le mot de passe peuvent ĂȘtre indiquĂ©s diffĂ©remment dans l’URL. Chaque mĂ©thode rĂ©vĂšle votre mot de passe Ă  quiconque se donne la peine d’exĂ©cuter "ps". Pour empĂȘcher que vos mots de passe soient vus, stockez les dans .wgetrc ou .netrc , et assurez-vous de protĂ©ger ces fichiers des autres utilisateurs avec "chmod". Si les mots de passe sont trĂšs importants, vous ne devriez pas les laisser traĂźner dans ces fichiers non plus (Ă©ditez les fichiers et effacez les aprĂšs que wget ait commencĂ© le tĂ©lĂ©chargement).

--no-remove-listing

Ne pas supprimer les fichiers temporaires .listing gĂ©nĂ©rĂ©s par les rĂ©cupĂ©rations FTP. Normalement, ces fichiers contiennent les listings bruts de rĂ©pertoires reçus des serveurs FTP. Ne pas les supprimer peut ĂȘtre utile pour des objectifs de dĂ©bogage, ou quand vous voulez ĂȘtre facilement capable de vĂ©rifier le contenu des rĂ©pertoires du serveur distant (par exemple, pour vĂ©rifier que le miroir que vous lancez est complet).

Remarquez que mĂȘme si wget Ă©crit dans un nom de fichier connu pour ce fichier, ce n’est pas une faille de sĂ©curitĂ© dans le scĂ©nario d’un utilisateur faisant de .listing un lien symbolique vers /etc/passwd ou autre et demandant Ă  "root" d’exĂ©cuter wget dans son rĂ©pertoire. Selon les options utilisĂ©es, soit wget refusera d’écrire dans .listing , faisant Ă©chouer l’opĂ©ration de globbing/rĂ©cursion/horodatage, soit le lien symbolique sera supprimĂ© et remplacĂ© par le fichier .listing rĂ©el, soit le listing sera Ă©crit dans un fichier .listing.numĂ©ro .

MĂȘme dans cette situation, cela n’est pas un problĂšme, bien que, "root" ne devrait jamais lancer wget dans un rĂ©pertoire utilisateur non sĂ©curisĂ©. Un utilisateur pourrait faire quelque chose d’aussi simple qu’un lien de index.html Ă  /etc/passwd et demander Ă  "root" de lancer wget avec -N ou -r et ainsi Ă©craser le fichier.

--no-glob

DĂ©sactiver le globbing FTP. Globbing (englober) rĂ©fĂšre Ă  l’utilisation de caractĂšres spĂ©ciaux ( jokers ) Ă  la façon du shell, tels que * , ? , [ et ] pour retrouver plus d’un fichier dans le mĂȘme rĂ©pertoire en une fois, comme :

wget ftp://gnjilux.srk.fer.hr/*.msg

Par dĂ©faut, la fonction de globbing est activĂ©e si l’URL contient un caractĂšre de globbing. Cette option peut ĂȘtre utilisĂ©e pour activer ou dĂ©sactiver le globbing de maniĂšre permanente.

Vous devrez peut-ĂȘtre mettre entre guillemets l’URL pour le protĂ©ger de l’expansion par votre interprĂ©teur de commandes. Le globbing fait que wget cherche une liste de rĂ©pertoires, ce qui est spĂ©cifique au systĂšme. C’est pourquoi cela ne fonctionne actuellement qu’avec les serveurs FTP Unix (et ceux qui Ă©mulent la sortie "ls" d’Unix).

--no-passive-ftp

DĂ©sactiver l’utilisation du mode de transfert FTP passif . Le mode FTP passif implique que le client se connecte au serveur pour Ă©tablir la connexion de donnĂ©es plutĂŽt que l’inverse.

Si la machine est connectĂ©e directement Ă  Internet, FTP actif et passif devraient fonctionner aussi bien l’un que l’autre. DerriĂšre la plupart des configurations de pare-feu et de NAT, le FTP passif a plus de chance de fonctionner. Cependant, dans certaines configurations rares de pare-feu, le FTP actif fonctionne alors que le FTP passif ne fonctionne pas. Si vous pensez que c’est le cas, utilisez cette option, ou dĂ©finissez "passive_ftp=off" dans votre fichier init.

--preserve-permissions

Préserver les permissions de fichiers distants au lieu des permissions définies par umask.

--retr-symlinks

Par dĂ©faut, lors de la rĂ©cupĂ©ration rĂ©cursive des rĂ©pertoires FTP et qu’un lien symbolique est rencontrĂ©, le lien symbolique est suivi et les fichiers pointĂ©s sont rĂ©cupĂ©rĂ©s. Actuellement, wget ne suit pas les liens symboliques pour tĂ©lĂ©charger les rĂ©pertoires rĂ©cursivement, bien que cette option pourrait ĂȘtre ajoutĂ©e dans le futur.

Lorsque --retr-symlinks=no est indiquĂ©, le fichier pointĂ© n’est pas tĂ©lĂ©chargĂ©. À la place, un lien symbolique correspondant est créé sur le systĂšme de fichiers local. Le fichier pointĂ© ne sera pas rĂ©cupĂ©rĂ© sauf si la rĂ©cupĂ©ration rĂ©cursive le rencontre autrement et le tĂ©lĂ©charge de toutes façons. Cette option pose un risque de sĂ©curitĂ© oĂč un serveur FTP malveillant pourrait amener wget Ă  Ă©crire dans des fichiers situĂ©s en dehors des rĂ©pertoires prĂ©vus par le biais d’un fichier .LISTING spĂ©cialement contrefait.

Notez que cette option n’a aucun effet lors de la rĂ©cupĂ©ration d’un fichier (pas d’un rĂ©pertoire) parce qu’il a Ă©tĂ© indiquĂ© dans la ligne de commandes plutĂŽt que trouvĂ© par rĂ©cursion. Les liens symboliques sont toujours suivis dans ce cas.

Options FTPS

--ftps-implicit

Cette option indique Ă  wget d’utiliser FTPS implicitement. FTPS implicite consiste Ă  initialiser SSL/TLS au tout dĂ©but de la connexion de contrĂŽle. Cette option n’envoie pas de commande "AUTH TLS" : elle prĂ©sume que le serveur parle FTPS et dĂ©marre directement une connexion SSL/TLS. Si la tentative rĂ©ussit, la session continue juste comme FTPS normal ("PBSZ" et "PROT" sont envoyĂ©s, etc). FTPS implicite n’est plus un prĂ©requis pour les implĂ©mentations FTPS, donc beaucoup de serveurs ne le prennent pas en charge. Si --ftps-implicit est passĂ© et qu’aucun numĂ©ro de port explicite n’est indiquĂ©, le port par dĂ©faut pour le FTPS implicite, 1990, sera utilisĂ©, au lieu du port par dĂ©faut pour le FTPS « normal » (explicite), qui est le mĂȘme que celui pour FTP, 21.

--no-ftps-resume-ssl

Ne pas reprendre la session SSL/TLS dans le canal de donnĂ©es. Lors du dĂ©marrage d’une connexion de donnĂ©es, wget essaiera de reprendre la session SSL/TLS prĂ©cĂ©demment dĂ©marrĂ©e dans la connexion de contrĂŽle. La reprise de session SSL/TLS Ă©vite d’effectuer une poignĂ©e de main entiĂšrement nouvelle en rĂ©utilisant les paramĂštres SSL/TLS d’une session prĂ©cĂ©dente. Habituellement, les serveurs FTPS souhaitent cela, aussi wget le fait par dĂ©faut. Dans de rares circonstances nĂ©anmoins, il serait possible de souhaiter dĂ©marrer une session SSL/TLS entiĂšrement nouvelle Ă  chaque connexion de donnĂ©es. C’est Ă  cela que --no-ftps-resume-ssl est destinĂ©.

--ftps-clear-data-connection

Toutes les connexions de donnĂ©es seront en texte brut. Seule la connexion de contrĂŽle sera sous SSL/TLS. wget enverra une commande "PROT C" pour rĂ©aliser cela, ce qui doit ĂȘtre approuvĂ© par le serveur.

--ftps-fallback-to-ftp

Revenir Ă  FTP si FTPS n’est pas pris en charge par le serveur cible. Pour des raisons de sĂ©curitĂ©, cette option n’est pas dĂ©clarĂ©e par dĂ©faut. Le comportement par dĂ©faut est de quitter avec une erreur. Si un serveur ne rĂ©pond pas avec succĂšs Ă  la commande initiale "AUTH TLS", ou dans le cas du FTPS, implicite si la tentative de connexion SSL/TLS initiale est rejetĂ©e, on considĂšre ce serveur comme ne prenant pas en charge FTPS.

Options de récupération récursive

-r

--recursive

Activer la récupération récursive. La profondeur maximale par défaut est 5 .

-l profondeur
--level=
profondeur

DĂ©finir le nombre maximal de sous-rĂ©pertoires dans lesquels wget fera une rĂ©cursion Ă  profondeur . Dans le but d’éviter de tĂ©lĂ©charger de trĂšs grands sites web, lors de l’utilisation de la rĂ©cursion, cela est limitĂ© Ă  une profondeur de 5 par dĂ©faut, c’est Ă  dire qu’il traversera au plus 5 rĂ©pertoires en profondeur en commençant Ă  l’URL fournie. Indiquer -l 0 ou -l inf pour une profondeur de rĂ©cursion infinie.

wget -r -l 0 http://<site>/1.html

IdĂ©alement, on pourrait s’attendre Ă  ce que cela ne tĂ©lĂ©charge que 1.html , mais malheureusement ce n’est pas le cas, car -l 0 est Ă©quivalent Ă  -l inf (ce qui est la rĂ©cursion infinie). Pour tĂ©lĂ©charger une seule page HTML (ou quelques pages), indiquez les sur la ligne de commande et dĂ©laissez -r et -l . Pour tĂ©lĂ©charger les Ă©lĂ©ments essentiels Ă  l’affichage d’une seule page HTML, consulter page requisites .

--delete-after

Cette option indique Ă  wget de supprimer chaque fichier qu’il tĂ©lĂ©charge, aprĂšs l’avoir fait. Elle est utile pour prĂ©charger des pages populaires Ă  travers un mandataire, par exemple :

wget -r -nd --delete-after http://toto.com/˜page/populaire/

L’option -r est pour rĂ©cupĂ©rer rĂ©cursivement et -nd pour ne pas crĂ©er de rĂ©pertoires.

Remarquez que --delete-after efface les fichiers sur la machine locale. Cela n’émet pas la commande DELE pour les sites FTP distants, par exemple. Notez aussi que lorsque --delete-after est indiquĂ©, --convert-links est ignorĂ©, ainsi les fichiers .orig ne sont tout simplement pas créés en premier lieu.

-k

--convert-links

Une fois le téléchargement terminé, convertir les liens du document pour les rendre adaptés à un affichage local. Cela concerne non seulement les hyperliens visibles, mais aussi toute partie du document qui renvoie à un contenu externe, comme les images intégrées, les liens vers des feuilles de style, les hyperliens vers du contenu non HTML, etc.

Chaque lien sera changĂ© d’une maniĂšre ou d’une autre :

-

Les liens vers les fichiers qui ont Ă©tĂ© tĂ©lĂ©chargĂ©s par wget seront modifiĂ©s pour faire rĂ©fĂ©rence au fichier qu’ils pointent comme lien relatif.

Exemple : si le fichier téléchargé /toto/doc.html pointe vers /machin/img.gif aussi téléchargé, alors le lien dans doc.html sera modifié pour pointer vers ../machin/img.gif . Ce genre de transformation fonctionne pour relier des combinaisons arbitraires de répertoires.

-

Les liens des fichiers qui n’ont pas Ă©tĂ© tĂ©lĂ©chargĂ©s par wget seront modifiĂ©s pour inclure le nom d’hĂŽte et le chemin absolu de l’emplacement vers lequel ils pointent.

Exemple : si le fichier téléchargé /toto/doc.html pointe vers /machin/img.gif (ou vers ../machin/img.gif ), alors le lien dans doc.html sera modifié pour pointer vers http://nomdhÎte/machin/img.gif .

De ce fait, la navigation locale fonctionne de maniĂšre fiable : si un fichier liĂ© a Ă©tĂ© tĂ©lĂ©chargĂ©, le lien renverra Ă  son nom local ; s’il n’a pas Ă©tĂ© tĂ©lĂ©chargĂ©, le lien renverra Ă  son adresse Internet complĂšte plutĂŽt que de prĂ©senter un lien brisĂ©. Le fait que les anciens liens soient convertis en liens relatifs garantit que vous pouvez dĂ©placer la hiĂ©rarchie tĂ©lĂ©chargĂ©e vers un autre rĂ©pertoire.

Notez que ce n’est qu’à la fin du tĂ©lĂ©chargement que wget peut savoir quels liens ont Ă©tĂ© tĂ©lĂ©chargĂ©s. De ce fait, le travail effectuĂ© par -k sera rĂ©alisĂ© Ă  la fin de tous les tĂ©lĂ©chargements.

--convert-file-only

Cette option ne convertit que la partie nom de fichier des URL, laissant le reste des URL intactes. La partie nom de fichier réfÚre parfois au « nom de base », mais nous éludons ce terme ici pour ne pas créer de confusion.

Cela fonctionne particuliĂšrement bien en conjonction avec --adjust-extension , mĂȘme si ce couplage n’est pas appliquĂ©. Cela est utile pour alimenter les caches Internet avec des fichiers tĂ©lĂ©chargĂ©s Ă  partir de diffĂ©rents hĂŽtes.

Exemple : si un lien pointe vers //toto.com/machin.cgi?xyz avec --adjust-extension activĂ© et sa destination locale Ă©tant prĂ©vue d’ĂȘtre /toto.com/machin.cgi?xyz.css , alors le lien devrait ĂȘtre converti en //toto.com/machin.cgi?xyz.css . Remarquez que seule la partie nom de fichier a Ă©tĂ© modifiĂ©e. Le reste de l’URL n’a pas Ă©tĂ© touchĂ©, y compris le chemin de rĂ©seau ("//") qui aurait dĂ» autrement ĂȘtre traitĂ© par wget et converti en schĂ©ma effectif (c’est Ă  dire "http://").

-K

--backup-converted

Lors de la conversion d’un fichier, sauvegarder la version d’origine avec un suffixe .orig . Cela a un effet sur le comportement de -N .

-m

--mirror

Activer les options adaptĂ©es Ă  la crĂ©ation de mirroir. Cette option active la rĂ©cursion et l’horodatage, dĂ©finit la profondeur de la rĂ©cursion infinie et garde les listes du rĂ©pertoire FTP. C’est actuellement l’équivalent de -r -N -l inf --no-remove-listing .

-p

--page-requisites

Cette option force wget à télécharger tous les fichiers qui sont nécessaires pour afficher correctement une page HTML donnée. Cela comprend des éléments tels que les images et les sons intégrés, ainsi que les feuilles de style référencées.

Normalement, lors du tĂ©lĂ©chargement d’une seule page HTML, les documents nĂ©cessaires Ă  son affichage ne sont pas tĂ©lĂ©chargĂ©s. Utiliser -r associĂ© Ă  -l peut aider, comme wget ne distingue pas d’ordinaire les documents externes de ceux internes, on se retrouve gĂ©nĂ©ralement avec des « documents feuilles » Ă  qui manquent les Ă©lĂ©ments requis.

Par exemple, le document 1.html contient une Ă©tiquette "<IMG>" rĂ©fĂ©rençant 1.gif et une Ă©tiquette "<A>" pointant vers le document externe 2.html . Disons que 2.html est similaire mais que son image est 2.gif et qu’elle pointe vers 3.html . Disons que cela continue jusqu’à un nombre arbitrairement Ă©levĂ©.

Si on exécute la commande :

wget -r -l 2 http://<site>/1.html

alors 1.html , 1.gif , 2.html , 2.gif , et 3.html seront tĂ©lĂ©chargĂ©s. Comme vous pouvez voir, 3.html est sans son requis 3.gif parce que wget compte juste le nombre de bonds (jusqu’à deux) en dehors de 1.html pour dĂ©terminer oĂč arrĂȘter la rĂ©cursion. De toute façon, avec cette commande :

wget -r -l 2 -p http://<site>/1.html

tous les fichiers au-dessus et le fichier 3.gif nĂ©cessaire Ă  3.html seront tĂ©lĂ©chargĂ©s. De mĂȘme,

wget -r -l 1 -p http://<site>/1.html

entraßnera le téléchargement de 1.html , 1.gif , 2.html et 2.gif . On pourrait penser que :

wget -r -l 0 -p http://<site>/1.html

ne tĂ©lĂ©chargera que 1.html et 1.gif , mais malheureusement ce n’est pas le cas, car -l 0 est Ă©quivalent Ă  -l inf (qui est la rĂ©cursion infinie). Pour tĂ©lĂ©charger une seule page HTML (ou une poignĂ©e d’entre elles, toutes indiquĂ©es sur la ligne de commande ou dans un fichier d’entrĂ©e -i URL ) et son (ou ses) Ă©lĂ©ments requis, enlevez simplement -r et -l :

wget -p http://<site>/1.html

Notez que wget se comportera comme si -r avait Ă©tĂ© spĂ©cifiĂ©, mais seule cette page unique et ses Ă©lĂ©ments requis seront tĂ©lĂ©chargĂ©s. Les liens de cette page vers des documents externes ne seront pas suivis. Actuellement, pour tĂ©lĂ©charger une seule page et ses Ă©lĂ©ments requis (mĂȘme s’ils existent sur d’autres sites web), et s’assurer que le lot s’affiche correctement localement, cet auteur aime utiliser quelques options en plus de -p :

wget -E -H -k -K -p http://<site>/<document>

Pour terminer ce sujet, il est utile de savoir que l’idĂ©e que wget se fait d’un lien vers un document externe est toute URL spĂ©cifiĂ©e dans une Ă©tiquette "<A>", une Ă©tiquette "<AREA>" ou une Ă©tiquette "<LINK>" autre que "<LINK REL="stylesheet">".

--strict-comments

Activer l’analyse stricte des commentaires HTML. Par dĂ©faut cela arrĂȘte les commentaires Ă  la premiĂšre occurrence de --> .

Selon les spĂ©cifications, les commentaires HTML sont exprimĂ©s en tant que declarations SGML. La dĂ©claration est un marqueur spĂ©cial commençant par <! et finissant par > , comme <!DOCTYPE...> , qui peut contenir des commentaires entre une paire de dĂ©limiteurs -- . Les commentaires HTML sont des « dĂ©clarations vides », des dĂ©clarations SGML sans aucun texte qui ne soit pas un commentaire. Par consĂ©quent, <!--toto--> est un commentaire valable, et aussi <!--un --deux--> , mais <!--1--2--> n’en est pas un.

D’autre part, la plupart des rĂ©dacteurs de HTML ne perçoivent pas les commentaires comme autre chose que du texte dĂ©limitĂ© par <!-- et --> , ce qui n’est pas tout Ă  fait la mĂȘme chose. Par exemple, quelque chose comme <!------------> fonctionne comme un commentaire valable tant que le nombre de tirets est un multiple de quatre (!). Sinon, le commentaire dure techniquement jusqu’au prochain -- , qui peut se trouver Ă  l’autre bout du document. À cause de cela, beaucoup de navigateurs populaires ignorent totalement la spĂ©cification et mettent en Ɠuvre ce que l’utilisateur attend : des commentaires dĂ©limitĂ©s par <!-- et --> .

Jusqu’à la version 1.9, wget interprĂ©tait les commentaires de façon stricte, ce qui aboutissait en des liens manquants dans plusieurs pages web qui s’affichaient bien dans les navigateurs, mais avaient la malchance de contenir des commentaires non conformes. À partir de la version 1.9, wget a rejoint les rangs des clients qui implĂ©mentent des commentaires « naĂŻfs », terminant chaque commentaire Ă  la premiĂšre occurrence de --> .

Si, pour une raison quelconque, vous voulez une analyse stricte des commentaires, utilisez cette option pour l’activer.

Options accepter/rejeter de maniÚre récursive

-A liste_acceptation --accept liste_acceptation
-R
liste_rejet --reject liste_rejet

SpĂ©cifier des listes de suffixes ou de modĂšles de noms de fichiers, sĂ©parĂ©s par des virgules, Ă  accepter ou Ă  rejeter. Prenez en compte que tout caractĂšre joker * , ? , [ ou ] apparaissant dans un Ă©lĂ©ment de liste_acceptation ou liste_rejet sera traitĂ© comme un motif, plutĂŽt que comme un suffixe. Dans ce cas, vous devez l’enclore de guillemets pour empĂȘcher votre interprĂ©teur de commande de l’étendre, comme dans -A "*.mp3 ou -A ’*.mp3’ .

--accept-regex urlregex
--reject-regex
urlregex

Indiquer une expression rationnelle pour accepter ou rejeter l’URL entiùre.

--regex-type regextype

Indiquer le type d’expression rationnelle. Les types possibles sont posix ou pcre . Veuillez noter que pour pouvoir utiliser le type pcre , wget doit avoir Ă©tĂ© compilĂ© avec la prise en charge de libpcre.

-D liste_domaine
--domains=
liste_domaine

DĂ©signer les domaines Ă  suivre. liste_domaine est une liste de domaines sĂ©parĂ©s par des virgules. Cela n’active pas -H .

--exclude-domains liste_domaine

Indiquer les domaines Ă  ne pas suivre.

--follow-ftp

Suivre les liens FTP des documents HTML. Sans cette option, wget ignorera tous les liens FTP.

--follow-tags= liste

wget a une table interne de paires d’étiquette/attribut HTML qu’il examine lorsqu’il cherche des documents liĂ©s lors d’une rĂ©cupĂ©ration rĂ©cursive. Cependant, si un utilisateur souhaite que seul un sous-ensemble de ces Ă©tiquettes soit pris en compte, il doit spĂ©cifier ces Ă©tiquettes dans une liste sĂ©parĂ©e par des virgules avec cette option.

--ignore-tags= liste

C’est l’opposĂ© de l’option --follow-tags . Pour ignorer certaines Ă©tiquettes HTML lors de la recherche rĂ©cursive de documents Ă  tĂ©lĂ©charger, indiquez-les dans une liste sĂ©parĂ©e par des virgules.

Dans le passé, cette option était la meilleure solution pour télécharger une seule page et ses éléments requis, en utilisant une ligne de commande comme :

wget --ignore-tags=a,area -H -k -K -r http://<site>/<document>

Cependant, l’auteur de cette option a trouvĂ© une page avec des Ă©tiquettes comme "<LINK REL="home" HREF="/">" et a rĂ©alisĂ© que spĂ©cifier les Ă©tiquettes Ă  ignorer n’était pas suffisant. On ne peut pas simplement dire Ă  wget d’ignorer "<LINK>", car les feuilles de style ne seront pas tĂ©lĂ©chargĂ©es. Maintenant la meilleure solution pour tĂ©lĂ©charger une seule page et son nĂ©cessaire reste l’option --page-requisites .

--ignore-case

Ignorer la casse pour la correspondance des fichiers et des rĂ©pertoires. Cela influence le comportement des options -R , -A , -I et -X , ainsi que le globbing mis en Ɠuvre lors du tĂ©lĂ©chargement Ă  partir de sites FTP. Par exemple, avec cette option, -A *.txt fera correspondre fichier1.txt , mais aussi fichier2.TXT , fichier3.TxT , et ainsi de suite. Les guillemets dans l’exemple sont lĂ  pour empĂȘcher l’interprĂ©teur de commandes de dĂ©velopper le motif.

-H

--span-hosts

Activer l’extension entre les hĂŽtes lors de la rĂ©cupĂ©ration rĂ©cursive.

-L

--relative

Suivre uniquement les liens relatifs. Utile pour retrouver une page d’accueil spĂ©cifique sans aucun Ă©garement, mĂȘme pas celui dans les mĂȘmes hĂŽtes.

-I liste
--include-directories=
liste

Indiquer une liste de répertoires séparés par des virgules que vous voudriez suivre lors du téléchargement. Les éléments de la liste peuvent contenir des jokers.

-X liste
--exclude-directories=
liste

Indiquer une liste de répertoires séparés par des virgules que vous voudriez exclure du téléchargement. Les éléments de la liste peuvent contenir des jokers.

-np

--no-parent

Ne jamais monter dans le rĂ©pertoire parent lors d’une rĂ©cupĂ©ration rĂ©cursive. C’est une option utile, vu qu’elle garantit que seuls les fichiers en dessous d’une certaine hiĂ©rarchie seront tĂ©lĂ©chargĂ©s.

ENVIRONNEMENT

wget prend en charge les mandataires Ă  la fois pour les rĂ©cupĂ©rations HTTP et FTP. La façon normale d’indiquer l’emplacement des mandataires, reconnus par wget , est d’utiliser les variables d’environnement suivantes :
http_proxy
https_proxy

Si définies, les variables http_proxy et https_proxy devraient contenir les URL des mandataires pour les connexions HTTP et HTTPS respectivement.

ftp_proxy

Cette variable devrait contenir l’URL du mandataire pour les connexions FTP. Il est assez habituel que http_proxy et ftp_proxy soient dĂ©finis Ă  la mĂȘme URL.

no_proxy

Cette variable devrait contenir une liste de mandataires d’extensions de domaine sĂ©parĂ©es par des virgules pour lesquelles le mandataire ne devrait pas ĂȘtre utilisĂ©. Par exemple, si la valeur de no_proxy est .mit.edu , le mandataire ne sera pas utilisĂ© pour rĂ©cupĂ©rer des documents de MIT.

CODE DE RETOUR

wget peut renvoyer l’un des diffĂ©rents codes d’erreur s’il rencontre des problĂšmes.

0

Aucun problĂšme.

1

Code d’erreur gĂ©nĂ©rique.

2

Erreur d’analyse - par exemple, lors de l’analyse des options de la ligne de commande, des fichiers .wgetrc ou .netrc ...

3

Erreur d’entrĂ©es/sorties du fichier.

4

Échec du rĂ©seau.

5

Échec de la vĂ©rification SSL.

6

Échec de l’authentification du nom d’utilisateur ou du mot de passe.

7

Erreurs de protocole.

8

Le serveur a Ă©mis une rĂ©ponse d’erreur.

À l’exception de 0 et 1 , les codes de retour les moins Ă©levĂ©s sont prioritaires par rapport aux plus Ă©levĂ©s lorsque plusieurs types d’erreurs sont rencontrĂ©s.

Dans les versions de wget antĂ©rieures Ă  la 1.12, les codes de retour de wget tendaient Ă  n’ĂȘtre d’aucune utilitĂ© et incohĂ©rents. Les tĂ©lĂ©chargements rĂ©cursifs auraient toujours renvoyĂ© 0 (succĂšs), sans tenir compte des problĂšmes rencontrĂ©s, et les recherches non rĂ©cursives ne renvoyaient que l’état correspondant Ă  la derniĂšre tentative de tĂ©lĂ©chargement.

FICHIERS

/etc/wgetrc

L’emplacement par dĂ©faut du fichier de dĂ©marrage global .

.wgetrc

Fichier de dĂ©marrage de l’utilisateur.

BOGUES

Vous ĂȘtes les bienvenus pour soumettre des rapports de bogue Ă  l’aide du systĂšme de suivi de bogue de GNU Wget (voir < https://savannah.gnu.org/bugs/?func=additem&group=wget >) ou de la liste de diffusion < bug-wget@gnu.org >.

Visitez < https://lists.gnu.org/mailman/listinfo/bug-wget > pour obtenir plus d’informations (comment souscrire, les archives de la liste, ...).

Avant de soumettre un rapport de bogue, veuillez essayer de suivre quelques principes simples.

1.

Essayez de vĂ©rifier que le comportement que vous observez est bien un bogue. Si wget se plante, c’est un bogue. Si wget ne se comporte pas comme indiquĂ© dans la documentation, c’est un bogue. Si les choses fonctionnent bizarrement, mais que vous n’ĂȘtes pas sĂ»r de la maniĂšre dont elles sont supposĂ©es fonctionner, cela pourrait bien ĂȘtre un bogue, mais vous devriez faire une double vĂ©rification dans la documentation et dans les listes de diffusion.

2.

Essayez de rĂ©pĂ©ter le bogue dans des circonstances aussi simples que possible. Par exemple, si wget plante lors du tĂ©lĂ©chargement wget -rl0 -kKE -t5 --no-proxy http://example.com -o /tmp/log , vous devriez essayer de voir si le plantage est reproductible, et si cela n’arrive qu’avec un jeu d’options plus rĂ©duit. Vous pouvez mĂȘme essayer de lancer le tĂ©lĂ©chargement Ă  partir de la page oĂč le plantage s’est produit pour voir si cette page a dĂ©clenchĂ© le plantage d’une maniĂšre ou d’une autre.

De plus, bien que je serais intĂ©ressĂ© par le contenu de votre fichier .wgetrc , l’intĂ©grer simplement dans le message de dĂ©bogage est probablement une mauvaise idĂ©e. À la place, vous devriez d’abord essayer de voir si le bogue se rĂ©pĂšte avec un .wgetrc retirĂ© de son emplacement. C’est seulement s’il s’avĂšre que les paramĂštres de .wgetrc affectent le bogue, que vous devriez m’envoyer les parties pertinentes du fichier.

3.

Merci de dĂ©marrer wget avec l’option -d et envoyez-nous le rĂ©sultat de la sortie (ou des parties pertinentes de celle-ci). Si wget a Ă©tĂ© compilĂ© sans la gestion du dĂ©bogage, recompilez-le -- il est beaucoup plus simple de suivre les bogues avec la prise en charge du dĂ©bogage activĂ©e.

Note : merci de veiller Ă  supprimer toute information potentiellement sensible du journal de dĂ©bogage avant de l’envoyer Ă  l’adresse pour les bogues. Le "-d" ne se dĂ©mĂšnera pas pour collecter des informations sensibles, mais le journal contiendra une transcription assez complĂšte de la communication de wget avec le serveur, qui peut inclure des mots de passe et des Ă©lĂ©ments de donnĂ©es tĂ©lĂ©chargĂ©s. Comme l’adresse pour les bogues est publiquement archivĂ©e, vous devez comprendre que tous les rapports de bogue sont visibles du public.

4.

Si wget a plantĂ©, essayez de l’exĂ©cuter dans un outil de dĂ©bogage, par exemple, "gdb `which wget` core" et tapez "where" pour en garder une sauvegarde. Cela peut ne pas fonctionner si l’administrateur systĂšme a dĂ©sactivĂ© les fichiers core, mais on peut essayer en toute sĂ©curitĂ©.

VOIR AUSSI

Cela n’est pas le manuel complet de GNU Wget. Pour des informations plus complĂštes, comprenant plus d’explications dĂ©taillĂ©es de certaines des options, et un nombre de commandes Ă  utiliser avec les fichiers .wgetrc et l’option -e , consulter l’entrĂ©e de GNU Info pour wget .

Voir aussi wget2 (1), la version mise à jour de GNU Wget avec une prise en charge encore meilleure du téléchargement récursif et des protocoles modernes tels que HTTP/2.

AUTEUR

Écrit Ă  l’origine par Hrvoje Niki <hniksic@xemacs.org>. Actuellement maintenu par Darshit Shah <darnir@gnu.org> et Tim RĂŒhsen <tim.ruehsen@gmx.de>.

COPYRIGHT

Copyright (c) 1996--2011, 2015, 2018--2024 Free Software Foundation, Inc.

Autorisation est donnée de copier, distribuer et/ou modifier ce document sous les termes de la licence GNU Free Documentation License, version 1.3 ou ultérieure publiée par la fondation Free Software Foundation, sans sections invariantes, sans texte de couverture et sans texte de dos de couverture. Une copie de la licence figure dans la section « GNU Free Documentation License ».

TRADUCTION

La traduction française de cette page de manuel a Ă©tĂ© créée par SĂ©bastien Blanchet, Éric Piel <eric.piel@tremplin-utc.net> et bubu <bubub@no-log.org>

Cette traduction est une documentation libre ; veuillez vous reporter à la GNU General Public License version 3 concernant les conditions de copie et de distribution. Il n’y a aucune RESPONSABILITÉ LÉGALE.

Si vous découvrez un bogue dans la traduction de cette page de manuel, veuillez envoyer un message à debian-l10n-french@lists.debian.org .