Man page - wget(1)
Packages contains this manual
Available languages:
en fr pl roManual
WGET
NOMSYNOPSIS
DESCRIPTION
OPTIONS
Syntaxe dâoption
Options de base pour démarrer
Options de journalisation et de fichier dâentrĂ©e
Options de téléchargement
Options de répertoire
Options HTTP
Options HTTPS (SSL/TLS)
Options FTP
Options FTPS
Options de récupération récursive
Options accepter/rejeter de maniÚre récursive
ENVIRONNEMENT
CODE DE RETOUR
FICHIERS
BOGUES
VOIR AUSSI
AUTEUR
COPYRIGHT
TRADUCTION
NOM
Wget - Lâoutil de tĂ©lĂ©chargement rĂ©seau non interactif.
SYNOPSIS
wget [ option ]... [ URL ]...
DESCRIPTION
GNU Wget est un utilitaire libre pour le téléchargement non interactif de fichiers sur le Web. Il prend en charge les protocoles HTTP, HTTPS, et FTP, ainsi que le téléchargement au travers des mandataires HTTP.
Wget est non interactif, câest-Ă -dire quâil peut travailler en arriĂšre-plan, sans intervention de lâutilisateur. Cela permet de lancer un tĂ©lĂ©chargement et de se dĂ©connecter du systĂšme, laissant wget finir le travail. En revanche, la plupart des navigateurs Web requiĂšrent la prĂ©sence constante de lâutilisateur, ce qui est particuliĂšrement pĂ©nible lorsquâil y a beaucoup de donnĂ©es Ă transfĂ©rer.
wget peut suivre les liens des pages HTML et XHTML, et CSS, pour crĂ©er des copies locales de sites web distants, en rĂ©crĂ©ant complĂštement la structure du site original. Cela est parfois dĂ©signĂ© sous le nom de « tĂ©lĂ©chargement rĂ©cursif ». En faisant cela, wget respecte le standard dâexclusion de robots ( /robots.txt ). wget peut aussi ĂȘtre chargĂ© de convertir les liens dans les fichiers tĂ©lĂ©chargĂ©s pour pointer sur des fichiers locaux, pour une consultation hors-ligne.
wget a Ă©tĂ© conçu pour ĂȘtre robuste en dĂ©pit des connexions rĂ©seaux lentes ou instables ; si un tĂ©lĂ©chargement Ă©choue suite Ă un problĂšme rĂ©seau, il rĂ©essayera jusquâĂ ce que lâintĂ©gralitĂ© du fichier soit rĂ©cupĂ©rĂ©e. Si le serveur gĂšre la reprise, il lui demandera de reprendre lĂ oĂč le tĂ©lĂ©chargement sâest interrompu.
OPTIONS
Syntaxe dâoption
Comme wget utilise GNU getopt pour traiter les arguments de la ligne de commande, chaque option a une forme longue en plus de la forme courte. Les options longues sont plus pratiques Ă retenir, mais prennent du temps Ă taper. Vous ĂȘtes libre de mĂ©langer diffĂ©rentes formes dâoptions, ou dâindiquer les options aprĂšs les arguments de la ligne de commande. Ainsi, vous pouvez Ă©crire :
wget -r --tries=10 http://fly.srk.fer.hr/ -o log
Lâespace entre lâoption acceptant un argument et lâargument peut ĂȘtre omise. Vous pouvez Ă©crire -olog au lieu de -o log .
Vous pouvez mettre ensemble plusieurs options ne nĂ©cessitant pas dâarguments, comme :
wget -drc <URL>
Cela est absolument équivalent à  :
wget -d -r -c <URL>
Comme les options peuvent ĂȘtre indiquĂ©es aprĂšs les arguments, vous pouvez les terminer avec -- . Ainsi, ce qui suit va essayer de tĂ©lĂ©charger URL -x , en signalant lâĂ©chec Ă log :
wget -o log -- -x
Les options qui acceptent des listes sĂ©parĂ©es par des virgules respectent toutes la convention selon laquelle spĂ©cifier une liste vide efface sa valeur. Cela peut ĂȘtre utile pour nettoyer les rĂ©glages de .wgetrc . Par exemple, si .wgetrc indique "exclude_directories" Ă /cgi-bin , lâexemple suivant le rĂ©initialisera dâabord, puis lui indiquera dâexclure /Ënobody et /Ësomebody . Vous pouvez aussi effacer les listes dans .wgetrc .
wget -X "" -X /Ënobody,/Ësomebody
La majoritĂ© des options qui nâacceptent pas dâarguments sont des options de type boolĂ©en , ainsi nommĂ©es car leur Ă©tat peut ĂȘtre capturĂ© avec une variable oui-ou-non (« boolĂ©enne »). Par exemple, --follow-ftp indique Ă wget de suivre les liens FTP de fichiers HTML et, dâun autre cotĂ©, --no-glob lui dit de ne pas effectuer le « globbing » de fichiers sur les URL FTP. Une option boolĂ©enne peut ĂȘtre affirmative ou nĂ©gative (commençant par --no ). Toutes ces options partagent plusieurs propriĂ©tĂ©s.
Sauf indication contraire, il est supposĂ© que le comportement par dĂ©faut soit lâopposĂ© de ce que lâoption rĂ©alise. Par exemple, lâexistence documentĂ©e de --follow-ftp suppose que le comportement par dĂ©faut est de ne pas suivre les liens FTP des pages HTML.
Les options affirmatives peuvent ĂȘtre niĂ©es en antĂ©posant le --no au nom de lâoption ; les options nĂ©gatives peuvent ĂȘtre niĂ©es en ommettant le prĂ©fixe --no . Cela peut sembler superflu : si le comportement par dĂ©faut dâune option affirmative est de ne pas faire quelque chose, alors pourquoi lui fournir un moyen pour ne pas le faire ? Mais le fichier de dĂ©marrage peut en fait changer le comportement par dĂ©faut. Par exemple, lâutilisation de "follow_ftp = on" dans .wgetrc fait suivre les liens FTP Ă wget par dĂ©faut, et lâutilisation de --no-follow-ftp est la seule maniĂšre de restaurer le comportement par dĂ©faut dâorigine depuis la ligne de commande.
Options de base pour démarrer
|
-V |
--version
Afficher la version de wget .
|
-h |
--help
Afficher un message dâaide dĂ©crivant toutes les options en ligne de commande de wget .
|
-b |
--background
Passer en arriĂšre-plan aussitĂŽt aprĂšs le dĂ©marrage. Si aucun fichier de sortie nâest indiquĂ© avec -o , la sortie est redirigĂ©e dans wget-log .
-e
commande
--execute
commande
ExĂ©cuter la commande comme faisant partie de .wgetrc . Une commande invoquĂ©e ainsi sera exĂ©cutĂ©e aprĂšs les commandes dans .wgetrc , par consĂ©quent prĂ©valant sur elles. Si vous avez besoin dâindiquer plus dâune commande dans wgetrc, utilisez plusieurs instances de -e .
Options de journalisation et de fichier dâentrĂ©e
-o
fichier_journal
--output-file=
fichier_journal
Enregistrer tous les messages dans fichier_journal . Les messages sont habituellement affichĂ©s sur la sortie dâerreur standard.
-a
fichier_journal
--append-output=
fichier_journal
Ajouter dans fichier_journal . Cela est Ă©quivalent Ă -o , mais ajoute au fichier_journal au lieu dâĂ©craser lâancien fichier fichier_journal . Si fichier_journal nâexiste pas, un nouveau fichier est créé.
|
-d |
--debug
Activer la sortie de dĂ©bogage, câest-Ă -dire des informations importantes pour les dĂ©veloppeurs de wget si quelque chose ne fonctionne pas correctement. Votre administrateur systĂšme peut avoir choisi de compiler wget sans lâoption de dĂ©bogage, dans ce cas -d ne fonctionnera pas. Remarquez que compiler avec lâoption de dĂ©bogage est toujours sĂ»r, wget compilĂ© sans la prise en charge du dĂ©bogage nâaffichera pas dâinformations de dĂ©bogage, Ă moins de le demander avec -d .
|
-q |
--quiet
Désactiver la sortie de wget .
|
-v |
--verbose
Activer le mode verbeux, avec toutes les données disponibles. Ce mode est activé par défaut.
|
-nv |
--no-verbose
DĂ©sactiver le mode verbeux sans ĂȘtre totalement silencieux (utilisez -q pour cela), signifiant que les messages dâerreur et les informations de base seront encore affichĂ©s.
--report-speed= type
Bande passante de sortie comme type . La seule valeur acceptée est bits .
-i
fichier
--input-file=
fichier
Lire les URL depuis un fichier local ou externe. Si - est indiquĂ© comme fichier , les URL sont lues depuis lâentrĂ©e standard. (Utilisez ./- pour lire Ă partir dâun fichier nommĂ© - ).
Si cette fonction est utilisĂ©e, aucune URL nâa besoin dâĂȘtre prĂ©sente sur la ligne de commande. Sâil y a des URL Ă la fois sur la ligne de commande et dans le fichier dâentrĂ©e, celles sur la ligne de commande seront les premiĂšres Ă ĂȘtre extraites. Si --force-html nâest pas indiquĂ©, alors le fichier devrait consister en une suite dâURL, une par ligne.
Cependant, si vous indiquez --force-html , le document sera considéré comme html . Dans ce cas, vous pourriez avoir des problÚmes avec les liens relatifs, que vous pouvez résoudre en ajoutant « <base href= url > » aux documents ou en indiquant --base= url sur la ligne de commande.
Si le fichier est externe, le document sera automatiquement traitĂ© comme du html si le type de contenu correspond Ă text/html . Par ailleurs, lâemplacement du fichier sera implicitement utilisĂ© comme href de base si aucun nâest indiquĂ©.
Si le fichier est un fichier local, sur les systĂšmes qui prennent en charge cela, il sera ouvert avec le drapeau "O_NONBLOCK" pour permettre des lectures non bloquantes du fichier. wget tentera de continuer Ă lire le fichier jusquâĂ ce que la fin de ficher soit atteinte (EOF) ou quâil soit fermĂ©. Cela permet de transfĂ©rer une liste de fichiers Ă rĂ©cupĂ©rer, la liste Ă rĂ©cupĂ©rer Ă©tant gĂ©nĂ©rĂ©e dynamiquement pendant lâexĂ©cution du processus. Actuellement, cette fonction nâest pas disponible sur les plateformes Windows.
--input-metalink= fichier
Télécharger les fichiers couverts par le fichier Metalink local. Metalink versions 3 et 4 sont pris en charge.
--keep-badhash
Garder les fichiers Metalink téléchargés avec un mauvais hachage. Cela ajoute .badhash aux noms de fichiers Metalink qui sont incohérents avec la somme de contrÎle, sans écraser les fichiers existants.
--metalink-over-http
Ămettre une requĂȘte HTTP HEAD au lieu de GET et extraire les mĂ©tadonnĂ©es Metalink des en-tĂȘtes de rĂ©ponse. Ensuite, il passe au tĂ©lĂ©chargement de Metalink. Si aucune mĂ©tadonnĂ©e Metalink nâest trouvĂ©e, il revient au tĂ©lĂ©chargement ordinaire HTTP. Cela permet le tĂ©lĂ©chargement et le traitement des fichiers Content-Type: application/metalink4+xml .
--metalink-index= numéro
DĂ©finir le NUMĂRO ordinal de la mĂ©ta-url application/metalink4+xml de Metalink. De 1 au nombre total de « application/metalink4+xml » disponibles. SpĂ©cifier 0 ou inf pour choisir la premiĂšre qui est bonne. Les mĂ©ta-url, telles que celles dâun --metalink-over-http , peuvent avoir Ă©tĂ© triĂ©es par une valeur de clĂ© de priorité ; gardez cela Ă lâesprit pour choisir le bon NUMĂRO.
--preferred-location
DĂ©finir lâemplacement prĂ©fĂ©rĂ© pour les ressources Metalink. Cela est utile si plusieurs ressources ayant la mĂȘme prioritĂ© sont disponibles.
--xattr
Activer lâutilisation des attributs Ă©tendus du systĂšme de fichiers pour sauvegarder la valeur lâURL dâorigine et la valeur de lâen-tĂȘte Referer HTTP si elle est utilisĂ©e.
Gardez Ă lâesprit que les URL pourraient contenir des informations privĂ©es telles que des jetons dâaccĂšs ou des identifiants.
|
-F |
--force-html
Lorsque lâentrĂ©e lue est un fichier, le forcer Ă ĂȘtre traitĂ© comme un fichier HTML. Cela vous permet de retrouver des liens relatifs de fichiers HTML sur votre disque local, en ajoutant "<base href=" url ">" Ă HTML ou en utilisant lâoption de la ligne de commande --base .
-B
URL
--base=
URL
RĂ©soudre les liens relatifs en utilisant URL comme point de rĂ©fĂ©rence, lors de la lecture de liens dâun fichier HTML spĂ©cifiĂ© Ă lâaide de lâoption -i / --input-file (conjointement avec --force-html , ou lorsque le fichier dâentrĂ©e a Ă©tĂ© rĂ©cupĂ©rĂ© Ă distance depuis un serveur le dĂ©crivant comme HTML). Cela est Ă©quivalent Ă la prĂ©sence dâun drapeau "BASE" dans le fichier en entrĂ©e, avec URL comme valeur de lâattribut "href".
Par exemple, si vous indiquez http://machin/truc/a.html pour URL , et que wget lit ../bidule/b.html sur le fichier dâentrĂ©e, il sera rĂ©solu en http://machin/bidule/b.html .
--config= FILE
Indiquer lâemplacement du fichier dâinitialisation que vous voulez utiliser Ă la place de celui ou ceux par dĂ©faut. Utiliser --no-config pour dĂ©sactiver la lecture des fichiers de configuration. Si Ă la fois --config et --no-config sont donnĂ©s, --no-config est ignorĂ©.
--rejected-log= fichier_journal
Enregistrer tous les rejets dâURL dans fichier_journal avec des valeurs sĂ©parĂ©es par des virgules. Les valeurs incluent la raison du rejet, lâURL et lâURL parent dans lequel il a Ă©tĂ© trouvĂ©.
Options de téléchargement
--bind-address= ADDRESS
Lors des connexions TCP/IP client, lâattacher Ă ADDRESS sur la machine locale. ADDRESS peut ĂȘtre indiquĂ©e comme un nom dâhĂŽte ou une adresse 1IP. Cette option peut ĂȘtre utile si votre machine est attachĂ©e Ă plusieurs IP.
--bind-dns-address= ADDRESS
[seulement avec libcares] Cette adresse surcharge la route pour les requĂȘtes DNS. Si vous avez besoin de contourner les rĂ©glages standard de /etc/resolv.conf , cette option avec --dns-servers est votre amie. ADDRESS doit ĂȘtre spĂ©cifiĂ©e comme une adresse soit IPV4, soit IPV6. wget doit ĂȘtre construit avec libcares pour que cette option soit disponible.
--dns-servers= ADDRESSES
[seulement avec libcares] Les adresses donnĂ©es Ă©crasent les adresses du serveur de noms standard, par exemple comme configurĂ© dans /etc/resolv.conf . Les ADDRESSES doivent ĂȘtre spĂ©cifiĂ©es en adresses IPV4 ou IPV6 sĂ©parĂ©es par des virgules. wget a besoin dâĂȘtre construit avec libcares pour que cette option soit disponible.
-t
nombre
--tries=
nombre
DĂ©finir le nombre dâessais Ă nombre . SpĂ©cifier 0 ou inf pour rĂ©essayer indĂ©finiment. Par dĂ©faut, la commande rĂ©essaie 20 fois, Ă lâexception des erreurs fatales comme connection refused ou not found (404), qui ne sont pas rĂ©essayĂ©es.
-O
fichier
--output-document=
fichier
Les documents ne seront pas écrits dans les fichiers appropriés, mais seront tous concaténés et écrits dans fichier . Si - est utilisé comme fichier , les documents seront écrits sur la sortie standard, désactivant la conversion de liens. (Utilisez ./- pour écrire dans un fichier littéralement appelé - .)
Lâutilisation de -O ne signifie pas simplement « utiliser le nom fichier au lieu de celui dans lâURL » ; Cela est similaire Ă une redirection dâinterprĂ©teur : wget -O fichier http://truc est destinĂ© Ă fonctionner comme wget -O - http://truc > fichier ; fichier sera tronquĂ© immĂ©diatement, et tout le contenu tĂ©lĂ©chargĂ© sera Ă©crit lĂ .
Pour cette raison, -N (pour le contrĂŽle dâhorodatage) nâest pas pris en charge en combinaison avec -O : dans la mesure oĂč fichier est tout le temps nouvellement créé, il aura toujours un horodatage trĂšs rĂ©cent. Un avertissement sera affichĂ© si la combinaison des deux est utilisĂ©e.
De mĂȘme, lâutilisation de -r ou -p avec -O peut ne pas fonctionner comme vous voudriez : wget ne tĂ©lĂ©chargera pas seulement le premier fichier dans fichier et ensuite le reste dans leurs noms courants : tout le contenu tĂ©lĂ©chargĂ© sera placĂ© dans fichier . Cela a Ă©tĂ© dĂ©sactivĂ© dans la version 1.11, mais a Ă©tĂ© rĂ©implantĂ© (avec un avertissement) dans la version 1.11.2, puisquâil y a des cas oĂč ce fonctionnement peut avoir une certaine utilitĂ©.
Une combinaison avec -nc nâest acceptĂ©e que si le fichier donnĂ© en sortie nâexiste pas.
Remarquez quâune combinaison avec -k nâest permise que lors du tĂ©lĂ©chargement dâun seul document, car dans ce cas il convertira seulement toutes les URl relatives en URL externes ; -k nâa pas de sens pour des URl multiples lorsquâelles sont toutes tĂ©lĂ©chargĂ©es dans un seul fichier ; -k ne peut ĂȘtre utilisĂ© que lorsque la sortie est un fichier normal.
|
-nc |
--no-clobber
Si un fichier est tĂ©lĂ©chargĂ© plus dâune fois dans le mĂȘme rĂ©pertoire, le comportement de wget dĂ©pend de quelques options, incluant -nc . Dans certains cas, le fichier local sera corrompu ou Ă©crasĂ© aprĂšs un tĂ©lĂ©chargement rĂ©pĂ©tĂ©. Dans dâautres cas, il sera prĂ©servĂ©.
Lorsque wget est lancĂ© sans -N , -nc , -r ou -p , le tĂ©lĂ©chargement du mĂȘme fichier dans le mĂȘme rĂ©pertoire prĂ©servera la copie dâorigine de fichier et la seconde copie sera nommĂ©e fichier .1 . Si ce fichier est Ă nouveau tĂ©lĂ©chargĂ©, la troisiĂšme copie sera nommĂ©e fichier .2 , et ainsi de suite. (Cela est aussi le comportement avec -nd , mĂȘme si -r ou -p sont effectifs.) Lorsque -nc est spĂ©cifiĂ©, ce comportement est supprimĂ©, et wget refusera de tĂ©lĂ©charger de nouvelles copies de fichier . Par consĂ©quent, « no-clobber » est en fait un terme mal choisi dans ce mode -- ce nâest pas la corruption qui est empĂȘchĂ©e (comme les suffixes numĂ©riques empĂȘchent dĂ©jĂ la corruption), mais plutĂŽt lâenregistrement de plusieurs versions qui est empĂȘchĂ©.
Lorsque wget est lancĂ© avec -r ou -p , mais sans -N , -nd ou -nc , tĂ©lĂ©charger Ă nouveau un fichier rĂ©sultera en ce que la nouvelle copie Ă©crasera simplement la prĂ©cĂ©dente. Ajouter -nc empĂȘchera ce comportement, provoquant plutĂŽt la prĂ©servation de la version originale et faisant que les copies plus rĂ©centes sur le serveur seront ignorĂ©es.
Lors du lancement de wget avec -N , avec ou sans -r ou -p , la dĂ©cision de tĂ©lĂ©charger ou non une copie plus rĂ©cente dâun fichier dĂ©pend de lâhorodatage local et distant et de la taille du fichier. -nc peut ne pas ĂȘtre spĂ©cifiĂ© au mĂȘme moment que -N .
Une combinaison avec -O / --output-document nâest acceptĂ©e que si le fichier donnĂ© en sortie nâexiste pas.
Notez que lorsque -nc est spĂ©cifiĂ©, les fichiers avec les suffixes .html ou .htm seront chargĂ©s depuis le disque local et analysĂ©s comme sâils avaient Ă©tĂ© rĂ©cupĂ©rĂ©s sur le Web.
--backups= sauvegardes
Avant dâĂ©crire ou dâĂ©craser un fichier, faire une sauvegarde du fichier existant en ajoutant un suffixe .1 ( _1 sur VMS) au nom de fichier. De tels fichiers de sauvegarde sont numĂ©rotĂ©s .2 , .3 , et ainsi de suite, jusquâĂ sauvegardes (en perdant ce qui vient aprĂšs).
--no-netrc
Ne pas essayer dâobtenir des identifiants du fichier .netrc . Par dĂ©faut les identifiants sont recherchĂ©s dans le fichier .netrc dans le cas oĂč aucun nâait Ă©tĂ© passĂ© sur la ligne de commande et quâune authentification serait nĂ©cessaire.
|
-c |
--continue
Continuer Ă rĂ©cupĂ©rer un fichier partiellement tĂ©lĂ©chargĂ©. Cela est utile lorsque vous voulez finir un tĂ©lĂ©chargement commencĂ© lors dâune prĂ©cĂ©dente instance de wget , ou par un autre programme. Par exemple :
wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
Sâil y a un fichier nommĂ© ls-lR.Z dans le rĂ©pertoire actuel, wget supposera quâil sâagit de la premiĂšre partie du fichier distant, et demandera au serveur de poursuivre la rĂ©cupĂ©ration Ă partir dâun dĂ©calage Ă©gal Ă la longueur du fichier local.
Remarquez que vous nâavez pas besoin dâindiquer cette option si vous voulez simplement que lâinvocation actuelle de wget rĂ©essaie de tĂ©lĂ©charger un fichier si la connexion est perdue en cours de route. Câest le comportement par dĂ©faut. -c nâaffecte que la reprise des tĂ©lĂ©chargements commencĂ©s avant cette invocation de wget , et dont les fichiers locaux sont toujours en attente.
Sans -c , lâexemple prĂ©cĂ©dent devrait juste tĂ©lĂ©charger le fichier distant dans ls-lR.Z.1 , laissant seul le fichier tronquĂ© ls-lR.Z .
Si vous utilisez -c sur un fichier non vide, et que le serveur ne prend pas en charge la reprise du téléchargement, wget relancera le téléchargement depuis le début et écrasera entiÚrement le fichier existant.
Ă partir de Wget 1.7, si vous utilisez -c sur un fichier ayant une taille Ă©gale Ă celui sur le serveur, wget refusera de tĂ©lĂ©charger le fichier et affichera un message explicatif. La mĂȘme chose arrive lorsque le fichier est plus petit sur le serveur que celui en local (probablement parce quâil a Ă©tĂ© modifiĂ© sur le serveur depuis votre derniĂšre tentative de tĂ©lĂ©chargement) -- parce que « continuing » nâest pas assez explicite, aucun tĂ©lĂ©chargement nâest lancĂ©.
Dâun autre cotĂ©, en utilisant -c , tout fichier qui est plus gros sur le serveur quâen local sera considĂ©rĂ© comme un tĂ©lĂ©chargement incomplet et seulement (longueur(distante) - longueur(locale)) octets seront tĂ©lĂ©chargĂ©s et ajoutĂ©s Ă la fin du fichier local. Ce comportement est apprĂ©ciable dans quelques cas. Par exemple, vous pouvez utiliser wget -c pour tĂ©lĂ©charger uniquement la nouvelle partie qui a Ă©tĂ© ajoutĂ©e Ă une collection de donnĂ©es ou Ă un fichier journal.
En tout cas, si le fichier est plus gros sur le serveur parce quâil a Ă©tĂ© modifiĂ© , contrairement Ă juste ajoutĂ© , vous vous retrouverez avec un fichier brouillĂ©. wget nâa pas la possibilitĂ© de vĂ©rifier que le fichier local est rĂ©ellement un dĂ©but valable du fichier distant. Vous devez ĂȘtre particuliĂšrement attentif Ă cela lors de lâutilisation de -c en combinaison avec -r , vu que tout fichier sera considĂ©rĂ© comme un « tĂ©lĂ©chargement incomplet » potentiel.
Un autre cas oĂč vous obtiendrez un fichier brouillĂ© si vous essayez dâutiliser -c , est celui oĂč vous avez un mandataire HTTP bancal qui insĂšre une chaĂźne « transfer interrupted » dans le fichier local. Dans le futur, une option « rollback » (retour Ă lâĂ©tat prĂ©cĂ©dent) devrait ĂȘtre ajoutĂ©e pour gĂ©rer ce cas de figure.
Prenez en compte que -c ne fonctionne quâavec les serveurs FTP et les serveurs HTTP qui prennent en charge lâen-tĂȘte "Range".
--start-pos= OFFSET
Commencer le tĂ©lĂ©chargement Ă la position dâ OFFSET par rapport Ă zĂ©ro. Le dĂ©calage doit ĂȘtre exprimĂ© en octets, kilooctets avec le suffixe k ou mĂ©gaoctets avec le suffixe m , etc.
--start-pos a la priorité sur --continue . Lorsque --start-pos et --continue sont toute deux indiquées, wget émettra un avertissement et procÚdera comme si --continue était absent.
La prise en charge du serveur pour la poursuite du téléchargement est nécessaire, sinon --start-pos ne pourra pas aider. Voir -c pour les détails.
--progress= type
SĂ©lectionnez le type dâindicateur de progression que vous dĂ©sirez utiliser. Les indicateurs classiques sont « dot » et « bar ».
Lâindicateur « bar » est utilisĂ© par dĂ©faut. Il dessine un graphique de barre de progression ASCII (comme un affichage « thermomĂštre ») indiquant lâĂ©tat de la rĂ©cupĂ©ration. Si la sortie nâest pas une console TTY, la barre « dot » sera utilisĂ©e par dĂ©faut.
Utilisez --progress=dot pour passer Ă lâaffichage « dot » (pointillĂ©s). Il retrace la rĂ©cupĂ©ration en affichant des points sur lâĂ©cran, chaque point reprĂ©sentant une quantitĂ© fixe de donnĂ©es tĂ©lĂ©chargĂ©es.
Le type de progression peut aussi prendre un ou plusieurs paramÚtres. Les paramÚtres varient suivant le type sélectionné. Les paramÚtres sont passés au type en les ajoutant au type, séparés par un deux-points ( : ) comme ceci : --progress= type : paramÚtre1 : paramÚtre2 .
Lorsque vous utilisez la reprĂ©sentation de la rĂ©cupĂ©ration par points, vous pouvez dĂ©finir le style en spĂ©cifiant le type comme dot: style . Les diffĂ©rents styles assignent diffĂ©rents rĂŽles Ă un point. Avec le style « default » chaque point reprĂ©sente 1Ko, il y a dix points par grappe et 50 points sur une ligne. Le style « binary » a plus une orientation du genre « ordinateur » : points de 8Ko, 16 points par grappe et 48 points par ligne (ce qui fait des lignes de 384Ko). Le style « mega » est adaptĂ© au tĂ©lĂ©chargement de gros fichiers : chaque point reprĂ©sentant 64Ko de rĂ©cupĂ©ration, il y a huit points dans une grappe, et 48 points sur chaque ligne (chaque ligne contenant 3Mo). Si « mega » nâest pas suffisant, alors vous pouvez utiliser le style « giga » -- chaque point reprĂ©sente 1 Mo rĂ©cupĂ©rĂ©s, il y a huit points par grappe, et 32 points par ligne (donc chaque ligne contient 32Mo).
Avec --progress=bar , il y a actuellement deux paramĂštres possibles, force et noscroll .
Lorsque la sortie nâest pas une console TTY, la barre de progression retombe toujours sur « dot », mĂȘme si --progress=bar a Ă©tĂ© passĂ© Ă wget lors de lâinvocation. Ce comportement peut ĂȘtre outrepassĂ© et la sortie « bar » forcĂ©e avec le paramĂštre « force » comme --progress=bar:force .
Par dĂ©faut, la barre de progression du style bar fait dĂ©filer le nom du fichier de gauche Ă droite pour le fichier en cours de tĂ©lĂ©chargement si le nom du fichier dĂ©passe la longueur maximale allouĂ©e Ă son affichage. Dans certains cas, comme avec --progress=bar:force , il peut ne pas y avoir de dĂ©filement du nom de fichier dans la barre de progression. En passant le paramĂštre « noscroll », wget peut ĂȘtre forcĂ© Ă afficher la plus grande partie possible du nom de fichier sans le faire dĂ©filer.
Remarquez que vous pouvez indiquer le style par dĂ©faut en utilisant la commande "progress" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande. Par exemple, pour forcer la barre de sortie Ă ne pas dĂ©filer, utilisez --progress=bar:force:noscroll .
--show-progress
Forcer wget à afficher la barre de progression quelque soit le niveau de détail.
Par dĂ©faut, wget affiche seulement la barre de progression en mode dĂ©taillĂ©. Il est possible de vouloir que wget affiche la barre de progression en accord avec un autre mode de dĂ©tail comme --no-verbose ou --quiet . Cela peut ĂȘtre dĂ©sirable lors de lâinvocation de wget pour tĂ©lĂ©charger plusieurs petits et/ou grands fichiers. Dans un tel cas, wget pourrait simplement ĂȘtre invoquĂ© avec ce paramĂštre pour avoir une sortie plus propre sur lâĂ©cran.
Cette option forcera Ă©galement la barre de progression Ă ĂȘtre affichĂ©e dans stderr lorsquâelle est utilisĂ©e avec lâoption --output-file .
|
-N |
--timestamping
Activer lâhorodatage.
--no-if-modified-since
Ne pas envoyer dâen-tĂȘte If-Modified-Since en mode -N . Envoyer dâabord une rĂ©ponse HEAD Ă la place. Cela nâest effectif quâen mode -N .
--no-use-server-timestamps
Ne pas rĂ©gler lâhorodatage du fichier local sur celui du serveur.
Par dĂ©faut, lorsquâun fichier est tĂ©lĂ©chargĂ©, son horodatage est rĂ©glĂ© pour correspondre Ă celui du fichier distant. Cela permet lâutilisation de --timestamping sur les invocations suivantes de wget . Cependant, il est parfois nĂ©cessaire de baser lâhorodatage du fichier local sur celui de son tĂ©lĂ©chargement ; lâoption --no-use-server-timestamps a Ă©tĂ© fournie dans ce but.
|
-S |
--server-response
Afficher les en-tĂȘtes envoyĂ©s par les serveurs HTTP et les rĂ©ponses envoyĂ©es par les serveurs FTP.
--spider
Lorsquâil est invoquĂ© avec cette option, wget se comportera comme un robot dâindexation, il ne tĂ©lĂ©chargera pas les pages, il vĂ©rifiera simplement leur prĂ©sence. Par exemple, vous pouvez utiliser wget pour vĂ©rifier vos marque-pages :
wget --spider --force-html -i marque-pages.html
Cette caractĂ©ristique nĂ©cessite encore quelques travaux pour se rapprocher des fonctionnalitĂ©s de vĂ©ritables robots dâindexation.
-T secondes
--timeout=
secondes
DĂ©finir le dĂ©lai dâattente du rĂ©seau Ă secondes . Cela est Ă©quivalent Ă spĂ©cifier --dns-timeout , --connect-timeout et --read-timeout , tous en mĂȘme temps.
Lorsquâil interagit avec le rĂ©seau, wget peut vĂ©rifier le dĂ©lai dâattente et annuler lâopĂ©ration si cela dure trop. Cela permet dâĂ©viter les anomalies telles que les lectures suspendues et les connexions infinies. Le seul dĂ©lai dâattente activĂ© par dĂ©faut est un dĂ©lai dâattente de lecture de 900 secondes (15 min). DĂ©finir un dĂ©lai dâattente Ă 0 dĂ©sactive lâensemble. Ă moins de savoir ce que vous faites, il vaut mieux ne pas changer les rĂ©glages du dĂ©lai dâattente par dĂ©faut.
Toutes les options liĂ©es au dĂ©lai dâattente acceptent les valeurs dĂ©cimales, ainsi que les valeurs en dixiĂšme de seconde. Par exemple, 0.1 seconde est un choix classique (bien que peu judicieux) du dĂ©lai dâattente. Les temps dâattente en dixiĂšmes de seconde sont utiles pour la vĂ©rification des temps de rĂ©ponse du serveur ou pour tester la latence du rĂ©seau.
--dns-timeout= secondes
DĂ©finir le dĂ©lai de consultation de DNS Ă secondes . Les recherches DNS qui ne sont pas terminĂ©es dans le dĂ©lai spĂ©cifiĂ© Ă©chouent. Par dĂ©faut, il nây a pas de dĂ©lai sur les recherches DNS autre que celui implĂ©mentĂ© par les bibliothĂšques du systĂšme.
--connect-timeout= secondes
DĂ©finir le dĂ©lai de connexion Ă secondes . Les connexions TCP qui mettent trop longtemps Ă sâĂ©tablir seront annulĂ©es. Il nây a pas de dĂ©lai de connexion par dĂ©faut, autre que celui qui est implĂ©mentĂ© par les bibliothĂšques du systĂšme.
--read-timeout= secondes
DĂ©finir le dĂ©lai de lecture (et dâĂ©criture) Ă secondes . Le « temps » de ce dĂ©lai correspond Ă idle time : si, Ă quelque moment du tĂ©lĂ©chargement, aucune donnĂ©e nâest reçue durant plus que le nombre spĂ©cifiĂ© de secondes, la lecture Ă©choue et le tĂ©lĂ©chargement est recommencĂ©. Cette option nâinflue pas directement sur la durĂ©e totale du tĂ©lĂ©chargement.
Bien sûr, le serveur distant peut choisir de terminer la connexion plus tÎt que requis par cette option. Le délai de lecture est de 900 secondes (15 min) par défaut.
--limit-rate= quantité
Limiter la vitesse de tĂ©lĂ©chargement Ă quantitĂ© octets par seconde. Cette quantitĂ© doit ĂȘtre exprimĂ©e en octets, kilooctets (avec le suffixe k ), ou mĂ©gaoctets (avec le suffixe m ). Par exemple, --limit-rate=20K limitera le dĂ©bit de rĂ©cupĂ©ration Ă 20 ko/s. Cela est utile lorsque, pour une raison quelconque, vous ne voulez pas que wget consomme toute la bande passante disponible.
Cette option autorise lâusage de nombres dĂ©cimaux, habituellement en conjonction avec des suffixes de puissance ; par exemple, --limit-rate=2.5k est une valeur classique.
Remarquez que wget implĂ©mente la limitation en dormant pendant la durĂ©e appropriĂ©e aprĂšs une rĂ©ception depuis le rĂ©seau qui a pris moins de temps que spĂ©cifiĂ© par le dĂ©bit. Ăventuellement cela peut causer le ralentissement du transfert TCP jusquâĂ approximativement le dĂ©bit spĂ©cifiĂ©. Cependant, il se peut que cela prenne un peu de temps avant de se stabiliser ; ne soyez pas surpris si cette limite nâest pas vraiment respectĂ©e lors du transfert de trĂšs petits fichiers.
-w
secondes
--wait=
secondes
Attendre le nombre de secondes spĂ©cifiĂ© entre deux rĂ©cupĂ©rations. Lâutilisation de cette option est encouragĂ©e, car elle allĂšge le travail du serveur en diminuant la frĂ©quence des requĂȘtes. Au lieu de secondes, le temps peut ĂȘtre indiquĂ© en minutes en utilisant le suffixe "m", en heures avec le suffixe "h", ou en jours avec le suffixe "d".
Lâindication dâune grande valeur pour cette option est pratique si le rĂ©seau ou lâhĂŽte de destination est Ă©teint, ainsi wget peut attendre assez longtemps pour raisonnablement espĂ©rer que lâerreur rĂ©seau soit rĂ©parĂ©e dâici le prochain essai. Lâintervalle de temps dâattente indiquĂ© par cette fonction est influencĂ© par "--random-wait" qui surveille.
--waitretry= secondes
Si vous ne voulez pas que wget attende entre chaque rĂ©cupĂ©ration, mais seulement entre les nouvelles tentatives suite Ă des Ă©checs de tĂ©lĂ©chargement, vous pouvez utiliser cette option. wget utilisera linear backoff , en attendant une seconde aprĂšs le premier Ă©chec sur un fichier donnĂ©, puis deux secondes aprĂšs le second Ă©chec sur ce fichier, jusquâau nombre maximal de secondes indiquĂ©.
Par défaut, wget prendra une valeur de dix secondes.
--random-wait
Certains sites web peuvent effectuer une analyse des journaux pour identifier les programmes dâextraction tels que wget en recherchant des similitudes statistiquement significatives dans le dĂ©lai entre les requĂȘtes. Cette option fait varier entre 0,5 et 1,5 * secondes dâattente , oĂč secondes dâattente est indiquĂ©e par lâusage de lâoption --wait , pour masquer la prĂ©sence de wget Ă partir de ce type dâanalyse.
Un article est paru en 2001 dans une publication consacrĂ©e au dĂ©veloppement sur une plate-forme populaire grand public qui fournissait un code permettant dâeffectuer cette analyse Ă la volĂ©e. Son auteur a suggĂ©rĂ© un blocage au niveau des adresses de classe C pour sâassurer que les programmes dâextraction automatique soient bloquĂ©s malgrĂ© le changement des adresses fournies par le DHCP.
Lâoption --random-wait a Ă©tĂ© inspirĂ©e par cette recommandation peu judicieuse qui consiste Ă bloquer lâaccĂšs Ă un site web Ă de nombreux utilisateurs non concernĂ©s en raison des actions dâun seul.
--no-proxy
Ne pas utiliser de mandataire, mĂȘme si la variable dâenvironnement appropriĂ©e *_proxy est dĂ©finie.
-Q
quota
--quota=
quota
Indiquer le quota de tĂ©lĂ©chargement pour lâextraction automatique. Cette valeur peut ĂȘtre indiquĂ©e en octets (par dĂ©faut), kilooctets (avec le suffixe k ) ou mĂ©gaoctets (avec le suffixe m ).
Remarquez que le quota nâaffectera jamais le tĂ©lĂ©chargement dâun seul fichier. Donc si vous indiquez wget -Q10k https://example.com/ls-lR.gz , tout le fichier ls-lR.gz sera tĂ©lĂ©chargĂ©. Câest la mĂȘme chose lorsque plusieurs URL sont indiquĂ©es sur la ligne de commande. Le quota nâest seulement vĂ©rifiĂ© quâĂ la fin de chaque fichier tĂ©lĂ©chargĂ©, donc il ne provoquera jamais le tĂ©lĂ©chargement partiel dâun fichier. Ainsi vous pouvez tranquillement taper wget -Q2m -i sites , le tĂ©lĂ©chargement sâarrĂȘtera aprĂšs que le fichier qui dĂ©passe le quota a Ă©tĂ© complĂštement tĂ©lĂ©chargĂ©.
Définir le quota à 0 ou à inf retire la limite du quota de téléchargement.
--no-dns-cache
DĂ©sactiver la mise en cache des recherches de DNS. Normalement, wget se souvient des adresses IP quâil a recherchĂ© auprĂšs de DNS afin de ne pas avoir Ă contacter de maniĂšre rĂ©pĂ©tĂ©e le serveur DNS pour le mĂȘme (gĂ©nĂ©ralement petit) ensemble dâhĂŽtes quâil rĂ©cupĂšre. Ce cache nâexiste quâen mĂ©moire ; un nouveau lancement de wget recontactera encore le DNS.
Cela dit, il a Ă©tĂ© rapportĂ© que dans quelques situations, il nâest pas dĂ©sirable de mettre en cache les noms dâhĂŽtes, mĂȘme pour la durĂ©e dâune application brĂšve et rapide comme wget . Avec cette option, wget effectue une nouvelle recherche DNS (plus prĂ©cisĂ©ment, un nouvel appel Ă "gethostbyname" ou "getaddrinfo") Ă chaque nouvelle connexion. Veuillez prendre en compte que cette option nâaffectera pas la mise en cache qui pourrait ĂȘtre effectuĂ©e par la bibliothĂšque de rĂ©solution ou par une couche de mise en cache externe, telle que NSCD.
Si vous ne comprenez pas exactement ce que fait cette option, vous nâen avez probablement pas besoin.
--restrict-file-names= modes
Modifier les caractĂšres trouvĂ©s dans les URL distants qui doivent ĂȘtre protĂ©gĂ©s lors de la gĂ©nĂ©ration des noms de fichiers locaux. Les caractĂšres qui sont restreints par cette option sont protĂ©gĂ©s, câest Ă dire remplacĂ©s par %HH , oĂč HH est le nombre hexadĂ©cimal qui correspond au caractĂšre restreint. Cette option peut aussi ĂȘtre utilisĂ©e pour forcer les caractĂšres alphabĂ©tiques Ă ĂȘtre soit en minuscules, soit en capitales.
Par dĂ©faut, wget protĂšge les caractĂšres qui ne sont pas valables ou sĂ»rs dans les noms de fichiers pour votre systĂšme dâexploitation, ainsi que pour les caractĂšres de contrĂŽle habituellement impossibles Ă afficher. Cette option est utile pour changer ce comportement par dĂ©faut, peut ĂȘtre parce que vous tĂ©lĂ©chargez dans une partition non native, ou parce que vous voulez dĂ©sactiver la protection des caractĂšres de contrĂŽle, ou parce que vous voulez restreindre encore plus de caractĂšres Ă ceux de la plage de valeurs ASCII.
Les modes sont un ensemble de valeurs textuelles sĂ©parĂ©es par des virgules. Les valeurs acceptĂ©es sont unix , windows , nocontrol , ascii , lowercase et uppercase . Les valeurs unix et windows sont mutuellement exclusives (lâune Ă©crasera lâautre), de mĂȘme pour lowercase et uppercase . Ces deux derniĂšres sont des cas spĂ©ciaux, car elles ne changent pas lâensemble des caractĂšres qui devraient ĂȘtre protĂ©gĂ©s, mais plutĂŽt forcent les chemins de fichier local Ă ĂȘtre converti soit en minuscules ou en capitales.
Lorsque « unix » est indiquĂ©, wget protĂšge le caractĂšre / et les caractĂšres de contrĂŽle dans les plages de 0 à  31 et de 128 à  159. Câest le comportement par dĂ©faut pour les systĂšmes dâexploitation de type Unix.
Lorsque « windows » est indiquĂ©, wget protĂšge les caractĂšres \ , | , / , : , ? , " , * , < , > , et les caractĂšres contrĂŽle dans les plages de 0 à  31 et de 128 à  159. En plus de cela, wget en mode Windows utilise + au lieu de : pour sĂ©parer lâhĂŽte et le port dans les noms de fichiers locaux, et utilise @ au lieu de ? pour sĂ©parer la partie requĂȘte du nom de fichier du reste. Par consĂ©quent, une URL qui aurait Ă©tĂ© sauvegardĂ©e en www.xemacs.org:4300/search.pl?input=blabla en mode Unix pourrait lâĂȘtre en www.xemacs.org+4300/search.pl@input=blabla en mode Windows. Câest le mode par dĂ©faut sur Windows.
Si vous indiquez nocontrol , alors la protection des caractĂšres de contrĂŽle est aussi dĂ©sactivĂ©e. Cette option est utile lorsque vous tĂ©lĂ©chargez des URL avec des noms contenant des caractĂšres UTF-8 sur un systĂšme qui peut sauvegarder et afficher les noms de fichiers en UTF-8 (certaines valeurs dâoctets possibles utilisĂ©es dans les sĂ©quences dâoctets UTF-8 tombent dans la plage de valeurs dĂ©signĂ©e par wget comme des « contrĂŽles »).
Le mode ascii est utilisĂ© pour spĂ©cifier que tous les octets dont la valeur est en dehors de la plage de caractĂšres ASCII (câest-Ă -dire supĂ©rieure Ă 127) doivent ĂȘtre protĂ©gĂ©s. Cela est utile lors de la sauvegarde des noms de fichiers dont lâencodage ne correspond pas Ă celui utilisĂ© en local.
|
-4 |
--inet4-only
|
-6 |
--inet6-only
Forcer la connexion vers les adresses IPv4 ou IPv6. Avec --inet4-only ou -4 , wget ne se connectera quâĂ des hĂŽtes IPv4, ignorant les enregistrements AAAA du DNS, et refusant de se connecter aux adresses IPv6 indiquĂ©es dans les URL. Au contraire, avec --inet6-only ou -6 , wget ne se connectera quâaux hĂŽtes IPv6 et ignorera les enregistrements A et les adresses IPv4.
Aucune de ces options ne devrait ĂȘtre normalement nĂ©cessaire. Par dĂ©faut, un wget prenant en charge IPv6 utilisera la famille dâadresses spĂ©cifiĂ©e par lâenregistrement DNS de lâhĂŽte. Si le DNS rĂ©pond avec Ă la fois des adresses IPv4 et IPv6, wget les essaiera dans lâordre jusquâĂ ce quâil en trouve une pour se connecter. Consultez aussi lâoption "--prefer-family" dĂ©crite ci-dessous.
Ces options peuvent ĂȘtre utilisĂ©es pour forcer dĂ©libĂ©rĂ©ment lâusage des familles dâadresses IPv4 ou IPv6 sur les systĂšmes avec les deux familles, habituellement pour aider au dĂ©bogage ou sâoccuper dâune configuration rĂ©seau dĂ©faillante. Seulement lâune des options --inet6-only et --inet4-only peut ĂȘtre indiquĂ©e au mĂȘme moment. Aucune option nâest disponible si wget a Ă©tĂ© compilĂ© sans la prise en charge de IPv6.
--prefer-family=none/IPv4/IPv6
Lors dâun choix avec plusieurs adresses, se connecter dâabord aux adresses indiquĂ©es dans la famille dâadresses. Par dĂ©faut, lâordre des adresses renvoyĂ© par DNS est utilisĂ© sans changement.
Cela permet dâĂ©viter les erreurs et les tentatives de connexion intempestives lors de lâaccĂšs Ă des hĂŽtes dont lâadresse est Ă la fois IPv6 et IPv4 Ă partir de rĂ©seaux IPv4. Par exemple, www.kame.net se rĂ©sout en 2001:200:0:8002:203:47ff:fea5:3085 et en 203.178.141.194 . Lorsque la famille souhaitĂ©e est "IPv4", lâadresse IPv4 sera utilisĂ©e en premier ; lorsque la famille souhaitĂ©e est "IPv6", lâadresse IPv6 sera utilisĂ©e en premier ; si la valeur indiquĂ©e est "none", lâordre des adresses renvoyĂ© par DNS est utilisĂ© sans changement.
Contrairement Ă -4 et -6 , cette action nâempĂȘche pas lâaccĂšs Ă une quelconque famille dâadresse, elle change juste lâ ordre dans lequel on accĂšde aux adresses. Remarquez aussi que le rĂ©ordonnancement effectuĂ© par cette option est stable : il nâaffecte pas lâordre des adresses de la mĂȘme famille. Câest-Ă -dire que lâordre relatif de toutes les adresses IPv4 et de toutes les adresses IPv6 reste intact dans tous les cas.
--retry-connrefused
ConsidĂ©rer « connection refused » comme une erreur passagĂšre et rĂ©essayer. Normalement, wget abandonne une URL lorsquâil ne parvient pas Ă se connecter au site, car lâĂ©chec de la connexion est considĂ©rĂ© comme un signe que le serveur ne fonctionne pas du tout et que de nouvelles tentatives ne seraient dâaucune utilitĂ©. Cette option est destinĂ©e Ă la mise en miroir de sites peu fiables dont les serveurs ont tendance Ă disparaĂźtre pendant de courtes pĂ©riodes.
--user=
utilisateur
--password=
mot_de_passe
Indiquer le nom dâutilisateur utilisateur et le mot de passe mot_de_passe pour la rĂ©cupĂ©ration des fichiers Ă la fois FTP et HTTP. Ces paramĂštres peuvent ĂȘtre Ă©crasĂ©s par lâutilisation des options --ftp-user et --ftp-password pour les connexions FTP et les options --http-user et --http-password pour les connexions HTTP.
--ask-password
Demander un mot de passe pour chaque connexion Ă©tablie. Ne peut pas ĂȘtre indiquĂ© quand --password est dĂ©jĂ utilisĂ©, car ils sont mutuellement exclusifs.
--use-askpass= commande
Demander un utilisateur et un mot de passe en utilisant la commande indiquĂ©e. Si aucune commande nâest indiquĂ©e, alors la commande dans la variable dâenvironnement WGET_ASKPASS est utilisĂ©e. Si WGET_ASKPASS nâest pas dĂ©finie, alors la commande dans la variable dâenvironnement SSH_ASKPASS est utilisĂ©e.
Vous pouvez dĂ©finir la commande par dĂ©faut pour use-askpass dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande.
--no-iri
DĂ©sactiver la prise en charge des URI internationalisĂ©s (IRI). Utiliser --iri pour lâactiver. La prise en charge des IRI est activĂ©e par dĂ©faut.
Vous pouvez dĂ©finir lâĂ©tat par dĂ©faut de la prise en charge des IRI en utilisant la commande "iri" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande.
--local-encoding= encodage
Forcer wget Ă utiliser encodage comme systĂšme dâencodage par dĂ©faut. Cela influe sur la maniĂšre dont wget convertit les URL indiquĂ©s comme arguments de paramĂštres rĂ©gionnaux vers UTF-8 pour la prise en charge dâIRI.
wget utilise la fonction nl_langinfo()" et donc la variable dâenvironnement "CHARSET" pour obtenir les paramĂštres rĂ©gionaux. Si cela Ă©choue, ASCII est utilisĂ©.
Vous pouvez dĂ©finir lâencodage local par dĂ©faut en utilisant la commande "local_encoding" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© par la ligne de commande.
--remote-encoding= encodage
Forcer wget Ă utiliser lâ encodage comme encodage par dĂ©faut du serveur distant. Cela affecte la façon dont wget convertit les URI trouvĂ©s dans les fichiers de lâencodage distant en UTF-8 lors dâune rĂ©cupĂ©ration rĂ©cursive. Cette option nâest utile que pour la prise en charge dâIRI, pour interprĂ©ter les caractĂšres qui ne sont pas ASCII.
Pour HTTP, lâencodage distant peut ĂȘtre trouvĂ© dans lâen-tĂȘte HTTP "Content-Type" et dans les mĂ©ta-Ă©tiquettes HTML "Content-Type http-equiv".
Vous pouvez dĂ©finir lâencodage par dĂ©faut avec la commande "remoteencoding" dans .wgetrc . Ce rĂ©glage peut ĂȘtre Ă©crasĂ© en ligne de commande.
--unlink
Forcer wget Ă dĂ©lier le fichier au lieu dâĂ©craser le fichier existant. Cette option est utile pour le tĂ©lĂ©chargement dans le rĂ©pertoire avec des liens en dur (« hardlinks »).
Options de répertoire
|
-nd |
--no-directories
Ne pas crĂ©er de hiĂ©rarchie de rĂ©pertoires lors dâune rĂ©cupĂ©ration rĂ©cursive. Avec cette option activĂ©e, tous les fichiers sont sauvegardĂ©s dans le rĂ©pertoire actuel, sans Ă©crasement (si un nom apparait plus dâune fois, les noms de fichiers auront lâextension .n ).
|
-x |
--force-directories
LâopposĂ© de -nd : crĂ©er une hiĂ©rarchie de rĂ©pertoires, mĂȘme si une nâaurait pas Ă©tĂ© créée autrement. Par exemple, wget -x http://fly.srk.fer.hr/robots.txt sauvegardera les fichiers tĂ©lĂ©chargĂ©s dans fly.srk.fer.hr/robots.txt .
|
-nH |
--no-host-directories
DĂ©sactiver la gĂ©nĂ©ration de rĂ©pertoires prĂ©fixĂ©s par le nom dâhĂŽte. Par dĂ©faut, lâinvocation de wget avec -r http://fly.srk.fer.hr/ crĂ©era une structure de rĂ©pertoires commençant par fly.srk.fer.hr/ . Cette option dĂ©sactive un tel comportement.
--protocol-directories
Utiliser le nom de protocole comme composant du répertoire des noms de fichiers locaux. Par exemple, avec cette option, wget -r http:// hÎte sera sauvegardé en http/ hÎte /... plutÎt que seulement en hÎte /... .
--cut-dirs= nombre
Ignorer un certain nombre de composants du rĂ©pertoire. Cela est utile pour obtenir un contrĂŽle fin sur le rĂ©pertoire oĂč la rĂ©cupĂ©ration rĂ©cursive sera enregistrĂ©e.
Prenons comme exemple le rĂ©pertoire Ă lâadresse ftp://ftp.xemacs.org/pub/xemacs/ . Si vous le rĂ©cupĂ©rez avec -r , il sera sauvegardĂ© localement sous ftp.xemacs.org/pub/xemacs/ . Bien que lâoption -nH peut supprimer la partie ftp.xemacs.org/ , vous ĂȘtes encore coincĂ© avec pub/xemacs . Câest lĂ oĂč --cut-dirs est vraiment pratique : il permet Ă wget de ne pas « voir » le nombre de composants de rĂ©pertoire distant. Voici quelques exemples de la maniĂšre dont lâoption --cut-dirs fonctionne.
Pas
dâoptions -> ftp.xemacs.org/pub/xemacs/
-nH -> pub/xemacs/
-nH --cut-dirs=1 -> xemacs/
-nH --cut-dirs=2 -> .
--cut-dirs=1 -> ftp.xemacs.org/xemacs/
...
Si vous voulez simplement vous dĂ©barrasser de la structure du rĂ©pertoire, cette option est similaire Ă une combinaison de -nd et -P . Par contre, contrairement Ă -nd , --cut-dirs ne se perd pas avec des sous-rĂ©pertoires (par exemple, avec -nH --cut-dirs=1 , un sous-rĂ©pertoire beta/ sera placĂ© sur xemacs/beta , comme on pourrait lâespĂ©rer.
-P
préfixe
--directory-prefix=
préfixe
DĂ©signer le prĂ©fixe de rĂ©pertoire Ă prĂ©fixe . Le prĂ©fixe de rĂ©pertoire est le rĂ©pertoire oĂč tous les autres fichiers et sous-rĂ©pertoires vont ĂȘtre sauvegardĂ©s, câest-Ă -dire le haut de lâarbre de rĂ©cupĂ©ration. Câest . (le rĂ©pertoire actuel) par dĂ©faut.
Options HTTP
--default-page= nom
Utiliser nom comme nom de fichier par dĂ©faut quand il nâest pas connu (câest-Ă -dire pour les URL finissants avec une barre oblique), au lieu de index.html .
|
-E |
--adjust-extension
Si un fichier de type application/xhtml+xml ou text/html est tĂ©lĂ©chargĂ© et que lâURL ne finit pas par lâexpression rationnelle \.[Hh][Tt][Mm][Ll]? , cette option provoquera le rajout du suffixe .html au nom de fichier local. Câest utile, par exemple, lorsque vous mettez en miroir un site distant qui utilise des pages .asp , mais que vous voulez que les pages mises en miroir puissent ĂȘtre visualisĂ©es sur votre serveur Apache standard. Un autre usage apprĂ©ciable pour cela est quand vous tĂ©lĂ©chargez du matĂ©riel gĂ©nĂ©rĂ© par CGI. Une URL telle que http://site.com/article.cgi?25 sera sauvegardĂ©e comme article.cgi?25.html .
Notez que les noms de fichiers modifiĂ©s ainsi seront tĂ©lĂ©chargĂ©s Ă nouveau chaque fois que vous remettrez en miroir un site, car wget ne peut pas dire que le fichier local X.html correspond Ă lâURL X distante (Ă©tant donnĂ© quâil ne sait pas encore que lâURL produit une sortie sous forme text/html ou application/xhtml+xml .
Avec la version 1.12 wget sâassure aussi que tous les fichiers tĂ©lĂ©chargĂ©s de forme text/css se terminent par le suffixe .css , et lâoption a Ă©tĂ© renommĂ©e de --html-extension , pour mieux reflĂ©ter son nouveau comportement. Lâancien nom de lâoption est encore acceptable, mais devrait ĂȘtre considĂ©rĂ© comme obsolĂšte.
Depuis la version 1.19.2, wget sâassure aussi que tout fichier tĂ©lĂ©chargĂ© avec un "Content-Encoding" de type br , compress , deflate ou gzip finisse avec le suffixe .br , .Z , .zlib et .gz respectivement.
Ă lâavenir, cette option devrait ĂȘtre assez Ă©tendue pour englober les suffixes dâautres types de contenus, incluant ceux qui ne sont pas analysĂ©s par wget .
--http-user=
utilisateur
--http-password=
mot_de_passe
Indiquer le nom dâutilisateur utilisateur et le mot de passe mot_de_passe sur un serveur HTTP. Selon le type dâauthentification par question-rĂ©ponse, wget encodera en utilisant Ă la fois le schĂ©ma dâauthentification «"basic" (non-sĂ©curisĂ©), "digest" ou "NTLM" de Windows.
Une autre maniĂšre dâindiquer le nom dâutilisateur et le mot de passe est de les spĂ©cifier dans lâURL. Les deux mĂ©thodes rĂ©vĂšlent votre mot de passe Ă quiconque se donne la peine dâexĂ©cuter "ps"). Pour empĂȘcher que les mots de passe ne soient vus, utilisez --use-askpass ou stockez-les dans .wgetrc ou .netrc , et assurez vous de protĂ©ger ces fichiers des autres utilisateurs avec "chmod". Si les mots de passe sont trĂšs importants, ne les laissez pas traĂźner dans ces fichiers non plus (Ă©ditez les fichiers et effacez-les aprĂšs que wget a commencĂ© le tĂ©lĂ©chargement).
--no-http-keep-alive
DĂ©sactiver la fonction « keep-alive » pour les tĂ©lĂ©chargements HTTP. Normalement, wget demande au serveur de laisser la connexion ouverte pour que, lorsque vous tĂ©lĂ©chargez plus dâun document sur le mĂȘme serveur, ils soient transfĂ©rĂ©s sur la mĂȘme connexion TCP. Cela Ă©conomise du temps et aussi rĂ©duit la charge sur le serveur.
Cette option a son utilitĂ© quand, pour une raison quelconque, les connexions persistantes (keep-alive) ne fonctionnent pas pour vous, dĂ» par exemple Ă un bogue du serveur ou en raison de lâincapacitĂ© des scripts cĂŽtĂ© serveur Ă gĂ©rer les connexions.
--no-cache
Désactiver le cache coté serveur. Dans ce cas, wget enverra les directives appropriées ( Cache-Control: no-cache et Pragma: no-cache ) au serveur distant pour recevoir les fichier du service distant, au lieu de renvoyer la version mise en cache. Cela est surtout utile pour retrouver et vider les documents obsolÚtes sur des serveurs mandataires.
La mise en cache est autorisée par défaut.
--no-cookies
DĂ©sactiver lâutilisation des cookies. Les cookies sont un mĂ©canisme permettant de conserver lâĂ©tat du serveur. Le serveur envoie au client un cookie utilisant lâen-tĂȘte "Set-Cookie" et le client rĂ©pond avec le mĂȘme cookie lors de requĂȘtes supplĂ©mentaires. Comme les cookies autorisent les propriĂ©taires du serveur Ă garder une trace des visiteurs et pour les sites de sâĂ©changer ces informations, certains considĂšrent cela comme une atteinte Ă la vie privĂ©e. Par dĂ©faut, les cookies sont utilisĂ©s ; cependant, il nây a pas de stockage de cookies par dĂ©faut.
--load-cookies fichier
Charger les cookies dâun fichier avant la premiĂšre rĂ©cupĂ©ration HTTP. fichier est un fichier texte dans le format utilisĂ© Ă lâorigine par les fichiers cookies.txt de Netscape.
Vous utiliserez gĂ©nĂ©ralement cette option pour la mise en place dâun miroir de sites qui exigent que vous soyez connectĂ© pour accĂ©der Ă tout ou partie de leur contenu. Le processus de connexion fonctionne gĂ©nĂ©ralement de la maniĂšre suivante : le serveur Web Ă©met un cookie HTTP aprĂšs avoir reçu et vĂ©rifiĂ© vos identifiants. Le cookie est alors renvoyĂ© par le navigateur pour accĂ©der Ă cette partie du site, et prouve ainsi votre identitĂ©.
La mise en
miroir dâun tel site nĂ©cessite que
wget
renvoie les mĂȘme cookies que ceux envoyĂ©s par
le navigateur lors de la communication avec le site. Cela
est fait par
--load-cookies
; il suffit
dâindiquer Ă
wget
lâemplacement du
fichier
cookies.txt
et il enverra les mĂȘmes
cookies que votre navigateur enverrait dans la mĂȘme
situation. Les différents navigateurs conservent les
fichiers cookies textuels Ă des endroits
différents :
"Netscape 4.x."
Les cookies sont dans Ë/.netscape/cookies.txt .
"Mozilla and Netscape 6.x."
Le fichier de cookies de Mozilla se nomme aussi cookies.txt et se trouve quelque part sous Ë/.mozilla , dans le rĂ©pertoire de votre profil. Le nom de chemin se termine gĂ©nĂ©ralement en quelque chose comme Ë/.mozilla/default/chaĂźne_bizarre/cookies.txt .
"Internet Explorer."
Vous pouvez produire un fichier cookie que wget peut utiliser en utilisant le menu Fichier, Import et Export, Export de cookies. Cela a Ă©tĂ© testĂ© avec Internet Explorer 5 ; il nâest pas garanti que cela fonctionne avec des versions plus rĂ©centes.
"Other browsers."
Si vous utilisez un autre navigateur pour créer vos cookies, --load-cookies ne pourra fonctionner que si vous pouvez situer ou créer un fichier cookie dans le format Netscape comme attendu par wget .
Si vous ne pouvez pas utiliser --load-cookies , il devrait exister une alternative. Si votre navigateur prend en charge un « gestionnaire de cookie », vous pouvez lâutiliser pour visualiser les cookies utilisĂ©s pour accĂ©der au site que vous mettez en miroir. Ăcrire le nom et la valeur du cookie, et donner des instructions manuellement Ă wget pour quâil envoie ces cookies, en contournant le gestionnaire de cookie « officiel » :
wget --no-cookies --header "Cookie: <nom>=<valeur>"
--save-cookies fichier
Sauvegarder les cookies dans fichier avant de quitter. Cela ne sauvegardera pas les cookies qui ont expirĂ©s ou qui nâont pas de dĂ©lai dâexpiration (nommĂ©s les « cookies de session »), mais voir aussi --keep-session-cookies .
--keep-session-cookies
Lorsque indiquĂ©, fait que --save-cookies sauvegarde aussi les cookies de session. Les cookies de session ne sont normalement pas sauvegardĂ©s, car ils sont sensĂ©s ĂȘtre gardĂ©s en mĂ©moire et oubliĂ©s lorsque vous quittez le navigateur. Les sauvegarder est utile sur les sites qui nĂ©cessitent une identification ou une visite de la page dâaccueil avant que vous puissiez accĂ©der Ă certaines pages. Avec cette option, de multiples exĂ©cutions de wget sont considĂ©rĂ©es comme une seule session de navigateur tant que le site est concernĂ©.
Comme le format de fichier de cookie ne contient gĂ©nĂ©ralement pas les cookies de session, wget les marque avec un dĂ©lai dâexpiration de 0 . --load-cookies de wget les reconnaĂźt comme cookies de session, mais cela pourrait ĂȘtre confus pour dâautres navigateurs. Prenez en compte aussi que les cookies chargĂ©s ainsi seront traitĂ©s comme dâautres cookies de session, donc si vous voulez que --save-cookies les conserve Ă nouveau, vous devez utiliser --keep-session-cookies Ă nouveau.
--ignore-length
HĂ©las, quelques serveurs HTTP (les programmes CGI, pour ĂȘtre prĂ©cis) envoient de faux en-tĂȘtes "Content-Length", ce qui rend wget fou, car il pense que tout le document nâa pas Ă©tĂ© rĂ©cupĂ©rĂ©. Vous pouvez repĂ©rer ce syndrome si wget tente Ă plusieurs reprises de rĂ©cupĂ©rer le mĂȘme document, en affirmant Ă chaque fois que la connexion (par ailleurs normale) a Ă©tĂ© fermĂ©e au mĂȘme instant prĂ©cis.
Avec cette option, wget ignorera lâen-tĂȘte "Content-Length", comme sâil nâavait jamais existĂ©.
--header= header-line
Envoyer lâen-tĂȘte de ligne header-line avec le reste des en-tĂȘtes dans chaque requĂȘte HTTP. Lâen-tĂȘte fourni est envoyĂ© tel quel, ce qui signifie quâil doit contenir le nom et la valeur sĂ©parĂ©s par un deux-points, et ne doit pas contenir de passage Ă la ligne.
Vous pouvez dĂ©finir plus dâun en-tĂȘte additionnel en indiquant --header plus dâune fois.
wget
--header='Accept-Charset: iso-8859-2' \
--header='Accept-Language: hr' \
http://fly.srk.fer.hr/
Lâindication dâune chaĂźne vide comme valeur dâen-tĂȘte effacera tous les en-tĂȘtes prĂ©cĂ©demment dĂ©finis par lâutilisateur.
Avec wget 1.10, cette option peut ĂȘtre utilisĂ©e pour Ă©craser les en-tĂȘtes qui autrement auraient Ă©tĂ© gĂ©nĂ©rĂ©s automatiquement. Cet exemple donne lâinstruction Ă wget de se connecter Ă lâhĂŽte local, mais en indiquant truc.machin dans lâen-tĂȘte "Host" :
wget --header="Host: truc.machin" http://localhost/
Dans les versions de wget antĂ©rieures Ă Â 1.10, une telle utilisation de --header provoquait lâenvoi dâen-tĂȘtes en double.
--compression= type
Choisir le type de compression Ă utiliser. Les valeurs permises sont auto , gzip et none .
Si auto ou gzip sont indiquĂ©s, wget demande au serveur de compresser le fichier en utilisant le format gzip de compression. Si le serveur compresse le fichier et rĂ©pond avec le champ dâen-tĂȘte "Content-Encoding" configurĂ© de maniĂšre adĂ©quate, le fichier sera dĂ©compressĂ© automatiquement.
Si none est indiquĂ©, wget ne demandera pas au serveur de compresser le fichier et ne dĂ©compressera aucune rĂ©ponse du serveur. Câest le comportement par dĂ©faut.
La prise en charge de la compression est actuellement expĂ©rimentale. Au cas oĂč la compression est activĂ©e, merci de rapporter tout bogue Ă "bug-wget@gnu.org".
--max-redirect= nombre
Indique le nombre maximal de redirections Ă suivre pour une ressource. Par dĂ©faut, câest 20, ce qui est gĂ©nĂ©ralement largement plus que suffisant. Cependant, en certaines occasions oĂč vous voulez en autoriser plus (ou moins), câest lâoption Ă utiliser.
--proxy-user=
utilisateur
--proxy-password=
mot_de_passe
Indiquer le nom dâutilisateur utilisateur et le mot de passe mot_de_passe pour lâauthentification sur un serveur mandataire. wget les encodera en utilisant le schĂ©ma dâauthentification "basic".
Des considérations de sécurité similaires à celles avec --http-password sont pertinentes ici aussi.
--referer= url
Inclure lâen-tĂȘte « Referer: url » dans la requĂȘte HTTP. Cela est utile pour rĂ©cupĂ©rer des documents avec un traitement de serveur qui suppose quâils sont toujours rĂ©cupĂ©rĂ©s par des navigateurs web interactifs et ne sâen sortent correctement que lorsque le Referer est rĂ©glĂ© sur lâune des pages qui pointent vers eux.
--save-headers
Sauvegarder les en-tĂȘtes envoyĂ©s par le serveur HTTP au fichier, prĂ©cĂ©dant le contenu actuel, avec une ligne vide comme sĂ©parateur.
-U
agent-string
--user-agent=
agent-string
Sâidentifier comme agent-string pour le serveur HTTP.
Le protocole HTTP autorise les clients Ă sâidentifier eux-mĂȘmes en utilisant un champ dâen-tĂȘte "User-Agent". Cela permet de diffĂ©rencier les logiciels WWW, gĂ©nĂ©ralement dans des buts de statistiques ou pour retracer les violations de protocole. Normalement, wget sâidentifie comme Wget/ version , oĂč version est le numĂ©ro de la version actuelle de wget .
Cependant, certains sites sont connus pour imposer la politique dâadaptation de la sortie en fonction des informations fournies par le "User-Agent". Bien que ce ne soit pas une si mauvaise idĂ©e en thĂ©orie, il y a eu des abus par des serveurs refusant lâinformation Ă des clients autres que Netscape (historiquement), ou plus frĂ©quemment, Microsoft Internet Explorer. Cette option vous permet de changer la ligne "User-Agent" fournie par wget . Utiliser cette option est dĂ©conseillĂ©, Ă moins de savoir rĂ©ellement ce que vous faites.
Indiquer un user agent vide avec --user-agent="" demandera Ă wget de ne pas envoyer dâen-tĂȘte "User-Agent" dans les requĂȘtes HTTP.
--post-data=
chaĂźne
--post-file=
fichier
Utiliser POST comme mĂ©thode pour toutes les requĂȘtes HTTP et les envoyer dans le corps de requĂȘtes dĂ©sirĂ©. --post-data envoie chaĂźne comme donnĂ©es, alors que --post-file envoie le contenu de fichier . Ă part cela, ces options fonctionnent exactement de la mĂȘme maniĂšre. En particulier, les deux sâattendent Ă du contenu sous la forme "clĂ©1=valeur1&clĂ©2=valeur2", avec un encodage-pourcent (percent encoding) des caractĂšres spĂ©ciaux ; la seule diffĂ©rence est que lâune attend son contenu comme paramĂštre de ligne de commande et lâautre accepte son contenu dâun fichier. En particulier --post-file nâest pas fait pour transmettre des fichiers sous forme de piĂšces jointes : ceux-lĂ doivent apparaitre comme des donnĂ©es "clĂ©=valeur" (avec lâencodage-pourcent adĂ©quat) juste comme tout le reste. wget ne prend pas actuellement en charge "multipart/form-data" pour transmettre des donnĂ©es POST, mais seulement "application/x-www-form-urlencoded". Seule une des options --post-data ou --post-file doit ĂȘtre spĂ©cifiĂ©e.
Veuillez noter que wget nâexige pas que le contenu soit de la forme "clĂ©1=valeur1&clĂ©2=valeur2", et ne le teste pas non plus. wget transmettra simplement toutes les donnĂ©es qui lui sont fournies. La plupart des serveurs sâattendent toutefois Ă ce que les donnĂ©es POST soient dans le format ci-dessus lors du traitement des formulaires HTML.
Lors de lâenvoi dâune requĂȘte POST Ă lâaide de lâoption --post-file , wget traite le fichier comme un fichier binaire et envoie chaque caractĂšre de la requĂȘte POST sans supprimer les caractĂšres de fin de ligne ou de saut de page. Tout autre caractĂšre de contrĂŽle dans le texte sera aussi envoyĂ© tel quel dans la requĂȘte POST.
Merci de prendre en compte que wget doit connaĂźtre la taille des donnĂ©es POST Ă lâavance. Câest pourquoi lâargument Ă "--post-file" doit ĂȘtre un fichier normal ; spĂ©cifier une FIFO ou quelque chose comme /dev/stdin ne fonctionnera pas. La façon de contourner cette limite inhĂ©rente Ă HTTP/1.0 nâest pas trĂšs claire. Bien que HTTP/1.1 introduise le transfert morcelĂ© qui ne nĂ©cessite pas de connaĂźtre la longueur Ă lâavance, un client ne peut pas utiliser le tronçonnage avant de savoir quâil parle Ă un serveur HTTP/1.1. Et il ne peut pas le savoir avant dâavoir reçu une rĂ©ponse, qui a son tour nĂ©cessite quâune requĂȘte ait abouti (le problĂšme de lâĆuf et de la poule).
Note : Depuis la version 1.15 si wget est redirigĂ© aprĂšs que la requĂȘte POST a terminĂ©, son comportement dĂ©pendra du code de la rĂ©ponse renvoyĂ© par le serveur. Dans le cas dâun 301 Moved Permanently, 302 Moved Temporarily ou 307 Temporary Redirect, wget en accord avec la RFC2616, continuera Ă envoyer une requĂȘte POST. Dans le cas oĂč un serveur veut que le client change la mĂ©thode de requĂȘte lors de la redirection, il devrait envoyer un code de rĂ©ponse 303 See Other.
Cet exemple montre comment se connecter à un serveur en utilisant POST et ensuite procéder au téléchargement des pages souhaitées, vraisemblablement accessibles uniquement aux utilisateurs autorisés :
# Se connecter
au serveur. Cela ne peut ĂȘtre fait quâune fois.
wget --save-cookies cookies.txt \
--post-data 'user=truc&password=machin' \
http://example.com/auth.php
# Maintenant prendre la ou les pages qui nous
intéressent.
wget --load-cookies cookies.txt \
-p http://example.com/interesting/article.php
Si le serveur utilise des cookies de session pour tracer lâauthentification de lâutilisateur, lâexemple ci-dessus ne fonctionnera pas car --save-cookies ne les sauvegardera pas (comme aucun navigateur) et le fichier cookies.txt sera vide. Dans ce cas, utiliser --keep-session-cookies avec --save-cookies pour forcer la sauvegarde des cookies de session.
--method= HTTP-Method
Pour les besoins des scripts RESTful, wget permet lâenvoi dâautres mĂ©thodes HTTP sans avoir besoin de les dĂ©finir explicitement en utilisant --header=Header-Line . wget utilisera nâimporte quelle chaĂźne qui lui sera passĂ© aprĂšs --method comme mĂ©thode HTTP pour le serveur.
--body-data=
chaßne-données
--body-file=
Fichier-données
Doit ĂȘtre positionnĂ© lorsque des donnĂ©es additionnelles nĂ©cessitent dâĂȘtre envoyĂ©es au serveur avec la mĂ©thode prĂ©conisĂ©e par lâutilisation de --method . --body-data envoie une chaĂźne comme donnĂ©es, alors que --body-file envoie le contenu de fichier . Autrement, ils fonctionnent exactement pareil.
Actuellement, --body-file ne transmet pas les fichiers comme un tout. wget ne prend actuellement pas en charge "multipart/form-data" pour la transmission de donnĂ©es, mais seulement "application/x-www-form-urlencoded". Dans le futur, cela devrait changer pour que wget puisse envoyer le fichier --body-file comme un fichier complet, au lieu dâenvoyer son contenu au serveur. Veuillez prendre en compte que wget nĂ©cessite de connaĂźtre le contenu des donnĂ©es BODY Ă lâavance et donc lâargument de --body-file devrait ĂȘtre un fichier ordinaire. Voir --post-file pour des explications plus dĂ©taillĂ©es. Une seule des options --body-data et --body-file devra ĂȘtre spĂ©cifiĂ©e.
Si wget est redirigĂ© aprĂšs la fin de la requĂȘte, wget suspend la mĂ©thode en cours et envoie une requĂȘte GET jusquâĂ ce que la redirection soit terminĂ©e. Cela est vrai pour tous les codes de rĂ©ponse Ă lâexception de 307 Temporary Redirect qui est utilisĂ© pour indiquer explicitement que la mĂ©thode de requĂȘte ne devrait pas changer. Une autre exception est quand la mĂ©thode est positionnĂ©e Ă "POST", auquel cas les rĂšgles de redirection indiquĂ©es avec --post-data sont suivies.
--content-disposition
Si lâoption est positionnĂ©e, la prise en charge expĂ©rimentale (pas complĂštement fonctionnelle) des en-tĂȘtes "Content-Disposition" est activĂ©e. Cela peut actuellement entraĂźner des allers-retours supplĂ©mentaires vers le serveur pour une requĂȘte "HEAD", et souffre de quelques bogues connus, câest pourquoi ce nâest pas actuellement activĂ© par dĂ©faut.
Cette option est utile pour quelques programmes de tĂ©lĂ©chargement CGI qui utilisent des en-tĂȘtes "Content-Disposition" pour dĂ©crire Ă quoi devrait ressembler le nom dâun fichier tĂ©lĂ©chargĂ©.
Quand il est combinĂ© avec --metalink-over-http et --trust-server-names , un fichier Content-Type: application/metalink4+xml est nommĂ© en utilisant le champ de nom de fichier de "Content-Disposition", sâil est disponible.
--content-on-error
Si cela est activĂ©, wget ne sautera pas le contenu lorsque le serveur rĂ©pond avec un code dâĂ©tat http qui indique une erreur.
--trust-server-names
Si cela est activĂ©, lors dâune redirection, le nom du fichier local sera basĂ© sur lâURL de redirection. Par dĂ©faut le nom du fichier local est basĂ© sur lâURL dâorigine. Lors dâune recherche rĂ©cursive, cela peut ĂȘtre utile car dans de nombreux sites web, les URL redirigĂ©es correspondent Ă une structure de fichiers sous-jacente, alors que les URL de liens ne le font pas.
--auth-no-challenge
Si cette option est passĂ©e, wget enverra une information dâauthentification HTTP basique (nom dâutilisateur et mot de passe en texte clair) pour toutes les requĂȘtes, comme le fait par dĂ©faut wget 1.10.2 et antĂ©rieurs.
Lâutilisation de cette option est dĂ©conseillĂ©e, et est destinĂ©e uniquement Ă la prise en charge de quelques serveurs obscurs, qui nâenvoient jamais dâauthentification par question-rĂ©ponse HTTP, mais acceptent les informations dâauthentification non sollicitĂ©es, disons, en plus de lâauthentification par formulaire.
--retry-on-host-error
ConsidĂ©rer les erreurs de lâhĂŽte, telles que « Ăchec temporaire dans la rĂ©solution du nom », comme des erreurs non fatales et transitoires.
--retry-on-http-error= code[,code,...]
ConsidĂ©rer les codes de rĂ©ponse HTTP donnĂ©s comme des erreurs non-fatales et transitoires. Fournir une liste de codes de rĂ©ponse HTTP Ă trois chiffres sĂ©parĂ©s par des virgules comme argument. Utile pour travailler dans certaines circonstances oĂč les rĂ©essais sont nĂ©cessaires, mais oĂč le serveur rĂ©pond avec un code dâerreur que wget ne rĂ©essaye pas normalement. Ces erreurs devraient ĂȘtre 503 (Service non disponible) et 429 (Trop de requĂȘtes). Les tentatives activĂ©es par cette option sont effectuĂ©es sous rĂ©serve des limitations normales de wget en matiĂšre de dĂ©lais et de nombre de tentatives.
Lâutilisation de cette option nâest prĂ©vue que pour des cas dâutilisation particuliers et nâest gĂ©nĂ©ralement pas recommandĂ©e, car elle peut forcer des tentatives mĂȘme dans les cas oĂč le serveur essaie rĂ©ellement de rĂ©duire sa charge. Veuillez lâutiliser Ă bon escient et seulement si vous savez ce que vous faites.
Options HTTPS (SSL/TLS)
Pour la prise en
charge des téléchargements HTTP (HTTPS)
chiffrés,
wget
doit ĂȘtre compilĂ©
avec une bibliothĂšque SSL externe. Habituellement par
dĂ©faut câest GnuTLS. En plus,
wget
prend
aussi en charge HSTSÂ (HTTP Strict Transport Security).
Si
wget
est compilé sans la prise en charge de
SSL, aucune de ces options nâest disponible.
--secure-protocol=
protocole
Choisir le protocole de sĂ©curitĂ© Ă utiliser. Les valeurs autorisĂ©es sont auto , SSLv2 , SSLv3 , TLSv1 , TLSv1_1 , TLSv1_2 , TLSv1_3 et PFS . Si auto est utilisĂ©, le choix est donnĂ© Ă la bibliothĂšque SSL de choisir le protocole appropriĂ© automatiquement, qui sâachĂšve par lâenvoi dâun salut TLSv1. Câest le comportement par dĂ©faut.
Indiquer SSLv2 , SSLv3 , TLSv1 , TLSv1_1 , TLSv1_2 ou TLSv1_3 force lâutilisation du protocole correspondant. Cette fonction est utile lorsque lâon sâadresse Ă des implĂ©mentations de serveur SSL anciennes et boguĂ©es qui rendent le choix de la version correcte du protocole difficile pour la bibliothĂšque SSL sous-jacente. Heureusement, de tels serveurs sont assez rares.
La spĂ©cification de PFS impose lâutilisation des suites de chiffrement dites « Perfect Forward Security ». Pour faire court, PFS ajoute une sĂ©curitĂ© en crĂ©ant une clĂ© Ă usage unique pour chaque connexion SSL. Cela a un impact un peu plus important sur le CPU du client et du serveur. Nous utilisons des chiffrements connus pour ĂȘtre sĂ»rs (par exemple, pas de MD4) et le protocole TLS. Ce mode exclut Ă©galement de maniĂšre explicite les mĂ©thodes dâĂ©change de clĂ©s non SFP, telles que RSA.
--https-only
En mode récursif, seuls les liens HTTPS sont suivis.
--ciphers
DĂ©finir la chaĂźne de listes de chiffrement. Normalement cette chaĂźne dĂ©finit les suites de chiffrement et autres options SSL/TLS que lâutilisateur voudrait utiliser, avec un ordre de prĂ©fĂ©rence (GnuTLS lâappelle « chaĂźne prioritaire »). Cette chaĂźne sera envoyĂ©e littĂ©ralement au moteur SSL/TLS (OpenSSL ou GnuTLS) et donc son format et sa syntaxe en dĂ©pendront. wget ne la traitera ni ne la manipulera en aucune façon. Se rĂ©fĂ©rer Ă la documentation dâOpenSSL ou de GnuTLS pour de plus amples informations.
--no-check-certificate
Ne pas vĂ©rifier le certificat du serveur auprĂšs des autoritĂ©s de certification disponibles. Ne pas requĂ©rir non plus que le nom dâhĂŽte de lâURL corresponde au nom commun prĂ©sentĂ© par le certificat.
Par dĂ©faut, wget 1.10 vĂ©rifie le certificat du serveur auprĂšs des autoritĂ©s de certification reconnues, cassant lâĂ©tablissement de la liaison SSL et stoppant le tĂ©lĂ©chargement si la vĂ©rification Ă©choue. Aussi, mĂȘme si cela procure des tĂ©lĂ©chargements plus sĂ»rs, cela casse lâinteropĂ©rabilitĂ© avec certains sites qui fonctionnent avec des versions prĂ©cĂ©dentes de wget , en particulier ceux qui utilisent des certificats auto-signĂ©s, expirĂ©s ou non valables. Cette option force le mode « insecure » qui transforme les erreurs de vĂ©rification de certificats en avertissements, permettant ainsi de poursuivre.
Si vous rencontrez des erreurs « certificate verification » ou qui indiquent « le nom courant ne correspond pas au nom dâhĂŽte demandé », vous pouvez utiliser cette option pour outrepasser la vĂ©rification. Nâutilisez cette option que si vous ĂȘtes convaincu par un autre moyen de lâauthenticitĂ© du site, ou si vraiment peu vous importe la validitĂ© de son certificat. Câest presque toujours une mauvaise idĂ©e de ne pas vĂ©rifier les certificats lors de la transmission de donnĂ©es confidentielles ou importantes. Pour les certificats auto-signĂ©s, vous devriez tĂ©lĂ©charger le certificat pour le vĂ©rifier au lieu de forcer en mode non sĂ©curisĂ©. Si vous ĂȘtes vraiment sĂ»r de ne vouloir aucune vĂ©rification de certificat, vous pouvez indiquer --check-certificate=quiet pour dire Ă wget de ne pas afficher dâavertissements au sujet des certificats non valables, bien que dans la plupart des cas ce soit la mauvaise chose Ă faire.
--certificate= fichier
Utiliser le certificat du client stockĂ© dans fichier . Cela est nĂ©cessaire pour les serveurs qui sont configurĂ©s pour demander les certificats des clients qui sây connectent. Normalement, un certificat nâest pas demandĂ© et cette option est optionnelle.
--certificate-type= type
Indiquer le type de certificat du client. Les valeurs autorisées sont PEM (par défaut) et DER , aussi connu comme ASN1 .
--private-key= fichier
Lire la clé privée dans fichier . Cela vous permet de fournir la clé privée dans un fichier séparé du certificat.
--private-key-type= type
Indiquer le type de la clé privée. Les valeurs acceptées sont PEM (par défaut) et DER .
--ca-certificate= fichier
Utiliser fichier comme fichier contenant le paquet dâautoritĂ©s de certification (« CA ») pour vĂ©rifier les pairs. Les certificats doivent ĂȘtre au format PEM.
Sans cette option wget cherche les certificats CA aux endroits spécifiés par le systÚme, choisis par OpenSSL lors de son installation.
--ca-directory= répertoire
Indiquer le rĂ©pertoire contenant les certificats CA au format PEM. Chaque fichier contient un certificat CA, et le nom du fichier est basĂ© sur une valeur de hachage dĂ©rivĂ©e du certificat. Cela est rĂ©alisĂ© en traitant un rĂ©pertoire de certificats avec lâutilitaire "c_rehash" fourni avec OpenSSL. Lâutilisation de --ca-directory est plus efficace que --ca-certificate lorsque plusieurs certificats sont installĂ©s car cela permet Ă wget de rĂ©cupĂ©rer les certificats sur demande.
Sans cette option wget cherche les certificats CA aux endroits spécifiés par le systÚme, choisis par OpenSSL lors de son installation.
--crl-file= fichier
Indiquer un fichier CRL dans fichier . Cela est nécessaire pour les certificats révoqués par les Autorités de Certifications.
--pinnedpubkey=file/hashes
Dire Ă wget dâutiliser la clĂ© publique indiquĂ©e (ou les hachages) pour vĂ©rifier le pair. Cela peut ĂȘtre un chemin qui contient une seule clĂ© publique au format PEM ou DER, ou tout nombre de hachage sha256 encodĂ© en base64 prĂ©cĂ©dĂ© de « sha256 » et sĂ©parĂ© par « ; »
Lors de la nĂ©gociation dâune connexion TLS ou SSL, le serveur envoie un certificat prouvant son identitĂ©. Une clĂ© publique est extraite de ce certificat et si cela ne correspond pas exactement Ă une des clĂ©s publique fournies Ă cette option, wget annulera la connexion avant lâenvoi ou la rĂ©ception de donnĂ©es.
--random-file= fichier
[OpenSSL et LibreSSL seulement] Utiliser fichier comme source de données aléatoires pour ensemencer le générateur de nombres pseudo-aléatoires sur les systÚmes sans /dev/urandom .
Sur de tels systĂšmes, la bibliothĂšque SSL a besoin dâune source extĂ©rieure de donnĂ©es alĂ©atoires pour sâinitialiser. Les donnĂ©es alĂ©atoires pouvaient ĂȘtre fournies par EGD (voir --egd-file ci-dessous) ou lues sur une source extĂ©rieure spĂ©cifiĂ©e par lâutilisateur. Si cette option nâest pas indiquĂ©e, wget cherchera les donnĂ©es alĂ©atoires dans $RANDFILE ou, sâil nâest pas dĂ©fini, dans $HOME/.rnd.
Si vous obtenez lâerreur « Could not seed OpenSSL PRNG; disabling SSL », vous devriez fournir des donnĂ©es alĂ©atoires en utilisant lâune des mĂ©thodes dĂ©crites ci-dessus.
--egd-file= fichier
[seulement pour OpenSSL] Utiliser fichier comme socket EGD. EGD signifie Entropy Gathering Daemon , un programme de lâespace utilisateur qui collecte des donnĂ©es Ă partir de diverses sources systĂšme imprĂ©visibles et les met Ă la disposition dâautres programmes qui pourraient en avoir besoin. Les logiciels de chiffrement, tels que la bibliothĂšque SSL, ont besoin de sources dâalĂ©as non rĂ©pĂ©titifs pour ensemencer le gĂ©nĂ©rateur de nombres alĂ©atoires utilisĂ© pour produire des clĂ©s cryptographiques solides.
OpenSSL autorise lâutilisateur Ă indiquer sa propre source dâentropie en utilisant la variable dâenvironnement "RAND_FILE". Si cette variable nâest pas dĂ©finie, ou si le fichier indiquĂ© ne produit pas assez de caractĂšres alĂ©atoires, OpenSSL lira les donnĂ©es alĂ©atoires du socket EGD indiquĂ© en utilisant cette option.
Si cette option nâest pas indiquĂ©e (et que la commande Ă©quivalente de dĂ©marrage nâest pas utilisĂ©e), EGD nâest jamais contactĂ©. EGD nâest pas nĂ©cessaire sur les systĂšmes Unix modernes qui prennent en charge /dev/urandom .
--no-hsts
wget prend en charge HSTS (HTTP Strict Transport Security, RFC 6797) par dĂ©faut. Utiliser --no-hsts pour faire que wget se comporte comme un UA non compatible avec HSTS. Comme consĂ©quence wget ignorera tous les en-tĂȘtes "Strict-Transport-Security", et ne voudra appliquer aucune politique HSTS existante.
--hsts-file= fichier
Par dĂ©faut, wget stocke sa base de donnĂ©es HSTS dans Ë/.wget-hsts . Vous pouvez utiliser --hsts-file pour Ă©craser cela. wget utilisera le fichier fourni comme base de donnĂ©es HSTS. Un tel fichier doit ĂȘtre conforme au format de base de donnĂ©es HSTS utilisĂ© par wget . Si wget ne peut pas analyser le fichier fourni, le comportement est indĂ©terminĂ©.
La base de donnĂ©es HSTS de wget est un fichier en texte brut. Chaque ligne contient une entrĂ©e HSTS (câest-Ă -dire le site qui a fourni un en-tĂȘte "Strict-Transport-Security" et a nĂ©anmoins indiquĂ© une politique concrĂšte HSTS Ă appliquer). Les lignes commençant par un croisillon ("#") sont ignorĂ©es par wget . Veuillez noter quâen dĂ©pit de cette facilitĂ© de lecture, la crĂ©ation manuelle de la base de donnĂ©es HSTS nâest gĂ©nĂ©ralement pas une bonne idĂ©e.
Une entrée de ligne HSTS consiste en plusieurs champs séparés par un ou plusieurs espaces blancs :
"<hostname> SP [<port>] SP <include subdomains> SP <created> SP <max-age>"
Les champs hostname et port indiquent le nom de lâhĂŽte et le port sur lequel est appliquĂ©e la politique HSTS indiquĂ©e. Le champ port peut ĂȘtre zĂ©ro, et le sera, dans la majoritĂ© des cas. Cela signifie que le numĂ©ro de port ne sera pas pris en compte lors de la dĂ©cision dâappliquer telle ou telle politique HSTS pour une requĂȘte donnĂ©e (seul le nom dâhĂŽte sera Ă©valuĂ©). Lorsque port est diffĂ©rent de zĂ©ro, Ă la fois le nom dâhĂŽte et le port seront Ă©valuĂ©s et la politique HSTS sera appliquĂ©e si les deux correspondent. Cette option a Ă©tĂ© incluse Ă des fins de test et de dĂ©veloppement surtout. La suite de tests de wget (dans testenv/ ) crĂ©e des bases de donnĂ©es HSTS avec des ports explicites dans le but dâassurer un comportement correct Ă wget . Lâutilisation de politiques HSTS sur des ports autres que ceux par dĂ©faut est dĂ©conseillĂ©e par la RFC 6797 (voir lâappendice B « Differences between HSTS Policy and Same-Origin Policy »). Ainsi, cette option ne devrait pas ĂȘtre utilisĂ©e dans des environnements en production et le port sera typiquement zĂ©ro. Les trois derniers champs font ce quâon attend dâeux. Le champ include_subdomains peut ĂȘtre 1 ou 0 et indique si les sous-domaines du domaine cible devraient aussi faire partie de la politique HSTS donnĂ©e. Les champs create et max-age portent lâhorodatage de la crĂ©ation de lâentrĂ©e (comme vu par wget ) et la valeur dĂ©finie par HSTS « max-age », qui dĂ©finit combien de temps la politique HSTS devrait rester activĂ©e, mesurĂ© en secondes Ă©coulĂ©es depuis le dĂ©lai stockĂ© dans created . Une fois ce temps Ă©coulĂ©, la politique HSTS ne sera plus valable et sera finalement enlevĂ©e de la base de donnĂ©es.
Si vous fournissez votre propre base de donnĂ©es HSTS Ă lâaide de --hsts-file , sachez que wget peut modifier le fichier fourni si un changement se produit entre les politiques HSTS demandĂ©es par les serveurs distants et celles du fichier. Quand wget se termine, il met effectivement Ă jour la base de donnĂ©es HSTS en réécrivant le fichier de base de donnĂ©es avec les nouvelles entrĂ©es.
Si le fichier fourni nâexiste pas, wget en crĂ©era un. Ce fichier contiendra les nouvelles entrĂ©es HSTS. Si aucune entrĂ©e HSTS nâa Ă©tĂ© crĂ©e (aucun en-tĂȘte "Strict-Transport-Security" nâa Ă©tĂ© envoyĂ© par aucun des serveurs) alors aucun fichier nâest créé, mĂȘme pas un vide. Ce comportement sâapplique aussi au fichier de base de donnĂ©es par dĂ©faut ( Ë/.wget-hsts ) : il ne sera pas créé, sauf par un serveur qui force la politique HSTS.
Lâattention est mise sur le fait de ne pas Ă©craser de possibles changements faits par dâautres wget au mĂȘme moment sur la base de donnĂ©es HSTS. Avant de dĂ©poser les entrĂ©es HSTS mises Ă jour dans le fichier, wget le relit et fusionne les modifications.
Il est dĂ©conseillĂ© dâutiliser une base de donnĂ©es HSTS personnalisĂ©e ou de modifier une base existante. Pour plus dâinformations sur les menaces de sĂ©curitĂ© potentielles dĂ©coulant dâune telle pratique, consultez la section 14 « ConsidĂ©rations de sĂ©curité » de la RFC 6797 en particulier la section 14.9 « Manipulation crĂ©ative du stockage de politique HSTS  ».
--warc-file= fichier
Utiliser fichier comme fichier WARC de destination.
--warc-header= chaĂźne
Utiliser chaĂźne dans lâenregistrement warcinfo.
--warc-max-size= taille
Définir la taille maximale des fichiers WARC à taille .
--warc-cdx
Ăcrire les fichiers index CDX.
--warc-dedup= fichier
Ne pas conserver les documents répertoriés dans ce fichier CDX.
--no-warc-compression
Ne pas compresser les fichiers WARC avec GZIP.
--no-warc-digests
Ne pas calculer les sommes de contrĂŽle SHA1.
--no-warc-keep-log
Ne pas stocker le fichier journal dans un enregistrement WARC.
--warc-tempdir= répertoire
Indiquer lâemplacement des fichiers temporaires créés par le rĂ©dacteur WARC.
Options FTP
--ftp-user=
utilisateur
--ftp-password=
mot_de_passe
Indiquer le nom de lâutilisateur utilisateur et le mot de passe mot_de_passe sur un serveur FTP. Sans cela ou lâoption de dĂ©marrage adĂ©quate, le mot de passe par dĂ©faut est -wget@ , normalement utilisĂ© pour un FTP anonyme.
Le nom dâutilisateur et le mot de passe peuvent ĂȘtre indiquĂ©s diffĂ©remment dans lâURL. Chaque mĂ©thode rĂ©vĂšle votre mot de passe Ă quiconque se donne la peine dâexĂ©cuter "ps". Pour empĂȘcher que vos mots de passe soient vus, stockez les dans .wgetrc ou .netrc , et assurez-vous de protĂ©ger ces fichiers des autres utilisateurs avec "chmod". Si les mots de passe sont trĂšs importants, vous ne devriez pas les laisser traĂźner dans ces fichiers non plus (Ă©ditez les fichiers et effacez les aprĂšs que wget ait commencĂ© le tĂ©lĂ©chargement).
--no-remove-listing
Ne pas supprimer les fichiers temporaires .listing gĂ©nĂ©rĂ©s par les rĂ©cupĂ©rations FTP. Normalement, ces fichiers contiennent les listings bruts de rĂ©pertoires reçus des serveurs FTP. Ne pas les supprimer peut ĂȘtre utile pour des objectifs de dĂ©bogage, ou quand vous voulez ĂȘtre facilement capable de vĂ©rifier le contenu des rĂ©pertoires du serveur distant (par exemple, pour vĂ©rifier que le miroir que vous lancez est complet).
Remarquez que mĂȘme si wget Ă©crit dans un nom de fichier connu pour ce fichier, ce nâest pas une faille de sĂ©curitĂ© dans le scĂ©nario dâun utilisateur faisant de .listing un lien symbolique vers /etc/passwd ou autre et demandant Ă "root" dâexĂ©cuter wget dans son rĂ©pertoire. Selon les options utilisĂ©es, soit wget refusera dâĂ©crire dans .listing , faisant Ă©chouer lâopĂ©ration de globbing/rĂ©cursion/horodatage, soit le lien symbolique sera supprimĂ© et remplacĂ© par le fichier .listing rĂ©el, soit le listing sera Ă©crit dans un fichier .listing.numĂ©ro .
MĂȘme dans cette situation, cela nâest pas un problĂšme, bien que, "root" ne devrait jamais lancer wget dans un rĂ©pertoire utilisateur non sĂ©curisĂ©. Un utilisateur pourrait faire quelque chose dâaussi simple quâun lien de index.html Ă /etc/passwd et demander Ă "root" de lancer wget avec -N ou -r et ainsi Ă©craser le fichier.
--no-glob
DĂ©sactiver le globbing FTP. Globbing (englober) rĂ©fĂšre Ă lâutilisation de caractĂšres spĂ©ciaux ( jokers ) Ă la façon du shell, tels que * , ? , [ et ] pour retrouver plus dâun fichier dans le mĂȘme rĂ©pertoire en une fois, comme :
wget ftp://gnjilux.srk.fer.hr/*.msg
Par dĂ©faut, la fonction de globbing est activĂ©e si lâURL contient un caractĂšre de globbing. Cette option peut ĂȘtre utilisĂ©e pour activer ou dĂ©sactiver le globbing de maniĂšre permanente.
Vous devrez peut-ĂȘtre mettre entre guillemets lâURL pour le protĂ©ger de lâexpansion par votre interprĂ©teur de commandes. Le globbing fait que wget cherche une liste de rĂ©pertoires, ce qui est spĂ©cifique au systĂšme. Câest pourquoi cela ne fonctionne actuellement quâavec les serveurs FTP Unix (et ceux qui Ă©mulent la sortie "ls" dâUnix).
--no-passive-ftp
DĂ©sactiver lâutilisation du mode de transfert FTP passif . Le mode FTP passif implique que le client se connecte au serveur pour Ă©tablir la connexion de donnĂ©es plutĂŽt que lâinverse.
Si la machine est connectĂ©e directement Ă Internet, FTP actif et passif devraient fonctionner aussi bien lâun que lâautre. DerriĂšre la plupart des configurations de pare-feu et de NAT, le FTP passif a plus de chance de fonctionner. Cependant, dans certaines configurations rares de pare-feu, le FTP actif fonctionne alors que le FTP passif ne fonctionne pas. Si vous pensez que câest le cas, utilisez cette option, ou dĂ©finissez "passive_ftp=off" dans votre fichier init.
--preserve-permissions
Préserver les permissions de fichiers distants au lieu des permissions définies par umask.
--retr-symlinks
Par dĂ©faut, lors de la rĂ©cupĂ©ration rĂ©cursive des rĂ©pertoires FTP et quâun lien symbolique est rencontrĂ©, le lien symbolique est suivi et les fichiers pointĂ©s sont rĂ©cupĂ©rĂ©s. Actuellement, wget ne suit pas les liens symboliques pour tĂ©lĂ©charger les rĂ©pertoires rĂ©cursivement, bien que cette option pourrait ĂȘtre ajoutĂ©e dans le futur.
Lorsque --retr-symlinks=no est indiquĂ©, le fichier pointĂ© nâest pas tĂ©lĂ©chargĂ©. Ă la place, un lien symbolique correspondant est créé sur le systĂšme de fichiers local. Le fichier pointĂ© ne sera pas rĂ©cupĂ©rĂ© sauf si la rĂ©cupĂ©ration rĂ©cursive le rencontre autrement et le tĂ©lĂ©charge de toutes façons. Cette option pose un risque de sĂ©curitĂ© oĂč un serveur FTP malveillant pourrait amener wget Ă Ă©crire dans des fichiers situĂ©s en dehors des rĂ©pertoires prĂ©vus par le biais dâun fichier .LISTING spĂ©cialement contrefait.
Notez que cette option nâa aucun effet lors de la rĂ©cupĂ©ration dâun fichier (pas dâun rĂ©pertoire) parce quâil a Ă©tĂ© indiquĂ© dans la ligne de commandes plutĂŽt que trouvĂ© par rĂ©cursion. Les liens symboliques sont toujours suivis dans ce cas.
Options FTPS
--ftps-implicit
Cette option indique Ă wget dâutiliser FTPS implicitement. FTPS implicite consiste Ă initialiser SSL/TLS au tout dĂ©but de la connexion de contrĂŽle. Cette option nâenvoie pas de commande "AUTH TLS" : elle prĂ©sume que le serveur parle FTPS et dĂ©marre directement une connexion SSL/TLS. Si la tentative rĂ©ussit, la session continue juste comme FTPS normal ("PBSZ" et "PROT" sont envoyĂ©s, etc). FTPS implicite nâest plus un prĂ©requis pour les implĂ©mentations FTPS, donc beaucoup de serveurs ne le prennent pas en charge. Si --ftps-implicit est passĂ© et quâaucun numĂ©ro de port explicite nâest indiquĂ©, le port par dĂ©faut pour le FTPS implicite, 1990, sera utilisĂ©, au lieu du port par dĂ©faut pour le FTPS « normal » (explicite), qui est le mĂȘme que celui pour FTP, 21.
--no-ftps-resume-ssl
Ne pas reprendre la session SSL/TLS dans le canal de donnĂ©es. Lors du dĂ©marrage dâune connexion de donnĂ©es, wget essaiera de reprendre la session SSL/TLS prĂ©cĂ©demment dĂ©marrĂ©e dans la connexion de contrĂŽle. La reprise de session SSL/TLS Ă©vite dâeffectuer une poignĂ©e de main entiĂšrement nouvelle en rĂ©utilisant les paramĂštres SSL/TLS dâune session prĂ©cĂ©dente. Habituellement, les serveurs FTPS souhaitent cela, aussi wget le fait par dĂ©faut. Dans de rares circonstances nĂ©anmoins, il serait possible de souhaiter dĂ©marrer une session SSL/TLS entiĂšrement nouvelle Ă chaque connexion de donnĂ©es. Câest Ă cela que --no-ftps-resume-ssl est destinĂ©.
--ftps-clear-data-connection
Toutes les connexions de donnĂ©es seront en texte brut. Seule la connexion de contrĂŽle sera sous SSL/TLS. wget enverra une commande "PROT C" pour rĂ©aliser cela, ce qui doit ĂȘtre approuvĂ© par le serveur.
--ftps-fallback-to-ftp
Revenir Ă FTP si FTPS nâest pas pris en charge par le serveur cible. Pour des raisons de sĂ©curitĂ©, cette option nâest pas dĂ©clarĂ©e par dĂ©faut. Le comportement par dĂ©faut est de quitter avec une erreur. Si un serveur ne rĂ©pond pas avec succĂšs Ă la commande initiale "AUTH TLS", ou dans le cas du FTPS, implicite si la tentative de connexion SSL/TLS initiale est rejetĂ©e, on considĂšre ce serveur comme ne prenant pas en charge FTPS.
Options de récupération récursive
|
-r |
--recursive
Activer la récupération récursive. La profondeur maximale par défaut est 5 .
-l
profondeur
--level=
profondeur
DĂ©finir le nombre maximal de sous-rĂ©pertoires dans lesquels wget fera une rĂ©cursion Ă profondeur . Dans le but dâĂ©viter de tĂ©lĂ©charger de trĂšs grands sites web, lors de lâutilisation de la rĂ©cursion, cela est limitĂ© Ă une profondeur de 5 par dĂ©faut, câest Ă dire quâil traversera au plus 5 rĂ©pertoires en profondeur en commençant Ă lâURL fournie. Indiquer -l 0 ou -l inf pour une profondeur de rĂ©cursion infinie.
wget -r -l 0 http://<site>/1.html
IdĂ©alement, on pourrait sâattendre Ă ce que cela ne tĂ©lĂ©charge que 1.html , mais malheureusement ce nâest pas le cas, car -l 0 est Ă©quivalent Ă -l inf (ce qui est la rĂ©cursion infinie). Pour tĂ©lĂ©charger une seule page HTML (ou quelques pages), indiquez les sur la ligne de commande et dĂ©laissez -r et -l . Pour tĂ©lĂ©charger les Ă©lĂ©ments essentiels Ă lâaffichage dâune seule page HTML, consulter page requisites .
--delete-after
Cette option indique Ă wget de supprimer chaque fichier quâil tĂ©lĂ©charge, aprĂšs lâavoir fait. Elle est utile pour prĂ©charger des pages populaires Ă travers un mandataire, par exemple :
wget -r -nd --delete-after http://toto.com/Ëpage/populaire/
Lâoption -r est pour rĂ©cupĂ©rer rĂ©cursivement et -nd pour ne pas crĂ©er de rĂ©pertoires.
Remarquez que --delete-after efface les fichiers sur la machine locale. Cela nâĂ©met pas la commande DELE pour les sites FTP distants, par exemple. Notez aussi que lorsque --delete-after est indiquĂ©, --convert-links est ignorĂ©, ainsi les fichiers .orig ne sont tout simplement pas créés en premier lieu.
|
-k |
--convert-links
Une fois le téléchargement terminé, convertir les liens du document pour les rendre adaptés à un affichage local. Cela concerne non seulement les hyperliens visibles, mais aussi toute partie du document qui renvoie à un contenu externe, comme les images intégrées, les liens vers des feuilles de style, les hyperliens vers du contenu non HTML, etc.
Chaque lien sera changĂ© dâune maniĂšre ou dâune autre :
|
- |
Les liens vers les fichiers qui ont Ă©tĂ© tĂ©lĂ©chargĂ©s par wget seront modifiĂ©s pour faire rĂ©fĂ©rence au fichier quâils pointent comme lien relatif. |
Exemple : si le fichier téléchargé /toto/doc.html pointe vers /machin/img.gif aussi téléchargé, alors le lien dans doc.html sera modifié pour pointer vers ../machin/img.gif . Ce genre de transformation fonctionne pour relier des combinaisons arbitraires de répertoires.
|
- |
Les liens des fichiers qui nâont pas Ă©tĂ© tĂ©lĂ©chargĂ©s par wget seront modifiĂ©s pour inclure le nom dâhĂŽte et le chemin absolu de lâemplacement vers lequel ils pointent. |
Exemple : si le fichier téléchargé /toto/doc.html pointe vers /machin/img.gif (ou vers ../machin/img.gif ), alors le lien dans doc.html sera modifié pour pointer vers http://nomdhÎte/machin/img.gif .
De ce fait, la navigation locale fonctionne de maniĂšre fiable : si un fichier liĂ© a Ă©tĂ© tĂ©lĂ©chargĂ©, le lien renverra Ă son nom local ; sâil nâa pas Ă©tĂ© tĂ©lĂ©chargĂ©, le lien renverra Ă son adresse Internet complĂšte plutĂŽt que de prĂ©senter un lien brisĂ©. Le fait que les anciens liens soient convertis en liens relatifs garantit que vous pouvez dĂ©placer la hiĂ©rarchie tĂ©lĂ©chargĂ©e vers un autre rĂ©pertoire.
Notez que ce nâest quâĂ la fin du tĂ©lĂ©chargement que wget peut savoir quels liens ont Ă©tĂ© tĂ©lĂ©chargĂ©s. De ce fait, le travail effectuĂ© par -k sera rĂ©alisĂ© Ă la fin de tous les tĂ©lĂ©chargements.
--convert-file-only
Cette option ne convertit que la partie nom de fichier des URL, laissant le reste des URL intactes. La partie nom de fichier réfÚre parfois au « nom de base », mais nous éludons ce terme ici pour ne pas créer de confusion.
Cela fonctionne particuliĂšrement bien en conjonction avec --adjust-extension , mĂȘme si ce couplage nâest pas appliquĂ©. Cela est utile pour alimenter les caches Internet avec des fichiers tĂ©lĂ©chargĂ©s Ă partir de diffĂ©rents hĂŽtes.
Exemple : si un lien pointe vers //toto.com/machin.cgi?xyz avec --adjust-extension activĂ© et sa destination locale Ă©tant prĂ©vue dâĂȘtre /toto.com/machin.cgi?xyz.css , alors le lien devrait ĂȘtre converti en //toto.com/machin.cgi?xyz.css . Remarquez que seule la partie nom de fichier a Ă©tĂ© modifiĂ©e. Le reste de lâURL nâa pas Ă©tĂ© touchĂ©, y compris le chemin de rĂ©seau ("//") qui aurait dĂ» autrement ĂȘtre traitĂ© par wget et converti en schĂ©ma effectif (câest Ă dire "http://").
|
-K |
--backup-converted
Lors de la conversion dâun fichier, sauvegarder la version dâorigine avec un suffixe .orig . Cela a un effet sur le comportement de -N .
|
-m |
--mirror
Activer les options adaptĂ©es Ă la crĂ©ation de mirroir. Cette option active la rĂ©cursion et lâhorodatage, dĂ©finit la profondeur de la rĂ©cursion infinie et garde les listes du rĂ©pertoire FTP. Câest actuellement lâĂ©quivalent de -r -N -l inf --no-remove-listing .
|
-p |
--page-requisites
Cette option force wget à télécharger tous les fichiers qui sont nécessaires pour afficher correctement une page HTML donnée. Cela comprend des éléments tels que les images et les sons intégrés, ainsi que les feuilles de style référencées.
Normalement, lors du tĂ©lĂ©chargement dâune seule page HTML, les documents nĂ©cessaires Ă son affichage ne sont pas tĂ©lĂ©chargĂ©s. Utiliser -r associĂ© Ă -l peut aider, comme wget ne distingue pas dâordinaire les documents externes de ceux internes, on se retrouve gĂ©nĂ©ralement avec des « documents feuilles » Ă qui manquent les Ă©lĂ©ments requis.
Par exemple, le document 1.html contient une Ă©tiquette "<IMG>" rĂ©fĂ©rençant 1.gif et une Ă©tiquette "<A>" pointant vers le document externe 2.html . Disons que 2.html est similaire mais que son image est 2.gif et quâelle pointe vers 3.html . Disons que cela continue jusquâĂ un nombre arbitrairement Ă©levĂ©.
Si on exécute la commande :
wget -r -l 2 http://<site>/1.html
alors 1.html , 1.gif , 2.html , 2.gif , et 3.html seront tĂ©lĂ©chargĂ©s. Comme vous pouvez voir, 3.html est sans son requis 3.gif parce que wget compte juste le nombre de bonds (jusquâĂ deux) en dehors de 1.html pour dĂ©terminer oĂč arrĂȘter la rĂ©cursion. De toute façon, avec cette commande :
wget -r -l 2 -p http://<site>/1.html
tous les fichiers au-dessus et le fichier 3.gif nĂ©cessaire Ă 3.html seront tĂ©lĂ©chargĂ©s. De mĂȘme,
wget -r -l 1 -p http://<site>/1.html
entraßnera le téléchargement de 1.html , 1.gif , 2.html et 2.gif . On pourrait penser que :
wget -r -l 0 -p http://<site>/1.html
ne tĂ©lĂ©chargera que 1.html et 1.gif , mais malheureusement ce nâest pas le cas, car -l 0 est Ă©quivalent Ă -l inf (qui est la rĂ©cursion infinie). Pour tĂ©lĂ©charger une seule page HTML (ou une poignĂ©e dâentre elles, toutes indiquĂ©es sur la ligne de commande ou dans un fichier dâentrĂ©e -i URL ) et son (ou ses) Ă©lĂ©ments requis, enlevez simplement -r et -l :
wget -p http://<site>/1.html
Notez que wget se comportera comme si -r avait Ă©tĂ© spĂ©cifiĂ©, mais seule cette page unique et ses Ă©lĂ©ments requis seront tĂ©lĂ©chargĂ©s. Les liens de cette page vers des documents externes ne seront pas suivis. Actuellement, pour tĂ©lĂ©charger une seule page et ses Ă©lĂ©ments requis (mĂȘme sâils existent sur dâautres sites web), et sâassurer que le lot sâaffiche correctement localement, cet auteur aime utiliser quelques options en plus de -p :
wget -E -H -k -K -p http://<site>/<document>
Pour terminer ce sujet, il est utile de savoir que lâidĂ©e que wget se fait dâun lien vers un document externe est toute URL spĂ©cifiĂ©e dans une Ă©tiquette "<A>", une Ă©tiquette "<AREA>" ou une Ă©tiquette "<LINK>" autre que "<LINK REL="stylesheet">".
--strict-comments
Activer lâanalyse stricte des commentaires HTML. Par dĂ©faut cela arrĂȘte les commentaires Ă la premiĂšre occurrence de --> .
Selon les spĂ©cifications, les commentaires HTML sont exprimĂ©s en tant que declarations SGML. La dĂ©claration est un marqueur spĂ©cial commençant par <! et finissant par > , comme <!DOCTYPE...> , qui peut contenir des commentaires entre une paire de dĂ©limiteurs -- . Les commentaires HTML sont des « dĂ©clarations vides », des dĂ©clarations SGML sans aucun texte qui ne soit pas un commentaire. Par consĂ©quent, <!--toto--> est un commentaire valable, et aussi <!--un --deux--> , mais <!--1--2--> nâen est pas un.
Dâautre part, la plupart des rĂ©dacteurs de HTML ne perçoivent pas les commentaires comme autre chose que du texte dĂ©limitĂ© par <!-- et --> , ce qui nâest pas tout Ă fait la mĂȘme chose. Par exemple, quelque chose comme <!------------> fonctionne comme un commentaire valable tant que le nombre de tirets est un multiple de quatre (!). Sinon, le commentaire dure techniquement jusquâau prochain -- , qui peut se trouver Ă lâautre bout du document. Ă cause de cela, beaucoup de navigateurs populaires ignorent totalement la spĂ©cification et mettent en Ćuvre ce que lâutilisateur attend : des commentaires dĂ©limitĂ©s par <!-- et --> .
JusquâĂ la version 1.9, wget interprĂ©tait les commentaires de façon stricte, ce qui aboutissait en des liens manquants dans plusieurs pages web qui sâaffichaient bien dans les navigateurs, mais avaient la malchance de contenir des commentaires non conformes. Ă partir de la version 1.9, wget a rejoint les rangs des clients qui implĂ©mentent des commentaires « naĂŻfs », terminant chaque commentaire Ă la premiĂšre occurrence de --> .
Si, pour une raison quelconque, vous voulez une analyse stricte des commentaires, utilisez cette option pour lâactiver.
Options accepter/rejeter de maniÚre récursive
-A
liste_acceptation
--accept
liste_acceptation
-R
liste_rejet
--reject
liste_rejet
SpĂ©cifier des listes de suffixes ou de modĂšles de noms de fichiers, sĂ©parĂ©s par des virgules, Ă accepter ou Ă rejeter. Prenez en compte que tout caractĂšre joker * , ? , [ ou ] apparaissant dans un Ă©lĂ©ment de liste_acceptation ou liste_rejet sera traitĂ© comme un motif, plutĂŽt que comme un suffixe. Dans ce cas, vous devez lâenclore de guillemets pour empĂȘcher votre interprĂ©teur de commande de lâĂ©tendre, comme dans -A "*.mp3 ou -A â*.mp3â .
--accept-regex
urlregex
--reject-regex
urlregex
Indiquer une expression rationnelle pour accepter ou rejeter lâURL entiĂšre.
--regex-type regextype
Indiquer le type dâexpression rationnelle. Les types possibles sont posix ou pcre . Veuillez noter que pour pouvoir utiliser le type pcre , wget doit avoir Ă©tĂ© compilĂ© avec la prise en charge de libpcre.
-D
liste_domaine
--domains=
liste_domaine
DĂ©signer les domaines Ă suivre. liste_domaine est une liste de domaines sĂ©parĂ©s par des virgules. Cela nâactive pas -H .
--exclude-domains liste_domaine
Indiquer les domaines Ă ne pas suivre.
--follow-ftp
Suivre les liens FTP des documents HTML. Sans cette option, wget ignorera tous les liens FTP.
--follow-tags= liste
wget a une table interne de paires dâĂ©tiquette/attribut HTML quâil examine lorsquâil cherche des documents liĂ©s lors dâune rĂ©cupĂ©ration rĂ©cursive. Cependant, si un utilisateur souhaite que seul un sous-ensemble de ces Ă©tiquettes soit pris en compte, il doit spĂ©cifier ces Ă©tiquettes dans une liste sĂ©parĂ©e par des virgules avec cette option.
--ignore-tags= liste
Câest lâopposĂ© de lâoption --follow-tags . Pour ignorer certaines Ă©tiquettes HTML lors de la recherche rĂ©cursive de documents Ă tĂ©lĂ©charger, indiquez-les dans une liste sĂ©parĂ©e par des virgules.
Dans le passé, cette option était la meilleure solution pour télécharger une seule page et ses éléments requis, en utilisant une ligne de commande comme :
wget --ignore-tags=a,area -H -k -K -r http://<site>/<document>
Cependant, lâauteur de cette option a trouvĂ© une page avec des Ă©tiquettes comme "<LINK REL="home" HREF="/">" et a rĂ©alisĂ© que spĂ©cifier les Ă©tiquettes Ă ignorer nâĂ©tait pas suffisant. On ne peut pas simplement dire Ă wget dâignorer "<LINK>", car les feuilles de style ne seront pas tĂ©lĂ©chargĂ©es. Maintenant la meilleure solution pour tĂ©lĂ©charger une seule page et son nĂ©cessaire reste lâoption --page-requisites .
--ignore-case
Ignorer la casse pour la correspondance des fichiers et des rĂ©pertoires. Cela influence le comportement des options -R , -A , -I et -X , ainsi que le globbing mis en Ćuvre lors du tĂ©lĂ©chargement Ă partir de sites FTP. Par exemple, avec cette option, -A *.txt fera correspondre fichier1.txt , mais aussi fichier2.TXT , fichier3.TxT , et ainsi de suite. Les guillemets dans lâexemple sont lĂ pour empĂȘcher lâinterprĂ©teur de commandes de dĂ©velopper le motif.
|
-H |
--span-hosts
Activer lâextension entre les hĂŽtes lors de la rĂ©cupĂ©ration rĂ©cursive.
|
-L |
--relative
Suivre uniquement les liens relatifs. Utile pour retrouver une page dâaccueil spĂ©cifique sans aucun Ă©garement, mĂȘme pas celui dans les mĂȘmes hĂŽtes.
-I
liste
--include-directories=
liste
Indiquer une liste de répertoires séparés par des virgules que vous voudriez suivre lors du téléchargement. Les éléments de la liste peuvent contenir des jokers.
-X
liste
--exclude-directories=
liste
Indiquer une liste de répertoires séparés par des virgules que vous voudriez exclure du téléchargement. Les éléments de la liste peuvent contenir des jokers.
|
-np |
--no-parent
Ne jamais monter dans le rĂ©pertoire parent lors dâune rĂ©cupĂ©ration rĂ©cursive. Câest une option utile, vu quâelle garantit que seuls les fichiers en dessous dâune certaine hiĂ©rarchie seront tĂ©lĂ©chargĂ©s.
ENVIRONNEMENT
wget
prend en charge les mandataires Ă la fois pour les
récupérations HTTP et FTP. La façon
normale dâindiquer lâemplacement des
mandataires, reconnus par
wget
, est dâutiliser
les variables dâenvironnement suivantes :
http_proxy
https_proxy
Si définies, les variables http_proxy et https_proxy devraient contenir les URL des mandataires pour les connexions HTTP et HTTPS respectivement.
ftp_proxy
Cette variable devrait contenir lâURL du mandataire pour les connexions FTP. Il est assez habituel que http_proxy et ftp_proxy soient dĂ©finis Ă la mĂȘme URL.
no_proxy
Cette variable devrait contenir une liste de mandataires dâextensions de domaine sĂ©parĂ©es par des virgules pour lesquelles le mandataire ne devrait pas ĂȘtre utilisĂ©. Par exemple, si la valeur de no_proxy est .mit.edu , le mandataire ne sera pas utilisĂ© pour rĂ©cupĂ©rer des documents de MIT.
CODE DE RETOUR
wget peut renvoyer lâun des diffĂ©rents codes dâerreur sâil rencontre des problĂšmes.
|
0 |
Aucun problĂšme. |
||
|
1 |
Code dâerreur gĂ©nĂ©rique. |
||
|
2 |
Erreur dâanalyse - par exemple, lors de lâanalyse des options de la ligne de commande, des fichiers .wgetrc ou .netrc ... |
||
|
3 |
Erreur dâentrĂ©es/sorties du fichier. |
||
|
4 |
Ăchec du rĂ©seau. |
||
|
5 |
Ăchec de la vĂ©rification SSL. |
||
|
6 |
Ăchec de lâauthentification du nom dâutilisateur ou du mot de passe. |
||
|
7 |
Erreurs de protocole. |
||
|
8 |
Le serveur a Ă©mis une rĂ©ponse dâerreur. |
Ă lâexception de 0 et 1 , les codes de retour les moins Ă©levĂ©s sont prioritaires par rapport aux plus Ă©levĂ©s lorsque plusieurs types dâerreurs sont rencontrĂ©s.
Dans les versions de wget antĂ©rieures Ă la 1.12, les codes de retour de wget tendaient Ă nâĂȘtre dâaucune utilitĂ© et incohĂ©rents. Les tĂ©lĂ©chargements rĂ©cursifs auraient toujours renvoyĂ© 0 (succĂšs), sans tenir compte des problĂšmes rencontrĂ©s, et les recherches non rĂ©cursives ne renvoyaient que lâĂ©tat correspondant Ă la derniĂšre tentative de tĂ©lĂ©chargement.
FICHIERS
/etc/wgetrc
Lâemplacement par dĂ©faut du fichier de dĂ©marrage global .
.wgetrc
Fichier de dĂ©marrage de lâutilisateur.
BOGUES
Vous ĂȘtes les bienvenus pour soumettre des rapports de bogue Ă lâaide du systĂšme de suivi de bogue de GNU Wget (voir < https://savannah.gnu.org/bugs/?func=additem&group=wget >) ou de la liste de diffusion < bug-wget@gnu.org >.
Visitez < https://lists.gnu.org/mailman/listinfo/bug-wget > pour obtenir plus dâinformations (comment souscrire, les archives de la liste, ...).
Avant de soumettre un rapport de bogue, veuillez essayer de suivre quelques principes simples.
|
1. |
Essayez de vĂ©rifier que le comportement que vous observez est bien un bogue. Si wget se plante, câest un bogue. Si wget ne se comporte pas comme indiquĂ© dans la documentation, câest un bogue. Si les choses fonctionnent bizarrement, mais que vous nâĂȘtes pas sĂ»r de la maniĂšre dont elles sont supposĂ©es fonctionner, cela pourrait bien ĂȘtre un bogue, mais vous devriez faire une double vĂ©rification dans la documentation et dans les listes de diffusion. |
||
|
2. |
Essayez de rĂ©pĂ©ter le bogue dans des circonstances aussi simples que possible. Par exemple, si wget plante lors du tĂ©lĂ©chargement wget -rl0 -kKE -t5 --no-proxy http://example.com -o /tmp/log , vous devriez essayer de voir si le plantage est reproductible, et si cela nâarrive quâavec un jeu dâoptions plus rĂ©duit. Vous pouvez mĂȘme essayer de lancer le tĂ©lĂ©chargement Ă partir de la page oĂč le plantage sâest produit pour voir si cette page a dĂ©clenchĂ© le plantage dâune maniĂšre ou dâune autre. |
De plus, bien que je serais intĂ©ressĂ© par le contenu de votre fichier .wgetrc , lâintĂ©grer simplement dans le message de dĂ©bogage est probablement une mauvaise idĂ©e. Ă la place, vous devriez dâabord essayer de voir si le bogue se rĂ©pĂšte avec un .wgetrc retirĂ© de son emplacement. Câest seulement sâil sâavĂšre que les paramĂštres de .wgetrc affectent le bogue, que vous devriez mâenvoyer les parties pertinentes du fichier.
|
3. |
Merci de dĂ©marrer wget avec lâoption -d et envoyez-nous le rĂ©sultat de la sortie (ou des parties pertinentes de celle-ci). Si wget a Ă©tĂ© compilĂ© sans la gestion du dĂ©bogage, recompilez-le -- il est beaucoup plus simple de suivre les bogues avec la prise en charge du dĂ©bogage activĂ©e. |
Note : merci de veiller Ă supprimer toute information potentiellement sensible du journal de dĂ©bogage avant de lâenvoyer Ă lâadresse pour les bogues. Le "-d" ne se dĂ©mĂšnera pas pour collecter des informations sensibles, mais le journal contiendra une transcription assez complĂšte de la communication de wget avec le serveur, qui peut inclure des mots de passe et des Ă©lĂ©ments de donnĂ©es tĂ©lĂ©chargĂ©s. Comme lâadresse pour les bogues est publiquement archivĂ©e, vous devez comprendre que tous les rapports de bogue sont visibles du public.
|
4. |
Si wget a plantĂ©, essayez de lâexĂ©cuter dans un outil de dĂ©bogage, par exemple, "gdb `which wget` core" et tapez "where" pour en garder une sauvegarde. Cela peut ne pas fonctionner si lâadministrateur systĂšme a dĂ©sactivĂ© les fichiers core, mais on peut essayer en toute sĂ©curitĂ©. |
VOIR AUSSI
Cela nâest pas le manuel complet de GNU Wget. Pour des informations plus complĂštes, comprenant plus dâexplications dĂ©taillĂ©es de certaines des options, et un nombre de commandes Ă utiliser avec les fichiers .wgetrc et lâoption -e , consulter lâentrĂ©e de GNU Info pour wget .
Voir aussi wget2 (1), la version mise à jour de GNU Wget avec une prise en charge encore meilleure du téléchargement récursif et des protocoles modernes tels que HTTP/2.
AUTEUR
Ăcrit Ă lâorigine par Hrvoje Niki <hniksic@xemacs.org>. Actuellement maintenu par Darshit Shah <darnir@gnu.org> et Tim RĂŒhsen <tim.ruehsen@gmx.de>.
COPYRIGHT
Copyright (c) 1996--2011, 2015, 2018--2024 Free Software Foundation, Inc.
Autorisation est donnée de copier, distribuer et/ou modifier ce document sous les termes de la licence GNU Free Documentation License, version 1.3 ou ultérieure publiée par la fondation Free Software Foundation, sans sections invariantes, sans texte de couverture et sans texte de dos de couverture. Une copie de la licence figure dans la section « GNU Free Documentation License ».
TRADUCTION
La traduction française de cette page de manuel a Ă©tĂ© créée par SĂ©bastien Blanchet, Ăric Piel <eric.piel@tremplin-utc.net> et bubu <bubub@no-log.org>
Cette traduction est une documentation libre ; veuillez vous reporter Ă la GNU General Public License version 3 concernant les conditions de copie et de distribution. Il nây a aucune RESPONSABILITĂ LĂGALE.
Si vous découvrez un bogue dans la traduction de cette page de manuel, veuillez envoyer un message à debian-l10n-french@lists.debian.org .