Man page - pdf2djvu(1)
Packages contains this manual
Available languages:
en fr pl pt ru deManual
PDF2DJVU
NOMSYNOPSIS
DESCRIPTION
OPTIONS
Type de document, noms de fichier
Résolution, taille de la page
QualitĂ© dâimage
Extraction
Réalisation
Informations, aide
ENVIRONNEMENT
MISE EN FORME DE MODĂLE
Syntaxe de modĂšle
Syntaxe de champ
Les variables disponibles
DĂTAILS DâIMPLĂMENTATION
Algorithme de séparation de calque
RAPPORTS DE BOGUE
VOIR AUSSI
NOTES
NOM
pdf2djvu - Créer des fichiers DjVu à partir des fichiers PDF
SYNOPSIS
|
pdf2djvu [{ -o | --output } fichier-sortie-djvu ] [ option ...] fichier-pdf ... |
||
|
pdf2djvu { -i | --indirect } fichier-index-djvu [ option ...] fichier-pdf ... |
||
|
pdf2djvu { --version | --help | -h } |
DESCRIPTION
Ce programme crĂ©e un fichier DjVu Ă partir dâun ou plusieurs fichiers au format de document portable (PDF).
OPTIONS
pdf2djvu accepte les options suivantes :
Type de document, noms de fichier
-o , --output= fichier-sortie-djvu
Produire un document de plusieurs pages ensemble. Ăcrire le fichier dans fichier-sortie-djvu au lieu de la sortie standard.
-i , --indirect= fichier-index-djvu
Produire un document multi-page complĂ©ment. Utiliser fichier-index-djvu comme nom de fichier dâindex ; mettre les fichiers Ă©lĂ©ments dans le mĂȘme rĂ©pertoire. Le rĂ©pertoire doit exister et ĂȘtre accessible en lecture.
--page-id-template= modĂšle
Indiquer le schĂ©ma de nommage pour les identificateurs de page. Consulter la « MISE EN FORME DE MODĂLE » section pour la description de langue du modĂšle.
Le modÚle par défaut est « p{page:04*}.djvu ».
Pour des raisons de portabilité, les identificateurs de page :
âą doivent ĂȘtre composĂ©s uniquement de lettres ASCII minuscules, chiffres, _, +, - et de points,
âą ne peuvent pas commencer par un +, - ou un point,
⹠ne peuvent pas contenir deux points consécutifs,
âą doivent se terminer par lâextension .djvu ou .djv.
--page-id-prefix= préfixe
Ăquivalent à « --page-id-template= prĂ©fixe {page:04*}.djvu ».
--page-title-template= modĂšle
Indiquer le modĂšle pour les titres de page. Consulter la « MISE EN FORME DE MODĂLE » section pour la description de langue du modĂšle.
Le modÚle par défaut est « {label} ».
--no-page-titles
Ne pas définir le titre des pages.
Résolution, taille de la page
-d , --dpi= résolution
Indiquer la rĂ©solution souhaitĂ©e Ă rĂ©solution points par pouce. La valeur par dĂ©faut est 300 PPP. La plage autorisĂ©e est : 72 †rĂ©solution â€Â 6000.
--media-box
Utiliser MediaBox pour déterminer la taille de la page. CropBox est utilisé par défaut.
--page-size= largeur x hauteur
Indiquer la taille prĂ©fĂ©rĂ©e de page Ă largeur pixels Ă hauteur pixels. La taille rĂ©elle de la page peut ĂȘtre modifiĂ©e afin de respecter le ratio dâaspect et les limites de rĂ©solution de DjVu (Cette option prend le pas sur -d / --dpi .).
--guess-dpi
Essayer de deviner la résolution native en examinant les images incorporées. à utiliser avec précaution.
QualitĂ© dâimage
--bg-slices= n + ... + n , --bg-slices= n , ... , n
Indiquer la qualitĂ© dâencodage du calque dâarriĂšre-plan IW44. Cette option est similaire Ă lâoption -slice de c44 . Consulter la page de manuel de c44 (1) pour plus de dĂ©tails. La valeur par dĂ©faut est 72+11+10+10.
--bg-subsample= n
Indiquer le ratio de sous-Ă©chantillonnage de lâarriĂšre-plan. La valeur par dĂ©faut est 3. Les valeurs valables sont des entiers entre 1 et 12 inclus.
--fg-colors=default
Essayer de conserver toutes les couleurs du calque de premier plan. Câest la valeur par dĂ©faut.
--fg-colors=web
RĂ©duire les couleurs du calque de premier plan Ă celles de la palette Web (216 couleurs). Cette option nâest pas recommandĂ©e.
--fg-colors= n
Utiliser GraphicsMagick pour rĂ©duire le nombre de couleurs distinctes dans le calque de premier plan Ă n . Les valeurs autorisĂ©es sont des entiers compris entre 1 et 4080. Cette option nâest pas recommandĂ©e.
--fg-colors=black
Abandonner toutes les informations de couleur du calque de premier plan.
--monochrome
Transformer les pages au format bitmap monochrome. Avec cette option, les options --bg- ... et --fg- ... ne sont pas respectées.
--loss-level= n
Indiquer le niveau de compression avec perte. La valeur par dĂ©faut est 0 (sans perte). Les valeurs autorisĂ©es sont des entiers compris entre 0 et 200, inclus. Cette option est similaire Ă lâoption -losslevel de cjb2 ; consulter la page de manuel de cjb2 (1) pour plus de dĂ©tails. Cette option peut ĂȘtre utilisĂ©e seulement avec lâoption --monochrome .
--lossy
Synonyme de --loss-level=100 .
--anti-alias
Activer la police et le vecteur anticrĂ©nelage. Cette option nâest pas recommandĂ©e.
Extraction
--no-metadata
Ne pas extraire les métadonnées.
Par défaut :
âą Les entrĂ©es suivantes du dictionnaire de lâinformation du document sont extraites : titre, auteur, sujet, crĂ©ateur, producteur, date de crĂ©ation, date de modification. Les horodatages sont formatĂ©s selon la RFC 3999 [1] , avec les composants date et heure sĂ©parĂ©s par une espace unique.
⹠Les métadonnées XMP sont extraites (ou créées) et mises à jour en conséquence.
Note
Si plusieurs documents de saisie sont indiqués,
seules les métadonnées du premier sont prises
en compte.
--verbatim-metadata
Conserver les métadonnées originelles intactes.
--no-outline
Ne pas extraire la table des matiĂšres du document.
--hyperlinks=border-avis
Rendre les contours de lien hypertexte toujours visibles.
Par défaut, un contour de lien hypertexte est visible uniquement lorsque la souris est sur le lien hypertexte.
--hyperlinks=# RRGGBB
Forcer la couleur indiquée pour le contour des liens hypertextes.
--no-hyperlinks , --hyperlinks=none
Ne pas extraire les liens hypertextes.
--no-text
Ne pas extraire le texte.
--words
Extraire le texte. Enregistrer lâemplacement de chaque mot. Cela est fait par dĂ©faut.
--lines
Extraire le texte. Enregistrer lâemplacement de chaque ligne, plutĂŽt que de chaque mot.
--crop-text
Ne pas extraire de texte en dehors des limites de page.
--no-nfkc
Ne pas appliquer la normalisation NFKC [2] sur le texte, exceptĂ© pour les caractĂšres des tables de caractĂšres [3] (U+FB00âU+FB4F), qui sont normalisĂ©es sans condition.
Par défaut, la normalisation NFKC est appliquée pour tous les caractÚres.
--filter-text= ligne-commande
Filtrer le texte à travers la ligne-commande . Le filtre fourni doit préserver les espaces, les caractÚres de contrÎle et les chiffres décimaux.
Cette option implique --no-nfkc .
-p , --pages= plage-pages
Indiquer les pages Ă convertir. plage-pages est une liste de sous-plages (sous forme de valeurs sĂ©parĂ©es par des virgules). Chaque sous-plage est soit une seule page (p. ex. 17) ou une plage de pages contiguĂ«s (p. ex. 37-42). Les numĂ©ros de page ne peuvent ĂȘtre dupliquĂ©s. Les pages sont numĂ©rotĂ©es en commençant Ă Â 1.
Par défaut, toutes les pages sont converties.
Réalisation
-j , --jobs= n
Utiliser n processus lĂ©gers pour effectuer la conversion. La valeur par dĂ©faut est dâutiliser un processus.
-j0 , --jobs=0
Déterminer automatiquement le nombre de processus à utiliser pour effectuer la conversion.
Informations, aide
-v , --verbose
Afficher davantage de messages dâinformation lors de la conversion du fichier.
-q , --quiet
Ne pas afficher de message dâinformation lors de la conversion du fichier.
--version
Afficher lâinformation de version et quitter.
-h , --help
Afficher lâaide et quitter.
ENVIRONNEMENT
Les variables dâenvironnement suivantes affectent pdf2djvu sur les systĂšmes Unix :
OMP_*
Les dĂ©tails du comportement dâexĂ©cution concernant le parallĂ©lisme peuvent ĂȘtre contrĂŽlĂ©s par plusieurs variables dâenvironnement. Se rĂ©fĂ©rer Ă la spĂ©cification de lâinterface de programmation (API) OpenMP [4] pour plus de dĂ©tails.
TMPDIR
pdf2djvu fait un usage intensif de fichiers temporaires. Il les stocke dans un répertoire indiqué par cette variable. La valeur par défaut est /tmp.
MISE EN FORME DE MODĂLE
Syntaxe de modĂšle
Le mise en forme du modÚle est plus ou moins calquée sur la syntaxe de formatage de chaßne en Python [5] .
Un modÚle est un morceau de texte qui contient des champs, entourés par des accolades {}. Les champs sont remplacés par des valeurs mises en forme de maniÚre appropriée lorsque le modÚle est évalué. De plus, {{ est remplacé par un seul { et }} est remplacé par un seul }.
Syntaxe de champ
Chaque champ est constituĂ© dâun nom de variable, Ă©ventuellement suivi dâun dĂ©calage, suivi Ă©ventuellement dâune indication de format.
Le décalage est un entier signé (c.-à -d. commençant par un caractÚre + ou -).
Lâindication de format est constituĂ©e dâun deux-points, suivi dâune indication de largeur.
Lâindication de largeur est un entier dĂ©cimal dĂ©finissant la largeur minimale de champ. Si elle nâest pas indiquĂ©e, alors la largeur du champ sera dĂ©terminĂ©e par le contenu. Mettre le caractĂšre zĂ©ro (0) avant la prĂ©cision de largeur permet le remplissage par des zĂ©ros.
Lâindication de largeur peut ĂȘtre suivie dâun astĂ©risque (*), ce qui augmente la largeur minimale de champ Ă la plus grande dimension possible du contenu de la variable.
Les variables disponibles
dpage
Numéro de page dans le document DjVu.
page , spage
Numéro de page dans le document PDF.
label
Ătiquette de page (numĂ©ro logique de la page) dans le document PDF.
Cette variable est seulement disponible pour les titres de page.
DĂTAILS DâIMPLĂMENTATION
Algorithme de séparation de calque
Ă moins que lâoption --monochrome soit activĂ©e, pdf2djvu utilise le simple algorithme de sĂ©paration de calques suivant :
1. Pour chaque page, procéder comme suit :
1. Tramer la page dans un tableau de pixels, de la maniÚre habituelle ;
2. Tramer la page dans une autre tableau de pixels, en omettant les éléments de page suivants :
âą texte,
âą images matricielles dâun bit par pixel,
⹠éléments vectoriels (sauf les remplissages de grandes zones) ;
3. Comparer deux tableaux de pixels, pixel par pixel :
1. Si leurs couleurs sont identiques, classer le pixel comme une partie du calque dâarriĂšre-plan ;
2. Dans le cas contraire, classer le pixel comme une partie du calque de premier plan.
RAPPORTS DE BOGUE
Si vous trouvez un bogue dans pdf2djvu, veuillez le signaler au systĂšme de suivi des bogues [6] ou Ă la liste de diffusion [7] .
VOIR AUSSI
djvu (1), djvudigital (1), csepdjvu (1)
NOTES
|
1. |
RFC 3999 |
https://www.ietf.org/rfc/rfc3339
|
2. |
NFKC |
https://unicode.org/reports/tr15/
|
3. |
tables de caractĂšres |
https://unicode.org/charts/PDF/UFB00.pdf
|
4. |
spĂ©cification de lâinterface de programmation (API) OpenMP |
https://www.openmp.org/specifications/
|
5. |
syntaxe de formatage de chaĂźne en Python |
https://docs.python.org/2/library/string.html#format-string-syntax
|
6. |
systĂšme de suivi des bogues |
https://github.com/jwilk/pdf2djvu/issues
|
7. |
liste de diffusion |
https://groups.io/g/pdf2djvu