Man page - dico(1)
Packages contains this manual
apt-get install le-dico-de-rene-cougnenc
Available languages:
en frManual
DICO
NOMSYNTAXE
DESCRIPTION
EXEMPLES dâUTILISATION
CODES POSTAUX
CARACTĂRES ACCENTUES
OPTIONS
TERMINAL et ACCENTS
VOIR AUSSI
BUGS
VERSION
COPYRIGHT
MISE A JOUR - FORMAT
REMERCIEMENTS
NOM
dico - Recherche dâun mot dans un lexique Français
SYNTAXE
dico pattern1 pattern2 patternN ... ...
DESCRIPTION
dico est un petit programme permettant dâexploiter un lexique de mots Français, afin dâen vĂ©rifier lâorthographe par exemple. Il supporte une partie des expressions rationnelles afin de pouvoir trouver un mot ou un groupe de mots a partir dâune fraction du terme recherchĂ©. dico recherche le dictionnaire soit dans le chemin pointe par la variable dâenvironnement DICO, soit si elle nâest pas dĂ©finie par dĂ©faut dans le rĂ©pertoire /usr/lib/dico-cougnenc.
La version MS-DOS procÚde de maniÚre un peu différente, voir le paragraphe MS-DOS a la fin de ce manuel.
Le dictionnaire fourni avec dico est simplement organise en 26 fichiers ascii, un pour chaque initiale, un mot par ligne. Ceci permet a quiconque de rajouter un mot inconnu dans le lexique, a lâaide dâun simple Ă©diteur de texte.
Ce lexique est le fruit de nombreuses heures de travail de nombreuses personnes, il est trĂšs complet notamment au point de vue technique et scientifique, vous y trouverez nombre de termes ne figurant pas dans les dictionnaires standards.
Il contient Ă©galement les Codes Postaux des principales communes de France, ce qui a lâusage sâavĂšre trĂšs pratique.
Les fichiers se nomment a.dic , b.dic ,... ,z.dic , nom de fichiers compatibles avec la plupart des systĂšmes jâespĂšre. Un fichier supplĂ©mentaire nomme version.dic permet de connaĂźtre la date et le nom de lâauteur de la derniĂšre mise a jour.
Ce format texte, trĂšs simple, est certes assez encombrant sur le disque, mais il a Ă©tĂ© choisi en raison de lâextrĂȘme simplicitĂ© dâemploi pour tout le monde. Les machines sont maintenant largement Ă©quipĂ©es en disque dur pour supporter autant de donnĂ©es (environ 1 ou 2 Mo selon la version du lexique) sans la complication dâarbres ou de compactage. Chacun est libre de rĂ©cupĂ©rer ces donnĂ©es et de sâĂ©crire ses propres programmes pour les gĂ©rer, ce format facilite tout.
EXEMPLES dâUTILISATION
Le dico prend une ou plusieurs expressions a rechercher sur sa ligne de commande. Un nombre quelconque dâarguments est possible, il nâest limite que par la longueur de la ligne de commande possible sur votre systĂšme dâexploitation.
Ces arguments
obéissent a un petit sous-ensemble des expressions
rationnelles, lâutilisation de regexp() aurait
été trop lourde pour un petit programme comme
celui-ci.
dico
machin
Recherchera le mot machin.
dico trou*r
Recherchera tous les mots commençant par "trou" et se terminant par "r".
Les opérateurs reconnus sont:
|
* |
Remplace toute une série de caractÚres. |
||
|
? |
Remplace un seul caractĂšre, a la position ou il se trouve. |
||
|
[c-f] |
Remplace un ensemble de caractĂšres, ici de la lettre âcâ a la lettre âfâ |
||
|
[Ëloq] |
Exclut un ensemble de caractĂšres, ici les lettres âlâ , âoâ et âqâ |
En pratique, la
plupart du temps vous nâutiliserez que
*
,
lorsque vous savez comment commence un mot mais avez des
doutes sur le milieu ou la fin. Par exemple :
dico t?ro*ne
Devrait a coup sur vous trouver lâorthographe de Tyrothricine...
CODES POSTAUX
Les codes postaux des principales communes importantes de France ont Ă©tĂ© saisis dans ce dictionnaire, on peut donc en une seconde trouver le code recherche, ce qui est plus rapide que de se souvenir a quel endroit lâon a rangĂ© lâannuaire papier officiel !
Ces codes sont inscrits a la suite du nom de la commune, sĂ©parĂ©s en principe par une tabulation pour simple raison de propretĂ© dâaffichage. Pour cette raison, il est impossible de trouver un code postal en entrant le nom exact de la ville recherchĂ©e, on doit absolument utiliser au moins le caractĂšre de remplacement â * â a la suite de ce nom.
Par exemple pour
trouver le code postal de la ville dâAntony, vous
devez taper la commande:
dico antony*
Attention, un certain nombre de villes sont orthographiées hélas incomplÚtement, en utilisant une notation abrégée. Par exemple, "saint" et "sainte" sont respectivement abrégés par "st" et "ste" .
Le mieux pour
trouver a coup sur par exemple le code ou les codes postaux
de "Saintes Maries de la Mer" est de lancer la
recherche comme suit:
dico s*marie*mer*
En raison de la simplicitĂ© dâorganisation du lexique, la recherche ne fait appel a aucun algorithme compliquĂ©, on pourrait presque rĂ©ecrire cette commande avec grep et les outils standards. Câest pourquoi il est conseille de toujours donner dans la mesure du possible, la premiĂšre lettre du mot a rechercher. En effet, dans le cas inverse le programme recherche dans TOUS les fichiers sans distinction, ce qui est beaucoup moins rapide ( 26 fois exactement...)
CARACTĂRES ACCENTUES
Le dictionnaire contient bon nombre de mots comportant des accents. Les caractĂšres sont donc dĂ©finis sur 8 bits et non 7; si vous avez rĂ©cupĂ©rĂ© ce programme en version DOS, il utilise le jeu de caractĂšres IBM-Etendu de lâIBM-PC. Si vous lâavez rĂ©cupĂ©rĂ© en version UN*X, câest le jeu ISO 8859-1 qui est utilise, dit Latin-1.
La recherche se fait en considĂ©rant toute minuscule accentuĂ©e comme son Ă©quivalent non accentue, et inversement; vous nâĂȘtes pas oblige dâentrer des accents dans la commande de recherche. Ceci ralentit un peu le temps de traitement, mais a notre Ă©poque les machines sont rapides...!
OPTIONS
Le programme
dico
possÚde deux fonctionnalités
supplémentaires, en le lançant avec les
options suivantes sur la ligne de commande :
dico -v
Affichera le numéro de version du programme, et la date de mise à jour du lexique; ainsi que le nom de la personne ayant effectue cette mise à jour. ( fichier version.dic )
dico -c Comptera tous les mots contenus dans le
lexique, en affichant les rĂ©sultats intermĂ©diaires pour chaque lettre de lâalphabet, puis le total.
TERMINAL et ACCENTS
Par dĂ©faut, les mots affiches sont au format dâaccents utilises par le systĂšme ( DOS ou ISO Latin-1). Vous pouvez toutefois demander au programme dico de traduire Ă lâaffichage ces accents, en fonction de votre terminal. ( ceci nâest valide que dans la version UN*X, sous DOS cela nâa aucun intĂ©rĂȘt.)
Ceci se fait en dĂ©finissant une variable dâenvironnement nommĂ©e DICOTERM .
Celle-ci peut
prendre trois noms diffĂ©rents, et doit ĂȘtre
utilisée dans les cas suivants :
DICOTERM=ASCII
Votre terminal est 7 bits et ne connaĂźt que lâASCII pur. Dans ce cas tous les accents seront traduits par la lettre non accentuĂ©e correspondante.
DICOTERM=IBM
Votre terminal affiche le jeu IBM étendu MS-DOS, et le dictionnaire est au format ISO. Dans ce cas les accents seront correctement traduits pour le terminal.
DICOTERM=ISO
Votre terminal affiche le jeu ISO Latin-1 et le dictionnaire est au format MS-DOS. Dans ce cas ( peu probable), les accents seront traduits correctement.
Nâutilisez jamais cette variable dâenvironnement si vous ĂȘtes sur la console LINUX ou si vous utilisez la version MS-DOS. Les rĂ©sultats nâauront aucun intĂ©rĂȘt !
VOIR AUSSI
grep(1) ispell(1)
BUGS
Vous constaterez quâil y a encore du travail Ă faire sur ce lexique, certains mots apparaissant Ă la fois en version non accentuĂ©e, et en version accentuĂ©e. Certaines fautes de frappe ont pu ĂȘtre glissĂ©es, certaines expressions peuvent ĂȘtre erronĂ©es. De mĂȘme, il se peut que certains mots apparaissent en double... NĂ©anmoins il donne satisfaction dans la plupart des cas, en lâĂ©tat.
En dehors de ces imperfections, il contient les noms communs, verbes, participes, et quelques conjugaisons irrĂ©guliĂšres, ainsi que certains noms propres; ce sont en rĂšgle gĂ©nĂ©rale les termes dont on doute de lâorthographe qui sont inclus dans ce lexique, au fur et Ă mesure de son utilisation.
VERSION
Normalement, la commande "dico -v" devrait vous afficher la date de derniĂšre mise a jour du lexique, simplement en allant lire le fichier texte "version.dic" qui se trouve dans le mĂȘme rĂ©pertoire que les fichiers du dictionnaire. Pensez Ă mettre Ă jour ce fichier lors de vos propres modifications !
COPYRIGHT
Le programme dico.c est (c) RenĂ© Cougnenc 1992, doit ĂȘtre considĂšrĂ© comme FREEWARE , câest Ă dire que vous pouvez le distribuer gratuitement Ă quiconque, a condition dâavoir la sympathie de ne pas en faire un usage commercial sans en avertir lâauteur :-)
Vous pouvez modifier les sources a votre convenance, utiliser tout ou partie du programme pour dâautres rĂ©alisations. Vous ĂȘtes fortement encourages a apporter des amĂ©liorations et a les communiquer !
Le dictionnaire ne peut faire lâobjet dâaucune propriĂ©tĂ©, il a Ă©tĂ© rĂ©alisĂ© petit a petit par lâadjonction manuelle de nombreuses personnes dont vous pouvez faire partie: Continuez Ă lâenrichir tant que vous le pouvez, ou Ă corriger dâĂ©ventuelles erreurs. Faites circuler votre travail et surtout modifiez le fichier "version.dic" , afin dâindiquer la date de mise a jour de ce dictionnaire, pour que tout le monde sache ou il en est et qui a pu faire les derniĂšres bĂȘtises :-)
MISE A JOUR - FORMAT
Le lexique peut ĂȘtre mis Ă jour ou corrige Ă lâaide dâun simple Ă©diteur de texte. Les mots doivent figurer en lettres minuscules , câest le programme dâaffichage qui formatte les sorties. Ceci est trĂšs important pour la routine de recherche !
Les accents doivent ĂȘtre entrĂ©s au format courant utilisĂ© par la machine, correspondant au programme exĂ©cutable qui a Ă©tĂ© compilĂ©. ( sous LINUX, ISO, sous DOS, IBM ). Il est prĂ©fĂ©rable de conserver le format texte Unix ( un simple line-feed entre chaque ligne) plutĂŽt que celui de DOS, plus encombrant. (CR/LF). La version MS-DOS sâaccommode trĂšs bien de ce format, par contre sous **IX il est impĂ©ratif de supprimer un Ă©ventuel format MS-DOS.
Il ne doit y avoir quâ un seul mot par ligne (ou un mot compose), lâordre alphabĂ©tique nâest pas nĂ©cessaire pour que le programme fonctionne, mais il affichera les termes dans lâordre rencontre lors de la recherche.
Toute ligne commençant par le caractĂšre â # â sera considĂ©rĂ©e comme une ligne de commentaire par le programme. Toutefois nâen abusez pas car chaque ligne ralentit la recherche bien entendu.
Les Codes
Postaux sont inscrits de la maniĂšre suivante:
ville <TAB> CODE
La tabulation nâest la que pour des raisons de propretĂ© dâaffichage et dâĂ©conomie de caractĂšres. Tachez tout de mĂȘme de le respecter, la version 1.1 fait usage de cette tabulation pour reconnaĂźtre les communes et formater plus proprement lâaffichage...
Pensez a mettre a jour le fichier "version.dic" , simple texte indiquant qui a fait quoi et a quel moment , afin de savoir ce quâil en est du lexique !!!!!
REMERCIEMENTS
Ce lexique Ă pu voir le jour grĂące aux contributions volontaires ou involontaires ( analyse automatique de messages...) de nombreuses personnes dont voici une liste non exhaustive:
Alain Lemell, Alain Vermotgaud, Attila Altan, Bernard Guillaumot, Bernard Milovanovic, Bernard Norek, Bertrand Petit, Cedric Ingrand, Christian Delannoy, Christian Perrier, Daniel Morais, Daniel Toussaint, Denis Gradel, Antony Filleau, Edmond Vandermeersch, Emmanuel Charpentier,Patrick Montgermont, Emmanuel Roussin, Eric Richet, Francis Rozange, Gerard Mannig, Francois Jarraud, Francois Millet, Francois Vigneron, Georges Wanderstok, Javier Castillo, Jean-Christophe Peyrard, Jean-Claude Ambroise, Jean-Luc Betin, Jean-Marie Guitard, Joel Surcouf, Jps Gueniat, Klaus Steinschaden, Laurent Graffin, Mic Ralle, Michel Duffaud, Michel Perez, Michel Pinquier, Nat Makarevitch, Olivier Girard, Lionel Delafosse, Ollivier Civiol, Ollivier Robert, Philippe Abegg, Jacques Lipka, Pascal Petit, Pascal Reszetko, Pascal Tremong, Paul Milliot, Philippe David, Philippe Duflot, Philippe Paternotte, Philippe Waki, Pierre Tran, Pierre Zarka, Regis Rampnoux, Rene Cougnenc, Rene Durand, Sam Cabannes, Serge Delbono, Serge Gautier, Stef Evain, Stephane Derny, Vincent Gillet, Emmanuel Bataille.
Il a demandĂ© plus dâune centaine dâheures ensuite a lâauteur du petit programme dico , pour fusionner lâensemble des fichiers, trier et corriger, rajouter ou ĂŽter des mots. Le lexique tel que fourni avec cette version 1.0, a Ă©tĂ© retravaillĂ© manuellement mot par mot, la fatigue expliquera les erreurs qui ont pu se glisser malicieusement dedans... Merci de me comprendre :-)
Sont a remercier
particuliĂšrement
Wolfgang LENERZ
du club
QL
Contact France
(Utilisateurs de machines Sinclair QL),
qui a fourni gracieusement un lexique fort utile
rĂ©alisĂ© pour un projet dâun type proche
de
Le Dico
, ainsi que
Herve Blaise
,
Nat Makarevitch
et
Georges Wanderstok
pour leurs
importantes contributions.
Enfin, un double apéritif spécial pour Serge DELBONO , qui eut le courage de faire un superbe portage de Le Dico pour Microsoft Windows (r).
Remercions également Linus Torvalds et tous les créateurs du systÚme LINUX , superbe UN*X gratuit, sans lequel le travail du lexique aurait été un pensum sous MS-DOS...