Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Dernière révision Les deux révisions suivantes | ||
doc:editeurs:tesseract [03/07/2017 19:36] phlinux [Automatisation avec des scripts] |
doc:editeurs:tesseract [20/12/2023 09:55] spica31 [Reconnaissance du texte d'un fichier PDF] |
||
---|---|---|---|
Ligne 26: | Ligne 26: | ||
Pour avoir une interface graphique en français, choisir OCRfeeder (en français) : | Pour avoir une interface graphique en français, choisir OCRfeeder (en français) : | ||
- | <code root>apt-get ocrfeeder unpaper</code> | + | <code root>apt-get install ocrfeeder unpaper</code> |
- | ou Imagereader (en anglais) | + | ou gimagereader (en anglais) |
==== Images ==== | ==== Images ==== | ||
Ligne 54: | Ligne 54: | ||
Pour effectuer la reconnaissance de texte de la première image : | Pour effectuer la reconnaissance de texte de la première image : | ||
- | <code user>tesseract test-0.png -l fra output1</code> | + | <code user>tesseract -l fra test-0.png output1</code> |
Ici la langue du document est spécifiée avec l'option -l fra. | Ici la langue du document est spécifiée avec l'option -l fra. | ||
- | <note tip>Si rien n'est indiquée, c'est la langue anglaise qui est utilisée (eng)</note> | + | <note tip>Si rien n'est indiqué, c'est la langue anglaise qui est utilisée (eng)</note> |
Pour indiquer l'utilisation de deux langues par exemple français et allemand utilisez l'option : -l fra+deu. | Pour indiquer l'utilisation de deux langues par exemple français et allemand utilisez l'option : -l fra+deu. | ||
- | Par défaut le fichier en sortie sera au format *.txt, on trouvera donc un fichier output.txt à ouvrir avec n'importe quel éditeur de texte. | + | Par défaut le fichier en sortie sera au format *.txt, on trouvera donc un fichier output1.txt à ouvrir avec n'importe quel éditeur de texte. |
Pour effectuer la reconnaissance de texte de la deuxième image : | Pour effectuer la reconnaissance de texte de la deuxième image : | ||
- | <code user>tesseract test-1.png -l fra output2</code> | + | <code user>tesseract -l fra test-1.png output2</code> |
===== Reconnaissance du texte d'une image *png===== | ===== Reconnaissance du texte d'une image *png===== |