L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:editeurs:tesseract [03/07/2017 19:36]
phlinux [Automatisation avec des scripts]
+++ doc:editeurs:tesseract [20/12/2023 09:55]
spica31 [Reconnaissance du texte d'un fichier PDF]
@@ Ligne 26: / Ligne 26: @@
 Pour avoir une interface graphique en français, choisir OCRfeeder (en français) :
-<code root>apt-get ocrfeeder unpaper</code>
+<code root>apt-get install ocrfeeder unpaper</code>
-ou Imagereader (en anglais)
+ou gimagereader (en anglais)
 ==== Images ====
@@ Ligne 54: / Ligne 54: @@
 Pour effectuer la reconnaissance de texte de la première image :
-<code user>tesseract test-0.png -l fra output1</code>
+<code user>tesseract -l fra test-0.png output1</code>
 Ici la langue du document est spécifiée avec l'option -l fra.
-<note tip>Si rien n'est indiquée, c'est la langue anglaise qui est utilisée (eng)</note>
+<note tip>Si rien n'est indiqué, c'est la langue anglaise qui est utilisée (eng)</note>
 Pour indiquer l'utilisation de deux langues par exemple français et allemand utilisez l'option : -l fra+deu.
-Par défaut le fichier en sortie sera au format *.txt, on trouvera donc un fichier output.txt à ouvrir avec n'importe quel éditeur de texte.
+Par défaut le fichier en sortie sera au format *.txt, on trouvera donc un fichier output1.txt à ouvrir avec n'importe quel éditeur de texte.
 Pour effectuer la reconnaissance de texte de la deuxième image :
-<code user>tesseract test-1.png -l fra output2</code>
+<code user>tesseract -l fra test-1.png output2</code>
 ===== Reconnaissance du texte d'une image *png=====

doc/editeurs/tesseract.txt · Dernière modification: 20/12/2023 09:57 par spica31

Debian-facile

Différences

Pied de page des forums