L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:editeurs:tesseract [20/12/2023 09:55]
spica31 [Reconnaissance du texte d'un fichier PDF]
+++ doc:editeurs:tesseract [20/12/2023 09:57] (Version actuelle)
spica31 [Automatisation avec des scripts]
@@ Ligne 78: / Ligne 78: @@
 [[doc:programmation:shell:scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte.
 <code bash>#!/bin/bash
-tesseract "$1" "${1%%.*}" -l fra
+tesseract -l fra "$1" "${1%%.*}"
 lowriter "${1%%.*}.txt"
 exit 0</code>
@@ Ligne 109: / Ligne 109: @@
     cd ~
     import -quality 300 -depth 1000 ~/tmp.jpeg
-    tesseract ~/tmp.jpeg tmp  -l $langue  2> /dev/null && rm -f ~/tmp.jpeg
+    tesseract  -l $langue ~/tmp.jpeg tmp  2> /dev/null && rm -f ~/tmp.jpeg
     cat ~/tmp.txt >> $sortie && rm -f ~/tmp.txt</code>

doc/editeurs/tesseract.1703062545.txt.gz · Dernière modification: 20/12/2023 09:55 par spica31

Debian-facile