Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente | Prochaine révision Les deux révisions suivantes | ||
doc:editeurs:tesseract [03/07/2017 19:01] phlinux [Automatisation avec des scripts] |
doc:editeurs:tesseract [03/07/2017 19:36] phlinux [Automatisation avec des scripts] |
||
---|---|---|---|
Ligne 108: | Ligne 108: | ||
cd ~ | cd ~ | ||
- | import -quality 70 -depth 8 ~/tmp.jpeg | + | import -quality 300 -depth 1000 ~/tmp.jpeg |
tesseract ~/tmp.jpeg tmp -l $langue 2> /dev/null && rm -f ~/tmp.jpeg | tesseract ~/tmp.jpeg tmp -l $langue 2> /dev/null && rm -f ~/tmp.jpeg | ||
cat ~/tmp.txt >> $sortie && rm -f ~/tmp.txt</code> | cat ~/tmp.txt >> $sortie && rm -f ~/tmp.txt</code> | ||
Ligne 114: | Ligne 114: | ||
=== Utilisation === | === Utilisation === | ||
- | Le script lance un sélecteur de souris en forme de croix. Donc on sélectionne la zone que l'on veut passer à l'ocr et on retrouve (avec plus ou moins de fidélité) le texte dans le fichier indiqué dans la variable “sortie”. A noter que le script est actuellement configuré pour ajouter à la suite dans le même fichier les sélections successives. | + | Le script lance un sélecteur de souris en forme de croix. Donc on sélectionne la zone que l'on veut passer à l'ocr et on retrouve (avec plus ou moins de fidélité) le texte dans le fichier indiqué dans la variable “sortie”. |
+ | La qualité de copie obtenue peut être réglée par les valeurs de -quality et -depth. Voir le man import. | ||
+ | A noter que le script est actuellement configuré pour ajouter, à la suite dans le même fichier, les sélections successives. | ||
=== Source : === | === Source : === |