L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →

Différences

Ci-dessous, les différences entre deux révisions de la page.

--- doc:editeurs:tesseract [02/07/2017 13:24]
chalu [Automatisation avec des scripts]
+++ doc:editeurs:tesseract [08/02/2021 20:15]
captnfab doc:editeur:tesseract renommé en doc:editeurs:tesseract (pas à sa place)
@@ Ligne 26: / Ligne 26: @@
 Pour avoir une interface graphique en français, choisir OCRfeeder (en français) :
-<code root>apt-get ocrfeeder unpaper</code>
+<code root>apt-get install ocrfeeder unpaper</code>
-ou Imagereader (en anglais)
+ou gimagereader (en anglais)
 ==== Images ====
@@ Ligne 74: / Ligne 74: @@
 On peut ajouter des actions personnalisées dans thunar (gestionnaire de fichiers de XFCE) qui permettent d'avoir avec un clic droit sur le fichier une entrée de menu permettant de choisir une action à réaliser sur ce fichier.
-==== Exemple de script ====
+==== Script sur png ====
 [[doc:programmation:shell:scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte.
@@ Ligne 93: / Ligne 93: @@
 On valide et voilà. On a l'action qui est proposée sur les fichiers *.png
+==== Script roc ====
+Exemple d'utilisation de tesseract en sélectionnant une partie de l'affichage à l'écran (page web, fichier image, etc….)
+<code bash>    #!/bin/bash
+    ## sélection d'une zone sur l'écran pour conversion ocr
+    ##fichier de sortie
+    sortie=/chemin/vers/zone_ocr.txt
+    ##choix langue  (fra eng etc...)
+    langue=fra
+    cd ~
+    import -quality 300 -depth 1000 ~/tmp.jpeg
+    tesseract ~/tmp.jpeg tmp  -l $langue  2> /dev/null && rm -f ~/tmp.jpeg
+    cat ~/tmp.txt >> $sortie && rm -f ~/tmp.txt</code>
+=== Utilisation ===
+Le script lance un sélecteur de souris en forme de croix. Donc on sélectionne la zone que l'on veut passer à l'ocr et on retrouve (avec plus ou moins de fidélité) le texte dans le fichier indiqué dans la variable “sortie”.
+La qualité de copie obtenue peut être réglée par les valeurs de -quality et -depth. Voir le man import.
+A noter que le script est actuellement configuré pour ajouter, à la suite dans le même fichier, les sélections successives.
+=== Source : ===
+== Phlinux ==
+  * [[utilisateurs:phlinux:tutos:r.o.c.-sur-une-partie-de-l-ecran]]
 ===== Sources =====

doc/editeurs/tesseract.txt · Dernière modification: 20/12/2023 09:57 par spica31

Debian-facile

Différences

Pied de page des forums