logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).


L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT → ODT PDF Export

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
doc:editeurs:tesseract [02/07/2017 13:24]
chalu [Automatisation avec des scripts]
doc:editeurs:tesseract [08/02/2021 20:15]
captnfab doc:editeur:tesseract renommé en doc:editeurs:tesseract (pas à sa place)
Ligne 26: Ligne 26:
  
 Pour avoir une interface graphique en français, choisir OCRfeeder (en français) : Pour avoir une interface graphique en français, choisir OCRfeeder (en français) :
-<code root>​apt-get ocrfeeder unpaper</​code>​ +<code root>​apt-get ​install ​ocrfeeder unpaper</​code>​ 
-ou Imagereader ​(en anglais)+ou gimagereader ​(en anglais)
  
 ==== Images ==== ==== Images ====
Ligne 74: Ligne 74:
 On peut ajouter des actions personnalisées dans thunar (gestionnaire de fichiers de XFCE) qui permettent d'​avoir avec un clic droit sur le fichier une entrée de menu permettant de choisir une action à réaliser sur ce fichier. On peut ajouter des actions personnalisées dans thunar (gestionnaire de fichiers de XFCE) qui permettent d'​avoir avec un clic droit sur le fichier une entrée de menu permettant de choisir une action à réaliser sur ce fichier.
    
-==== Exemple de script ​====+==== Script sur png ====
  
 [[doc:​programmation:​shell:​scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'​effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte. [[doc:​programmation:​shell:​scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'​effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte.
Ligne 93: Ligne 93:
 On valide et voilà. On a l'​action qui est proposée sur les fichiers *.png On valide et voilà. On a l'​action qui est proposée sur les fichiers *.png
  
 +==== Script roc ====
 +
 +Exemple d'​utilisation de tesseract en sélectionnant une partie de l'​affichage à l'​écran (page web, fichier image, etc….)
 +
 +<code bash> ​   #!/bin/bash
 +     
 +    ## sélection d'une zone sur l'​écran pour conversion ocr
 +     
 +    ##fichier de sortie
 +    sortie=/​chemin/​vers/​zone_ocr.txt
 +     
 +    ##choix langue ​ (fra eng etc...)
 +    langue=fra
 +     
 +    cd ~
 +    import -quality 300 -depth 1000 ~/tmp.jpeg
 +    tesseract ~/tmp.jpeg tmp  -l $langue ​ 2> /dev/null && rm -f ~/tmp.jpeg
 +    cat ~/tmp.txt >> $sortie && rm -f ~/​tmp.txt</​code>​
 +
 +=== Utilisation ===
 +
 +Le script lance un sélecteur de souris en forme de croix. Donc on sélectionne la zone que l'on veut passer à l'ocr et on retrouve (avec plus ou moins de fidélité) le texte dans le fichier indiqué dans la variable “sortie”.
 +La qualité de copie obtenue peut être réglée par les valeurs de -quality et -depth. Voir le man import.
 +A noter que le script est actuellement configuré pour ajouter, à la suite dans le même fichier, les sélections successives.
 +
 +=== Source : ===
 +
 +== Phlinux ==
 +
 +  * [[utilisateurs:​phlinux:​tutos:​r.o.c.-sur-une-partie-de-l-ecran]]
 ===== Sources ===== ===== Sources =====
  
doc/editeurs/tesseract.txt · Dernière modification: 20/12/2023 09:57 par spica31

Pied de page des forums

Propulsé par FluxBB