Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
doc:editeurs:tesseract [02/07/2017 13:13] smolski |
doc:editeurs:tesseract [08/02/2021 20:15] captnfab doc:editeur:tesseract renommé en doc:editeurs:tesseract (pas à sa place) |
||
---|---|---|---|
Ligne 26: | Ligne 26: | ||
Pour avoir une interface graphique en français, choisir OCRfeeder (en français) : | Pour avoir une interface graphique en français, choisir OCRfeeder (en français) : | ||
- | <code root>apt-get ocrfeeder unpaper</code> | + | <code root>apt-get install ocrfeeder unpaper</code> |
- | ou Imagereader (en anglais) | + | ou gimagereader (en anglais) |
==== Images ==== | ==== Images ==== | ||
Ligne 74: | Ligne 74: | ||
On peut ajouter des actions personnalisées dans thunar (gestionnaire de fichiers de XFCE) qui permettent d'avoir avec un clic droit sur le fichier une entrée de menu permettant de choisir une action à réaliser sur ce fichier. | On peut ajouter des actions personnalisées dans thunar (gestionnaire de fichiers de XFCE) qui permettent d'avoir avec un clic droit sur le fichier une entrée de menu permettant de choisir une action à réaliser sur ce fichier. | ||
- | ==== Exemple de script ==== | + | ==== Script sur png ==== |
[[doc:programmation:shell:scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte. | [[doc:programmation:shell:scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte. | ||
Ligne 81: | Ligne 81: | ||
lowriter "${1%%.*}.txt" | lowriter "${1%%.*}.txt" | ||
exit 0</code> | exit 0</code> | ||
- | Il suffit de copier coller le texte avec mousepad (ou un autre éditeur de texte) et de l'enregistrer en lui donnant par exemple le nom PNG-2-ocr-lo. Ensuite un clicl droit sur le fichier > Propriétés > Permissions pour le rendre exécutable en cochant la case ad-hoc. | + | Il suffit de copier coller le texte avec mousepad (ou un autre éditeur de texte) et de l'enregistrer en lui donnant par exemple le nom PNG-2-ocr-lo. Ensuite un clic droit sur le fichier > Propriétés > Permissions pour le rendre exécutable en cochant la case ad-hoc. |
- | Dans thunar > Editer > Configurer les actions personnaliser > clic sur le bouton pour ajouter une action. \\ | + | Dans thunar > Editer > Configurer les actions personnalisées > clic sur le bouton pour ajouter une action. \\ |
On complète le nom de l'action par exemple PNG 2 OCR libreoffice et on remplit la ligne de commande avec : | On complète le nom de l'action par exemple PNG 2 OCR libreoffice et on remplit la ligne de commande avec : | ||
<code>/le-chemin-qui-mène-au-script/PNG-2-ocr-lo %f</code> | <code>/le-chemin-qui-mène-au-script/PNG-2-ocr-lo %f</code> | ||
<note tip>On peut choisir une icone pour l'action.</note> | <note tip>On peut choisir une icone pour l'action.</note> | ||
- | Dans l'onglet "conditions d'apparition" on coche "Fichiers image" et on complète la ligne motif de fichiers avec :\\ | + | Dans l'onglet "conditions d'apparition" on coche "Fichiers image" et on complète la ligne "motif de fichiers" avec :\\ |
*.png;*.PNG | *.png;*.PNG | ||
On valide et voilà. On a l'action qui est proposée sur les fichiers *.png | On valide et voilà. On a l'action qui est proposée sur les fichiers *.png | ||
+ | ==== Script roc ==== | ||
+ | |||
+ | Exemple d'utilisation de tesseract en sélectionnant une partie de l'affichage à l'écran (page web, fichier image, etc….) | ||
+ | |||
+ | <code bash> #!/bin/bash | ||
+ | |||
+ | ## sélection d'une zone sur l'écran pour conversion ocr | ||
+ | |||
+ | ##fichier de sortie | ||
+ | sortie=/chemin/vers/zone_ocr.txt | ||
+ | |||
+ | ##choix langue (fra eng etc...) | ||
+ | langue=fra | ||
+ | |||
+ | cd ~ | ||
+ | import -quality 300 -depth 1000 ~/tmp.jpeg | ||
+ | tesseract ~/tmp.jpeg tmp -l $langue 2> /dev/null && rm -f ~/tmp.jpeg | ||
+ | cat ~/tmp.txt >> $sortie && rm -f ~/tmp.txt</code> | ||
+ | |||
+ | === Utilisation === | ||
+ | |||
+ | Le script lance un sélecteur de souris en forme de croix. Donc on sélectionne la zone que l'on veut passer à l'ocr et on retrouve (avec plus ou moins de fidélité) le texte dans le fichier indiqué dans la variable “sortie”. | ||
+ | La qualité de copie obtenue peut être réglée par les valeurs de -quality et -depth. Voir le man import. | ||
+ | A noter que le script est actuellement configuré pour ajouter, à la suite dans le même fichier, les sélections successives. | ||
+ | |||
+ | === Source : === | ||
+ | |||
+ | == Phlinux == | ||
+ | |||
+ | * [[utilisateurs:phlinux:tutos:r.o.c.-sur-une-partie-de-l-ecran]] | ||
===== Sources ===== | ===== Sources ===== | ||