Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente | |||
doc:editeurs:tesseract [20/12/2023 09:55] spica31 [Reconnaissance du texte d'un fichier PDF] |
doc:editeurs:tesseract [20/12/2023 09:57] (Version actuelle) spica31 [Automatisation avec des scripts] |
||
---|---|---|---|
Ligne 78: | Ligne 78: | ||
[[doc:programmation:shell:scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte. | [[doc:programmation:shell:scripts|Le script suivant]] (avec tous ses défauts, c'est mon premier script 8-) ) permet d'effectuer la reconnaissance des caractères sur une image *.png et ouvre libreoffice (writer) pour lire ou modifier le texte. | ||
<code bash>#!/bin/bash | <code bash>#!/bin/bash | ||
- | tesseract "$1" "${1%%.*}" -l fra | + | tesseract -l fra "$1" "${1%%.*}" |
lowriter "${1%%.*}.txt" | lowriter "${1%%.*}.txt" | ||
exit 0</code> | exit 0</code> | ||
Ligne 109: | Ligne 109: | ||
cd ~ | cd ~ | ||
import -quality 300 -depth 1000 ~/tmp.jpeg | import -quality 300 -depth 1000 ~/tmp.jpeg | ||
- | tesseract ~/tmp.jpeg tmp -l $langue 2> /dev/null && rm -f ~/tmp.jpeg | + | tesseract -l $langue ~/tmp.jpeg tmp 2> /dev/null && rm -f ~/tmp.jpeg |
cat ~/tmp.txt >> $sortie && rm -f ~/tmp.txt</code> | cat ~/tmp.txt >> $sortie && rm -f ~/tmp.txt</code> | ||