Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 03-04-2017 04:14:55

tuxis
Membre
Distrib. : DFLinux 64
Noyau : Amd 64
(G)UI : Xfce
Inscription : 19-07-2016

[Résolu] extraire text d'images

Bjr

J'ai des images contenant du texte en format .png comment puis je en extraire le texte ?

Merci pour votre aide

Dernière modification par tuxis (04-04-2017 23:06:14)


REGLE N°1 PROMOUVOIR LE LIBRE
un Linux léger est un Linux rapide ça lui permet d'aller sur toutes les machines

Hors ligne

#2 03-04-2017 06:54:24

chalu
Modératrice
Lieu : Anjou
Distrib. : Debian Stretch
Noyau : Linux 4.9.0-3-amd64
(G)UI : Mate 1.16
Inscription : 11-03-2016

Re : [Résolu] extraire text d'images

Bonjour,
Avec un logiciel OCR comme tesseract ça doit être possible.
J'avais commencé un wiki partie utilisateur sur tesseract mais je n'ai plus le temps de tester en ce moment.
L'image doit être d'une taille suffisante pour une bonne reconnaissance.

Hors ligne

#3 03-04-2017 09:01:19

tuxis
Membre
Distrib. : DFLinux 64
Noyau : Amd 64
(G)UI : Xfce
Inscription : 19-07-2016

Re : [Résolu] extraire text d'images

Merci Beaucoup
je vais voir cela, pour les images elles font 1100*1500 ce qui est largement suffisant j'ai peur que ce soit en ligne de commande ça vas me faire de l’écriture car il y en as plus de 300 : patience et longueur de temps...
GOCR et tesseract:installer

vu l'heure je file.
Merci encore si je réussi ce sera fort utile !

Dernière modification par tuxis (03-04-2017 09:03:59)


REGLE N°1 PROMOUVOIR LE LIBRE
un Linux léger est un Linux rapide ça lui permet d'aller sur toutes les machines

Hors ligne

#4 03-04-2017 10:19:22

robert2a
Membre
Lieu : France
Distrib. : Stretch 9
Noyau : Linux 4.9.0-3 4.9.30-2
(G)UI : Mate
Inscription : 15-11-2014

Re : [Résolu] extraire text d'images

a priori ça fonctionne aussi en mode graphique avec le paquet "gImageReader" et surement la paquet pour la langue qui t intéresse.


gImageReader is a simple GTK+ front-end to tesseract-ocr. Tesseract is probably
the most accurate open source optical character recognition (OCR) software and
can recognize text in over 60 languages.

gImageReader supports automatic page layout detection but the user can also
manually define and adjust the recognition regions. It is possible to import
images from disk, scanning devices, clipboard and screenshots. gImageReader
also supports multipage PDF documents. Recognized text is displayed directly
next to the image and basic text editing including search/replace and removing
of line breaks is possible. Spellchecking for the output text is also supported
if the corresponding dictionaries are installed.
 



nota: ça a l air de fonctionner , il m a proposer FR  (eng et fra installé ) ; avec un vieux epson 1640 usb et le logiciel gImageReader

Dernière modification par robert2a (03-04-2017 11:10:36)

Hors ligne

#5 03-04-2017 13:46:58

tuxis
Membre
Distrib. : DFLinux 64
Noyau : Amd 64
(G)UI : Xfce
Inscription : 19-07-2016

Re : [Résolu] extraire text d'images

Merci je vais l'essayer,

décidément j’apprends plein de chose aujourd'hui

Merci pour votre aide

REGLE N°1 PROMOUVOIR LE LIBRE
un Linux léger est un Linux rapide ça lui permet d'aller sur toutes les machines

Hors ligne

#6 03-04-2017 14:36:36

Croutons
Membre
Distrib. : Handylinux 2.5 vers Jessie et Debian Stretch
Noyau : Linux 3.16.0-4-686-pae, Linux 4.9.0-3-686-pae
(G)UI : xfce
Inscription : 16-12-2016

Re : [Résolu] extraire text d'images

Bonjour je confirme tesseract c'est le top, j'ai essayé plein d'autre mais résultat pas convainquant
Pour info voici ce que j'ai dans mes notes:

Cherry a écrit :

Reconnaissances de caractéres(OCR): gscan2pdf(gui)+tesseract(OCR en ligne de commande)a sauvegarder en txt ou hocr(Html)
MEILLEUR RESULTAT (Garde la mise en page du texte original)
OCRFeeder GUI à utiliser avec moteur tesseract, modifier avant export en ODT
Attention si la taille de la police choisie pour chaque zone détecté est trop importante le texte n'entrant pas dans le cadre une fois exporté sera tronqué à l'affichage
Dans "Writer" un petit triangle rouge apparaît pour indiquer que tout le texte n'est pas affiché
sélectionner le texte et choisir une police plus petite pour tout afficher ou étirer le cadre pour faire apparaître la suite du paragraphe


-->les cahiers du debutant<--      WikiDF-->Découvrir les principales commandes Linux<--
L' expérience, c'est le nom que chacun donne à ses erreurs. Oscar Wilde

Hors ligne

#7 04-04-2017 23:04:06

tuxis
Membre
Distrib. : DFLinux 64
Noyau : Amd 64
(G)UI : Xfce
Inscription : 19-07-2016

Re : [Résolu] extraire text d'images

Grand Merci pour votre aide fort utile ! .

gImageReader ma permit de récupérer le texte et de le traduire.
Hélas il est en anglais mais je me dé-brouille tant bien que mal

Encore Merci pour votre aide fort utile !

REGLE N°1 PROMOUVOIR LE LIBRE
un Linux léger est un Linux rapide ça lui permet d'aller sur toutes les machines

Hors ligne

Pied de page des forums