logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 25-06-2011 16:08:54

zaphir
Membre
Inscription : 10-09-2010

Sous-Titres .srt

J'aimerais savoir si parmi vous certains passe leurs sous-titres DVD en .srt et si oui avec quoi et comment ?

Je pose la question parce que je m'essaye avec Avidemux , pour passer mes sous titres en .srt donc, et j'ai pas mal de souci de reconnaissance de symboles.
En effet avidemux fait bien le boulot mais il y a des erreurs entre le i et l , il assimile les deux à un seul caractère ,ainsi que pour le m et n .
Donc au final j'ai  pas mal de correction a faire dans le texte je vous laisse imaginer .
Peut être existe t il une astuce pour pallier a ce problème mais pour l'instant je n'ai rien trouvé de significatif.
De même je n'arrive pas a modifier les caractères enregistrer dans le dictionnaire de symbole ( utile en cas d'erreur de saisi par exemple pour éviter de tout refaire )
J'ai fais des recherche sur le net a ce sujet mais ....pas tres fructueuses.
Pour les sous-titres sous Linux j'ai trouvé:
_sub2srt ( 2005 et ne fonctionne pas )
_gnome-subtitle mais ne sert qu'à rectifier la synchronisation , l’orthographe aussi mais il ne créer pas directement .
et avidemux .

J’espère que certains d'entres vous pourrons m'aider .

D'avance merci big_smile

Hors ligne

#2 25-06-2011 21:09:19

zoroastre74
Membre
Distrib. : Debian Wheezy
Noyau : Linux 3.2
(G)UI : Awesome wm v3.4.13 (Octopus)
Inscription : 28-08-2010

Re : Sous-Titres .srt

Yep!

Cà me rappelle un sujet sur lequel j'ai perdu une dent yikes

Je te donne le lien quand même au cas où cela te donnerait des idées...

http://debian-facile.org/forum/viewtopic.php?id=3725

@+

Zoroastre.

Hors ligne

#3 25-06-2011 22:08:38

zaphir
Membre
Inscription : 10-09-2010

Re : Sous-Titres .srt

Cà me rappelle un sujet sur lequel j'ai perdu une dent


smile oui je pense que ça va être pareil pour moi .

Merci pour le lien en tout cas, mais c'est vrai qu’après avoir passer en revue différentes  docs et tuto je m'aperçois que Linux a trouvé son talon d'achille .
Apparemment les soft existants sur Linux ont du mal à reconnaitre les sous-titres .vob  qui sont considérés comme des images ( si j'ai bien compris ) pour ensuite les transformer en texte pour les fichiers sous-titres .srt .
Et évidemment sous M$ il en existe une panoplie dont SubRip .

Bon ça fonctionne avec avidemux c'est sur mais si par malheur il y a un i majuscule a définir là c'est la catastrophe pour la suite ,mais je vais chercher encore un peu pour voir si une astuce n'est pas envisageable ...quand même il doit bien y avoir une solution wink

Edit
Une solution peut être, je ne sais pas si c'est réalisable et si ça marche,  serai de définir chaque caractères a problème ( i,l,m) par des symboles différents lors du passage de fichiers .vobsub a .srt par exemple :
- m => :
-   i => / 
- l  => %
Ensuite le .srt crée contenant ces erreurs voulues serait a corriger via un correcteur prévu a cet effet ( un script ou autre ? peut-on le faire via open office avec un dictionnaire personnalisé  ? ) où les symboles et leurs correspondances serait déjà définies. Ainsi la correction serait automatisée en quelques sorte.
N'étant pas du tout habille avec les scripts j'aimerai savoir si cette idée est envisageable en terme de réalisation ou bien si c'est de l'utopie ?
Open office est il une possibilité aussi ? Créer un dictionnaire pour une détection d'erreurs données au lieu des erreurs d'orthographe  ?

Si des personnes ont des idées à me suggérer c'est avec plaisir que je les lirais .
Merci wink

Dernière modification par zaphir (25-06-2011 23:51:59)

Hors ligne

#4 27-06-2011 11:32:01

zaphir
Membre
Inscription : 10-09-2010

Re : Sous-Titres .srt

J'ai résolu mon problème en partie . Pourquoi en partie seulement ? car pour arriver a mes fins je joue avec 3 outils au pire des cas,  et 2 dans le meilleurs des cas .

Une partie du souci de reconnaissance de caractère via OCR  a été solutionné avec l'installation de tesseract-ocr-fra alors qu'initialement il n'y avait que tesseract-ocr et tesseract-ocr-eng .
Alors vu comme cela , ça parait logique mais sans une recherche plutôt intensive je ne l'aurait pas deviner !
Lors de l'install d'Avidemux le paquet devrait etre installé d'office par détermination de la langue utilisé par l'OS je pense , mais bon...c'est peut etre mon esprit râleur qui parle...:rolleyes:

_1er outil :
Une astuce que j'ai tenté et qui m'a permis de voir certains caractère non coupé , comme le "m" par exemple,  consiste à recalibrer les caractères a 122 pixels au lieu de 128. Cette option est proposé par Avidemux dans OCR(VobSub -> srt).

__2ème outil:
Une petite commande pour supprimer un caractere spécial voulu ou non dans le srt: sed -i -e "s/symbole non voulu/symbole de remplacement/g" fichier.srt

_3ème outil :
OpenOffice Writer pour une vérification orthographique du .srt  précédemment réaliser afin de corriger toutes les erreurs (notamment celle du "i" et "l" Majuscule ) . Toujours pas trouver de solution pour ça d'ailleurs mais il me semble que sous M$ le problème existe aussi.

On peut se dire que c'est assez fastidieux ou long , mais croyez moi c'est déjà plus rapide qu'au début de mon aventure .
Je vais continuer mes recherches pour voir si ça peut être optimiser davantage encore.
A moins qu'un sous-titreur actif ayant une autre solution ne passe par là  wink

Hors ligne

Pied de page des forums