Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Prochaine révision | Révision précédente | ||
utilisateurs:phlinux:tutos:omegat-merge-de-la-source-avec-la-traduction [02/01/2016 19:13] phlinux créée |
utilisateurs:phlinux:tutos:omegat-merge-de-la-source-avec-la-traduction [02/01/2016 19:29] (Version actuelle) phlinux |
||
---|---|---|---|
Ligne 11: | Ligne 11: | ||
Paquets hors du commun requis : ssed | Paquets hors du commun requis : ssed | ||
===== Utilisation ===== | ===== Utilisation ===== | ||
- | Les fichiers source.txt et trad.txt sont placés dans le même répertoire et dans lequel on lance le script principal (omegat_tmx.sh) | + | Un pack avec 1 script bash et 2 fichiers de règles de sentences utilisés par ssed. |
+ | Les fichiers source.txt et trad.txt sont placés dans le même répertoire et dans lequel on lance le script (omegat_tmx.sh). | ||
La commande de lancement sera: <code user>omegat_tmx.sh source.txt trad.txt</code> | La commande de lancement sera: <code user>omegat_tmx.sh source.txt trad.txt</code> | ||
Le script principal : | Le script principal : | ||
Ligne 43: | Ligne 45: | ||
ext=1 | ext=1 | ||
- | # lecture source (inutile ?) | + | # lecture source ( apparemment inutile) |
#sentEN=`sed r /tmp/source` | #sentEN=`sed r /tmp/source` | ||
Ligne 93: | Ligne 95: | ||
if [ $nb_source != $nb_trad ]; then | if [ $nb_source != $nb_trad ]; then | ||
- | #python /home/ph57/.script/sentdif.py | ||
- | #wordview $PWD/omegat_merge_dif.txt | ||
echo "Différence du nombre de sentences" | echo "Différence du nombre de sentences" | ||
echo "source: $nb_source" | echo "source: $nb_source" | ||
Ligne 105: | Ligne 105: | ||
exit | exit | ||
</file> | </file> | ||
- | Pour que la mémoire TMX soit parfaite il faudra obtenir le message suivant : Source et Traduction correspondent. Sinon ce sont les nombres de sentences qui seront affichés. Il faudra alors faire des corrections dans les fichiers source.txt et/ou trad.txt, mais aussi peut être dans les règles de sentences. | + | Le fichier des règles de sentence de la source (ici de l'anglais): |
+ | <file sed sentEN.sed> | ||
+ | #!/bin/sed -f | ||
+ | |||
+ | ## utilisé par ssed -R | ||
+ | ## Omegat: regex pour texte en anglais | ||
+ | |||
+ | s/(?<![A-Z])\.\s/\.\n/g | ||
+ | s/\?\s/\?\n/g | ||
+ | s/\?’\s/\?’\n/g | ||
+ | s/\?"\s/\?"\n/g | ||
+ | s/\b\."\s/\."\n/g | ||
+ | s/\b\.’\s/\.’\n/g | ||
+ | s/\b\.”\s/\.”\n/g | ||
+ | s/\b\!’\s/\!’\n/g | ||
+ | s/\b\.'\s/\.'\n/g | ||
+ | s/\b\.\)\s/\.\)\n/g | ||
+ | s/\b\.]\s/\.]\n/g | ||
+ | </file> | ||
+ | Le fichier des règles de sentence de la traduction (ici du français): | ||
+ | <file sed sentFR.sed> | ||
+ | #!/bin/sed -f | ||
+ | |||
+ | ## utilisé par ssed -R | ||
+ | ## Omegat: regex pour texte en français | ||
+ | |||
+ | s/(?<![A-Z])\.\s/\.\n/g | ||
+ | s/\?\s/\?\n/g | ||
+ | s/\?'\s/\?'\n/g | ||
+ | s/\?"\s/\?"\n/g | ||
+ | s/\b\."\s/\."\n/g | ||
+ | s/\b\.’\s/\.’\n/g | ||
+ | s/\b\!’\s/\!’\n/g | ||
+ | s/\b\!'\s/\!'\n/g | ||
+ | s/\b\!"\s/\!"\n/g | ||
+ | s/\b\.'\s/\.'\n/g | ||
+ | s/\b\.\.\.'\s/\.\.\.'\n/g | ||
+ | s/\b\.\)\s/\.\)\n/g | ||
+ | s/\b\.]\s/\.]\n/g | ||
+ | </file> | ||
+ | |||
+ | Pour que la mémoire TMX soit "parfaite" il faudra obtenir le message suivant : Source et Traduction correspondent. Sinon ce sont les nombres de sentences qui seront affichés. Il faudra alors faire des corrections dans les fichiers source.txt et/ou trad.txt, mais aussi peut être dans les règles de sentences (selon les langues utilisées). |