AutoItFr_201510

Tout ce qui concerne la traduction des différentes documentations en rapport avec AutoIt3.
Règles du forum
Traduction Française du fichier d'aide AutoIt ---> ici
Documentation en ligne AutoIt v3 en Français --> ici
Documentation en ligne AutoIt v3 en Anglais ---> ici
Avatar du membre
jchd
AutoIt MVPs (MVP)
AutoIt MVPs (MVP)
Messages : 2282
Enregistré le : lun. 30 mars 2009 22:57
Localisation : Sud-Ouest de la France (43.622788,-1.260864)
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#21

Message par jchd »

Si, si on recherche dans la rubrique StrinRegExp.
Avatar du membre
orax
Modérateur
Modérateur
Messages : 1479
Enregistré le : lun. 23 mars 2009 04:50
Localisation : ::1
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#22

Message par orax »

Je parlais bien de la recherche globale (via l'onglet Rechercher) et non de la recherche sur une seule page (raccourci CTRL+F). La recherche globale permet quand même de rechercher des caractères différents de [a-zA-Z0-9_]. Dans mon CHM que j'avais mis en pièce jointe, si je cherche (onglet Rechercher) le terme généralement celui-ci est bien trouvé même s'il contient des é. Ce mot (généralement) est dans la partie <body> donc la recherche globale est bien effectuée sur le contenu des pages et dans le titre.
Avatar du membre
jchd
AutoIt MVPs (MVP)
AutoIt MVPs (MVP)
Messages : 2282
Enregistré le : lun. 30 mars 2009 22:57
Localisation : Sud-Ouest de la France (43.622788,-1.260864)
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#23

Message par jchd »

Certes mais ces caratères font partie du jeu Windows, pas mes chinoiseries.
mdanielm
Membre émérite
Membre émérite
Messages : 254
Enregistré le : mer. 11 déc. 2013 19:48
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#24

Message par mdanielm »

Bonsoir Orax,
Votre démonstration est convaincante.
Comment convertir les 4000 pages? je propose:
- je charge un fichier .htm
- je remplace charset="UTF-8" par charset="Windows-1252"
- je sauvegarde en ANSI

Je recommence pour toutes les pages puis je fais pareil pour .hhc et .hhk
Merci de me confirmer les opérations.
Bonsoir
Avatar du membre
orax
Modérateur
Modérateur
Messages : 1479
Enregistré le : lun. 23 mars 2009 04:50
Localisation : ::1
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#25

Message par orax »

Oui et non. J'ai peur qu'il en résulte une perte de données si on se contente de faire ça comme ça. J'ai fait un essai avec la page StrinRegExp, les chinoiseries sont remplacées par des "?". Ce qui est logique puisque ces caractères n'existent pas dans le Windows-1252.
J'ai déjà trouvé des choses pour faire cette conversion mais je préfère tester davantage.
Avatar du membre
orax
Modérateur
Modérateur
Messages : 1479
Enregistré le : lun. 23 mars 2009 04:50
Localisation : ::1
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#26

Message par orax »

La conversion pourrait se faire avec Tidy HTML => http://www.htacg.org/binaries/
Il y a aussi d'autres outils en ligne de commande qui pourraient être équivalents => http://stackoverflow.com/questions/6486 ... acter-sets

Voilà le fichier de config que j'utilise avec Tidy :
► Afficher le textetidy.conf.txt
Dans cette configuration (avec output-encoding: ascii), tous les caractères non us-ascii sont convertis en entités HTML (ex : é devient &eacute;). On pourrait changer le charset en charset="us-ascii" mais ça devrait être facultatif.
Une alternative est de mettre output-encoding: latin1 et dans ce cas il faudra changer le charset des .htm en charset="iso-8859-1".
J'ai essayé de mettre win1252 à la place de latin1 mais les chinoiseries été supprimées.

En dessous, une partie du script que j'utilise pour faire "tidyfier" les .htm mais il n'est pas exécutable tel quel (fonctions non déclarées, ...).
log4a c'est un UDF.
-config sert à indiquer l'emplacement du fichier de config de Tidy.
-modify modifie les fichiers directement (sans faire de sauvegarde)
-f c'est pour enregistrer un fichier de logs.
► Afficher le texte
Il faut aussi convertir les .hhc et .hhk.

En résumé :

Code : Tout sélectionner

tidy sur tous les .htm + les .hhc et .hhk
si [i]output-encoding: ascii[/i] dans le fichier de config
  (je pense facultatif) recherche de <meta charset="utf-8"> et remplacer par <meta charset="us-ascii">
sinon si [i]output-encoding: latin1[/i] dans le fichier de config
  (obligatoire) recherche de <meta charset="utf-8"> et remplacer par <meta charset="iso-8859-1">
Personnellement je ferais la conversion en dernier (avant de compiler en .chm) et sur une copie.
mdanielm
Membre émérite
Membre émérite
Messages : 254
Enregistré le : mer. 11 déc. 2013 19:48
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#27

Message par mdanielm »

Bonsoir orax,
J'étudie vos indications.
Mais je me suis aperçu que les caractères spéciaux ont disparu depuis longtemps des pages UTF8 sans que je sache pourquoi.
J'ai vérifié que Notepad ne les efface pas, pas plus que le contrôle RichEdit que j'utilise pour traduire dans l'outil perso que je vous ai donné.
J'ai scanné le dossier "functions" à la recherche de "?" et j'ai trouvé beaucoup de faux positifs mais aussi les 5 fonctions suivantes qui justifient vos craintes:

AscW.htm 2 fois 2xbéta dans exemple-CORRIGé
BinaryToString.htm 4 fois 4x? + 2 chinois corrigé
StringCompare.htm 2 fois e et E tréma dans les exemples-CORRIGé
StringRegExp.htm 67 fois dont les carac chinois
StringToBinary.htm 6 fois 4x? + 2xchinois, comme dans BinaryToString corrigé

Je vais faire pareil pour tous les autres dossiers, puis je me pencherai sur la conversion que vous proposez.

Que voulez vous dire par "faire la conversion en dernier", je ne pense pas terminer la traduction de mon vivant!!!!!!!
Bonne soirée
Avatar du membre
orax
Modérateur
Modérateur
Messages : 1479
Enregistré le : lun. 23 mars 2009 04:50
Localisation : ::1
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#28

Message par orax »

mdanielm a écrit :Que voulez vous dire par "faire la conversion en dernier", je ne pense pas terminer la traduction de mon vivant!!!!!!!
Faites comme si je n'avais rien dit. ^^ Ce que je voulais dire par "en dernier", c'était de convertir les fichiers juste avant de créer le .chm, mais pas quand toute la traduction sera finie. Puisqu'une fois convertis, ils vont contenir des entités html à la place de certains caractères (surtout si la conversion est vers l'us-ascii) et ce n'est pas toujours très lisible.
Un exemple, la chaîne

Code : Tout sélectionner

é è œ ê à ù â û ü ô ï ÿ î
deviendrait (après conversion vers l'us-ascii)

Code : Tout sélectionner

&eacute; &egrave; &#339; &ecirc; &agrave; &ugrave; &acirc; &ucirc; &uuml; &ocirc; &iuml; &yuml; &icirc;
ou (après conversion vers l'iso-8859-1)

Code : Tout sélectionner

é è &#339; ê à ù â û ü ô ï ÿ î
mdanielm
Membre émérite
Membre émérite
Messages : 254
Enregistré le : mer. 11 déc. 2013 19:48
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#29

Message par mdanielm »

Essai.rar
(7.03 Kio) Téléchargé 288 fois
Je propose qu'on travaille sur cet exemple.
j'aimerais voir ce que donne tidy sur les pages htm de l'exemple.
Le chm n'est pas si mal, mais la recherche globale ne fonctionne que sur le titre, pas dans le texte.
Si vous avez le temps, mettez cet exemple au point et je saurais reproduire les réglages dans les pages AutoIt.
Il n'existe que 6 pages sur 4000 qui contiennent des caractères spéciaux: inutile d'automatiser une conversion.
Merci de votre aide.
Avatar du membre
orax
Modérateur
Modérateur
Messages : 1479
Enregistré le : lun. 23 mars 2009 04:50
Localisation : ::1
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#30

Message par orax »

En fait, il n'y a pas vraiment que 6 pages qui contiennent des caractères spéciaux. Tous les caractères dont le code ascii est supérieur à 127 peuvent être considérés comme des caractères spéciaux donc il faudra quand même convertir toutes les pages. J'avais proposé Tidy HTML pour faire la conversion mais c'était juste une suggestion.

Voilà ce qu'il y avait réellement dans votre page2.htm (le contenu "réel" peut être vu par un éditeur hexadécimal par exemple) :
► Afficher le texte
Le fichier page2.htm était encore en UTF-8 et, en UTF-8, le à est encodé dans le fichier sur 2 octets mais ça sera aussi le cas pour é, è, ê, ç, ... À ce propos, la recherche globale ne trouve pas lâche mais lâche est bien trouvé.
Fichiers joints
html.zip
Conversion avec Tidy HTML.
Ligne meta charset modifiée manuellement.
(1.11 Kio) Téléchargé 303 fois
mdanielm
Membre émérite
Membre émérite
Messages : 254
Enregistré le : mer. 11 déc. 2013 19:48
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#31

Message par mdanielm »

Vous avez enlevé les codes html des titres: ils ne sont donc pas utiles.
Je ne peux pas vérifier la recherche globale car vous ne donnez pas la TOC et l'index.
Avatar du membre
franco
Niveau 7
Niveau 7
Messages : 343
Enregistré le : lun. 03 oct. 2011 22:37
Localisation : Liévin
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#32

Message par franco »

Bonjour.

Un petit bug vu par hasard.

Je suis en train de réaliser un script (qui n'a rien à voir avec autoit chm).

J'ai regardé l'aide de GuiCtrlGetstate


Et je tombe sur ça :
Image
► Afficher le textecode
Local $idCheckbox = GUICtrlCreatÉcheckbox("checkbox", 10, 10)
Bref, la traduction se fait aussi dans les codes exemple.

EDIT...
A moins qu'il dit que mon script est en échec... :mrgreen:
je pense que le dernier "e" de create a été remplacé par É.


++
Avatar du membre
orax
Modérateur
Modérateur
Messages : 1479
Enregistré le : lun. 23 mars 2009 04:50
Localisation : ::1
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#33

Message par orax »

mdanielm a écrit :Vous avez enlevé les codes html des titres: ils ne sont donc pas utiles.
Oui ça ne devrait pas poser de problème.
mdanielm a écrit :Je ne peux pas vérifier la recherche globale car vous ne donnez pas la TOC et l'index.
Dans l'archive Essai.rar je n'ai modifié que les 3 pages .htm. C'est pourquoi je ne donne pas la TOC et l'index puisqu'ils sont identiques.
La recherche fonctionne sauf pour le caractère €.
mdanielm
Membre émérite
Membre émérite
Messages : 254
Enregistré le : mer. 11 déc. 2013 19:48
Status : Hors ligne

Re: [..] AutoItFr_201510.chm

#34

Message par mdanielm »

...donc, pas d'effet tidy sur la toc/index.
Répondre