Page 1 sur 1

[R] Recherche de chaine dans PDF

Posté : mer. 08 juil. 2009 18:13
par Autonoob
Bonjour à tous,

En fait j'ai un casse tête pour lequel je n'ai pas encore passé beaucoup de temps mais je n'ai pas vraiment d'idée sur le comment faire.....

J'ai besoin de trouver une solution pour demander à l'utilisateur de saisir une chaine (jusque la tout va bien), et de rechercher cette chaine dans un fichier PDF puis d'imprimer la page qui contient le résultat (sachant que pour toutes les pages la zone de recherche est la même si il faut "cibler"), ensuite répéter l'opération sur plusieurs fichier.

Donc si quelqu'un saurais comment, en tache de fond ou non, arriver à trouver une chaine dans un pdf, ça m'aiderais beaucoup...

Merci à tous

Re: [..] Recherche de chaine dans PDF

Posté : mer. 05 août 2009 10:56
par nanake
Bonjour,
je ne sais pas si ton probleme est toujours d'actualité mais bon,
tu peux essayer de copier le texte de ton pdf dans un fichier texte et ensuite rechercher ta chaine de car.

C'est peut-etre pas le moyen le plus rapide mais ça devrait fonctionner

Re: [..] Recherche de chaine dans PDF

Posté : jeu. 06 août 2009 13:14
par Autonoob
oui toujours d'actualité, j'ai eu des vacances :D

A partir du moment ou il est possible de convertir le pdf en txt c'est qu'on y accède donc ça doit être jouable non ??
Comment tu accède à cette conversion ?

Re: [..] Recherche de chaine dans PDF

Posté : jeu. 06 août 2009 13:45
par Autonoob
bon par contre les vacances m'ont fait du bien, j'ai un début de solution en VBS, reste à trouver comment imprimer la page concernée, intégrer dans un autoit et lancer sur plusieurs docs.....

Si quelqu'un est motivé :D

EDIT : Bon petit UPDATE, j'ai trouvé comment imprimer :D ça avance.... Une bonne ame est motivée pour convertir du vbs en autoit ?? sinon je ferais appel au vbs autrement, je ne souhaite pas que le code du vbs soit visualisable.

Re: [..] Recherche de chaine dans PDF

Posté : jeu. 06 août 2009 23:26
par Tlem
Si votre texte n'est pas dans une image ou un scan, utilisez PDFTK.exe pour décompresser le fichier PDF. Ensuite vous pourrez facilement extraire le text du fichier.

Ligne de commande :

Code : Tout sélectionner

pdftk mydoc.pdf output mydoc.clear.pdf uncompress