lire du texte dans une image
Posté : ven. 14 mai 2021 15:53
je suis débutant en Autoit et je me demandais si il existe un composant capable de lire le texte présent sur une image ?
un peu facon OCR (reconnaissance optique de caractères)
si ca n'existe pas, j'avais pensé à une petite grille d'analyse de 64 pixels
par exemple si le texte est noir sur fond blanc, je peux regarder où se trouvent les pixels noirs et les pixels blancs
et le comparer avec une petite base de donnée de "pattern" de lettres et chiffres
bon après ca risque de manquer de fiabilité, et ca va prendre beaucoup d'heures à coder une telle fonction
rien que d'identifier la position X1/Y1 et X2/Y2 d'une lettre ca va être compliqué
où commence la lettre et où elle se termine ?
ok il y'a un espace blanc entre les lettres, mais des espaces blanc dans l'image il y'en a plein
en fin de compte ce que je chercherais dans l'image c'est une alternance de pixel noirs et de pixels blancs
afin de pouvoir définir la zone de texte dans l'image sous forme de coordonnées X1/Y1 et X2/Y2
après que j'ai la zone où se trouve le texte, il va falloir définir la taille de la grille de pixel pour une lettre,
par exemple je vois que les pixels noirs ne dépassent pas 30 pixels de haut
ensuite combien j'ai d'espaces dans cette chaine de caractères = je connais le nombre de lettres et leur largueur maximale en pixel
donc je peux savoir que 1 lettre = 30 pixels de haut et 20 pixels de large
ca me fait une grille de 30 x 20 pixels = 600 pixels
mais analyser 600 pixels c'est beaucoup trop, disons que je fais une petite grille de 64 pixels,
ca va donner la forme grossière d'une lettre, mais ca pourrait être suffisant pour la détecter
le problème après c'est qu'il va falloir une certaine tolérance aux pixels connexes
là je ne vois pas comment on peut gérer ca
en fin de compte j'essaye de faire la même chose que pour un code barre ou un QR code :
lire une image que je transforme en données numériques utilisables sous forme de string
ca me parait chaud à faire quand même, et j'ai pas 1 an devant moi
d'autres trucs qui seraient sympa à intégrer dans un script Autoit c'est la reconnaissance vocale,
mais là c'est un boulot encore plus énorme, ca existe un composant qui fait ca ?
un peu facon OCR (reconnaissance optique de caractères)
si ca n'existe pas, j'avais pensé à une petite grille d'analyse de 64 pixels
par exemple si le texte est noir sur fond blanc, je peux regarder où se trouvent les pixels noirs et les pixels blancs
et le comparer avec une petite base de donnée de "pattern" de lettres et chiffres
bon après ca risque de manquer de fiabilité, et ca va prendre beaucoup d'heures à coder une telle fonction
rien que d'identifier la position X1/Y1 et X2/Y2 d'une lettre ca va être compliqué
où commence la lettre et où elle se termine ?
ok il y'a un espace blanc entre les lettres, mais des espaces blanc dans l'image il y'en a plein
en fin de compte ce que je chercherais dans l'image c'est une alternance de pixel noirs et de pixels blancs
afin de pouvoir définir la zone de texte dans l'image sous forme de coordonnées X1/Y1 et X2/Y2
après que j'ai la zone où se trouve le texte, il va falloir définir la taille de la grille de pixel pour une lettre,
par exemple je vois que les pixels noirs ne dépassent pas 30 pixels de haut
ensuite combien j'ai d'espaces dans cette chaine de caractères = je connais le nombre de lettres et leur largueur maximale en pixel
donc je peux savoir que 1 lettre = 30 pixels de haut et 20 pixels de large
ca me fait une grille de 30 x 20 pixels = 600 pixels
mais analyser 600 pixels c'est beaucoup trop, disons que je fais une petite grille de 64 pixels,
ca va donner la forme grossière d'une lettre, mais ca pourrait être suffisant pour la détecter
le problème après c'est qu'il va falloir une certaine tolérance aux pixels connexes
là je ne vois pas comment on peut gérer ca
en fin de compte j'essaye de faire la même chose que pour un code barre ou un QR code :
lire une image que je transforme en données numériques utilisables sous forme de string
ca me parait chaud à faire quand même, et j'ai pas 1 an devant moi
d'autres trucs qui seraient sympa à intégrer dans un script Autoit c'est la reconnaissance vocale,
mais là c'est un boulot encore plus énorme, ca existe un composant qui fait ca ?