[R] Regex - Inetget - balises html - variation de code
Posté : jeu. 09 août 2018 14:14
Bonjour à tous,
Je cherche à extraire une référence du code source d'un site web:
J'utilise l'expression régulière suivante et ça fonctionne:
J'ai essayé le code suivant:
Voici un exemple de variante de code source (c'est mal codé non? Ce sont des fiches produit, elles sont censés avoir toutes le même schéma non?)
A noter que je ne veux pas m'appuyer sur la référence uniquement (son format) car il est susceptible de varier énormément d'un fournisseur à l'autre, donc il ne faut pas approfondir cette piste.
D'avance merci, @ Bientôt.
Julien.
Je cherche à extraire une référence du code source d'un site web:
Code : Tout sélectionner
<span style="font-size: 10px;"><b><span style="color: rgb(0, 0, 128);">* Code produit : ABCDEFGH</span></b><br></span><br></p>
Par contre je suis super embêté car parfois, le code source varie, et il me faudrait dire quelque chose comme: "Expression régulière 1 ou par défaut, expression régulière 2".Code produit : (.*)<\/span><\/span><\/b
J'ai essayé le code suivant:
Mais ca ne fonctionne pas, je dois pas être si loin si?...Code produit : (.*)<\/span><\/span><\/b><br> <br>|Code produit : (.*)<\/span><\/b
Voici un exemple de variante de code source (c'est mal codé non? Ce sont des fiches produit, elles sont censés avoir toutes le même schéma non?)
Code : Tout sélectionner
color: rgb(0, 0, 128); "><span style="font-size: 10px; ">* Code produit : HGFEDCBA</span></span></b><br> <br>
D'avance merci, @ Bientôt.
Julien.