[R] Récupérer le contenu d'une page web qui se complète via JavaScript
Posté : jeu. 03 juin 2021 12:05
Bonjour,
J'essaie de récupérer une ligne bien précise sur cette page de l'Epic Games Store: https://www.epicgames.com/store/en-US/f ... lang=en-US
J'arrive à récupérer cette information avec un tout petit peu de JavaScript:
Donc je me suis dit, pourquoi ne pas le transformer en un script AutoIt et avoir une petite popup qui me prévient quand il y a un nouveau jeu gratuit à l'affiche.
Mais en essayant de récupérer le contenu de la page je me suis vite rendu compte qu'il y avait un petit problème, ce que je récupère via
Je me suis dit que j'allais essayer en passant par cette solution, mais rien de concluant vu que cette page ne supporte pas IE...
J'ai cherché des cas similaires, mais les réponses ne fonctionnent pas pour moi:
Existe-t-il une autre solution pour récupérer le contenu de ce genre de page générées via des librairies JavaScript (React, Vue, Angular, ...)?
J'essaie de récupérer une ligne bien précise sur cette page de l'Epic Games Store: https://www.epicgames.com/store/en-US/f ... lang=en-US
J'arrive à récupérer cette information avec un tout petit peu de JavaScript:
Code : Tout sélectionner
// Nom du jeu
document.querySelector(':scope div[data-component="DiscoverContainerDesktop"] span[data-component="OfferTitleInfo"] span[data-component="Message"]').parentElement.previousSibling.innerText
// Jusqu'à quand?
document.querySelector(':scope div[data-component="DiscoverContainerDesktop"] span[data-component="OfferTitleInfo"] span[data-component="Message"]').firstChild.nextSibling.dateTime
Code : Tout sélectionner
#include <Inet.au3>
Local $sURL = "https://www.epicgames.com/store/en-US/free-games"
Local $sResult = _INetGetSource($sURL)
ConsoleWrite($sResult)
; Parser le résultat...
_INetGetSource
est avant la fin du chargement de la page (via React), donc les informations ne sont pas encore chargées:


J'ai cherché des cas similaires, mais les réponses ne fonctionnent pas pour moi:
-
_IEDocReadHTML
-
_INetGetSource
-
InetRead
- CURL
Existe-t-il une autre solution pour récupérer le contenu de ce genre de page générées via des librairies JavaScript (React, Vue, Angular, ...)?