Projet destiné au concours de web scraping Bankin.
Ce script utilise la librairie puppeteer (de l'équipe Chrome DevTools) pour scraper le site du concours Bankin afin d'en extraire la liste des transactions bancaires.
Testé sur Node.js 8.8.
npm install
node main.js
Le paquet puppeteer se charge d'installer automatiquement une version de Chromium compatible. Si, pour une raison quelconque Chromium n'a pas été installé, lancer la commande npm install puppeteer
.
Pour faciliter le débuggage et désactiver le mode headless, mettre la variable d'environnement DISABLE_HEADLESS
à 1.
Si le nombre de threads lancés par défaut ne convient pas, il suffit d'en indiquer le nombre souhaité dans la variable d'environnement MAX_THREADS
.
Les logs sont écrits dans un fichier debug.log durant l'exécution du script.