Skip to content
This repository has been archived by the owner on Aug 10, 2018. It is now read-only.
/ bankin-challenge Public archive

[NON MAINTENU] Projet destiné au concours de web scraping Bankin

License

Notifications You must be signed in to change notification settings

sowebdev/bankin-challenge

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Bankin web scraping challenge

Projet destiné au concours de web scraping Bankin.

Ce script utilise la librairie puppeteer (de l'équipe Chrome DevTools) pour scraper le site du concours Bankin afin d'en extraire la liste des transactions bancaires.

Testé sur Node.js 8.8.

Utilisation

npm install
node main.js

Le paquet puppeteer se charge d'installer automatiquement une version de Chromium compatible. Si, pour une raison quelconque Chromium n'a pas été installé, lancer la commande npm install puppeteer.

Désactivation du mode headless

Pour faciliter le débuggage et désactiver le mode headless, mettre la variable d'environnement DISABLE_HEADLESS à 1.

Configurer le nombre de threads

Si le nombre de threads lancés par défaut ne convient pas, il suffit d'en indiquer le nombre souhaité dans la variable d'environnement MAX_THREADS.

Logs

Les logs sont écrits dans un fichier debug.log durant l'exécution du script.

About

[NON MAINTENU] Projet destiné au concours de web scraping Bankin

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published