Cette séance s’adresse aux débutant·e·s. Elle initie au concept de collecte automatisée de données du web (web scraping), avec une mise en pratique à l’aide du package `rvest
`.
Plan de séance :
- Introduction
- Exemple d’application
- Mise en pratique :
- Bases techniques
- Présentation du site web de démonstration
- Scraping de données de biens mis en vente
- Exploration des données
- Conclusion
Diaporama d’introduction :
Support d’atelier :
Données et scripts :
Un projet Rstudio comportant les scripts utilisés pendant la séance est téléchargeable ici :
Conditions d’utilisation :
Le support utilisé pour cette séance est libre d’utilisation et d’adaptation (licence CC BY-SA 4.0). Vous devez néanmoins créditer l’œuvre, indiquer les éventuelles modifications et utiliser les mêmes conditions de partage.