Cette séance s’adresse aux débutant·e·s. Elle initie au concept de collecte automatisée de données du web (web scraping), avec une mise en pratique à l’aide du package `rvest`.

Plan de séance :

Introduction
Exemple d’application
Mise en pratique :
- Bases techniques
- Présentation du site web de démonstration
- Scraping de données de biens mis en vente
- Exploration des données
Conclusion

Diaporama d’introduction :

Consulter en plein écran

Support d’atelier :

Consulter en plein écran

Données et scripts :

Un projet Rstudio comportant les scripts utilisés pendant la séance est téléchargeable ici :

webscraping_projet.zip

Conditions d’utilisation :

Le support utilisé pour cette séance est libre d’utilisation et d’adaptation (licence CC BY-SA 4.0). Vous devez néanmoins créditer l’œuvre, indiquer les éventuelles modifications et utiliser les mêmes conditions de partage.

Bibliographie