Colloque
18 juin 2015
Formation pratique sur la collecte de données
Introduction à la collecte des données sur le Web
Le CICC en collaboration avec le Groupe sur l’Analyse, la Recherche et le Développement En Source Ouverte (GARDESO) annonce la tenue d’un cycle de deux formations pratiques, le 18 et 25 juin 2015, sur la collecte de données ouvertes sur le Web et les médias sociaux.
- « Introduction à la collecte des données sur le Web » (Jeudi 18 juin 2015) assuré par Benjamin Ducol. Cette formation a pour objectif d’introduire les participants à la collecte de données sur le Web. La formation s’adresse à un public souhaitant comprendre les fondements généraux de la collecte de données en ligne et apprendre quelques étapes initiales des stratégies de collecte de données. La première section de la journée (A) aura pour objectif de présenter la variété de formats de données auxquels nous sommes confrontés dans toute volonté de collecte de données sur le Web. Après avoir introduit les formats de données du Web, la formation présentera les grandes lignes du langage de programmation Python et son utilisation dans le cadre de stratégies de collecte de données en ligne. Les sections d’avant-midi et de début d’après-midi (B & C) reviendront plus en détail sur la collecte de données à partir de Python et de modules comme BeautifulSoup d'analyse de contenu HTML. La dernière section de l’après-midi (D) sera consacrée à la collecte de données sur Twitter.
Plus de détails