Colloque

18 juin 2015

Formation pratique sur la collecte de données

Introduction à la collecte des données sur le Web

Le CICC en collaboration avec le Groupe sur l’Analyse, la Recherche et le Développement En Source Ouverte (GARDESO) annonce la tenue d’un cycle de deux formations pratiques, le 18 et 25 juin 2015, sur la collecte de données ouvertes sur le Web et les médias sociaux.

  • « Introduction à la collecte des données sur le Web » (Jeudi 18 juin 2015) assuré par Benjamin Ducol. Cette formation a pour objectif d’introduire les participants à la collecte de données sur le Web. La formation s’adresse à un public souhaitant comprendre les fondements généraux de la collecte de données en ligne et apprendre quelques étapes initiales des stratégies de collecte de données. La première section de la journée (A) aura pour objectif de présenter la variété de formats de données auxquels nous sommes confrontés dans toute volonté de collecte de données sur le Web. Après avoir introduit les formats de données du Web, la formation présentera les grandes lignes du langage de programmation Python et son utilisation dans le cadre de stratégies de collecte de données en ligne. Les sections d’avant-midi et de début d’après-midi (B & C) reviendront plus en détail sur la collecte de données à partir de Python et de modules comme BeautifulSoup d'analyse de contenu HTML. La dernière section de l’après-midi (D) sera consacrée à la collecte de données sur Twitter

Plus de détails

Événements

Attention - Votre version d'Internet Explorer est vieille de 19 ans et peut ne pas vous offrir une expérience optimale sur le site du CICC. Veuillez mettre à jour votre ordinateur pour une expérience optimale. Nous vous recommandons Firefox ou Chrome, ou encore ChromeFrame si vous êtes dans un environnement corporatif ou académique dans lequel vous ne pouvez pas mettre à jour Internet Explorer.