diff --git a/digitalmethods.md b/digitalmethods.md index ef728194..85606cfb 100644 --- a/digitalmethods.md +++ b/digitalmethods.md @@ -14,11 +14,19 @@ diego.antolinos@unine.ch - +### Cours IA et outils numériques +_Merci à Nicolas Becquet et Antonin Descampe_ +- Excel et les données tabulaires +- Flourish, Datawrapper et la visualisation +- Google Colab et les Jupyter notebooks en Python +- Exercice : analyser -> visualiser -> mettre en récit + +- + ### Objectifs -- Découvrir des méthodes et outils numériques -- Démystifier et pointer les pièges -- Préciser les étapes d'un travail outillé -- Compléter le riche cours sur l'IA de Nicolas Becquet et Antonin Descampe +- Explorer d'autres méthodes numériques +- Préciser les étapes d'un travail sur des données +- Démystifier et pointer les pièges à éviter ------ @@ -47,8 +55,8 @@ Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code info ------ -### Données -Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats, non ? +### Les données +Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats - @@ -88,8 +96,100 @@ N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donn ------ +### Étapes +- Formulation d'hypothèses +- Identification des sources +- Collecte des données +- Exploration et contrôle +- Choix des outils adaptés +- Filtrage et enrichissement +- Analyse et visualisation +- Restitution et mise à disposition + +- + +### Formulation d'hypothèses +Les questions doivent, autant que possible, précéder l'exploration et l'analyse + +__Les méthodes numériques =/= magie__ + +_Conseil : noter/(re)formuler vos pistes et intuitions_ + +- + +### Sources +- Sources officielles +- Sites web +- Entrepôt de données +- Constitution manuelle d'un jeu de données +- Capteurs +... + +- + +### Collecte +- Parfois simple : télécharger un jeu de données, demander gentiment à un partenaire, ... +- Parfois complexe : faire du scraping sur un site, constituer son jeu de données à la main, ... +- Parfois impossible : certaines données sont inexistantes, trop couteuses, interdites, ... + +- + +### Exploration & contrôle +- Regarder ses données, les lire, s'en "imprégner" +- Ajuster ses hypothèses, re-re-formuler ses questions +- Contrôler la qualité de ses données, l'adaptation à la tâche + +- + +### Choix des outils +- Des outils libres, open source, gratuit +- Des formats simples et ouverts : csv, json, txt +- Des outils modulaires dont on comprend les entrées/sorties +- Un "pipeline" dimensionné correctement + +- + +### Filtrage & enrichissement +- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur +- Possibilité de documenter, d'annoter, ou de joindre des données : manuellement ou à l'aide d'outils adaptés + +- + +### Analyse & visualisation +- Analyse guidée par les hypothèses : pour répondre à une question précise, outillée correctement +- Visualisation exploratoire, analytique ou de restitution ? + +- + +### Restitution et mise à disposition +- Raconter une histoire avec des données +- Mettre autant que possible à disposition ses sources de données et sa méthodes / outils / code + +------ + +### Un exemple concret +Le projet [Panda](https://www.unine.ch/ajm/panda/) + +_Pandemic Data : Production, diffusion et compréhension des données en temps de pandémie_ + +- + +### Données +- __~180k articles - 5 partenaires médias - 3 ans__ +- ~40 entretiens qualitatifs +- 3 expériences contrôlées sur la perception des données (N=600) + +- + +### Méthodes numériques +- Analyse du contenu des articles "Covid-19" +- Analyse des représentations de données / dataviz +------ + +### + ------ [Bibliographie](bibliographie.md)