more things + detailed steps
This commit is contained in:
parent
46d5d5d534
commit
bbbeb74664
1 changed files with 106 additions and 6 deletions
|
|
@ -14,11 +14,19 @@ diego.antolinos@unine.ch
|
|||
|
||||
-
|
||||
|
||||
### Cours IA et outils numériques
|
||||
_Merci à Nicolas Becquet et Antonin Descampe_
|
||||
- Excel et les données tabulaires
|
||||
- Flourish, Datawrapper et la visualisation
|
||||
- Google Colab et les Jupyter notebooks en Python
|
||||
- Exercice : analyser -> visualiser -> mettre en récit
|
||||
|
||||
-
|
||||
|
||||
### Objectifs
|
||||
- Découvrir des méthodes et outils numériques
|
||||
- Démystifier et pointer les pièges
|
||||
- Préciser les étapes d'un travail outillé
|
||||
- Compléter le riche cours sur l'IA de Nicolas Becquet et Antonin Descampe
|
||||
- Explorer d'autres méthodes numériques
|
||||
- Préciser les étapes d'un travail sur des données
|
||||
- Démystifier et pointer les pièges à éviter
|
||||
|
||||
------
|
||||
|
||||
|
|
@ -47,8 +55,8 @@ Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code info
|
|||
|
||||
------
|
||||
|
||||
### Données
|
||||
Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats, non ?
|
||||
### Les données
|
||||
Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats
|
||||
|
||||
-
|
||||
|
||||
|
|
@ -88,8 +96,100 @@ N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donn
|
|||
|
||||
------
|
||||
|
||||
### Étapes
|
||||
- Formulation d'hypothèses
|
||||
- Identification des sources
|
||||
- Collecte des données
|
||||
- Exploration et contrôle
|
||||
- Choix des outils adaptés
|
||||
- Filtrage et enrichissement
|
||||
- Analyse et visualisation
|
||||
- Restitution et mise à disposition
|
||||
|
||||
-
|
||||
|
||||
### Formulation d'hypothèses
|
||||
Les questions doivent, autant que possible, précéder l'exploration et l'analyse
|
||||
|
||||
__Les méthodes numériques =/= magie__
|
||||
|
||||
_Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||
|
||||
-
|
||||
|
||||
### Sources
|
||||
- Sources officielles
|
||||
- Sites web
|
||||
- Entrepôt de données
|
||||
- Constitution manuelle d'un jeu de données
|
||||
- Capteurs
|
||||
...
|
||||
|
||||
-
|
||||
|
||||
### Collecte
|
||||
- Parfois simple : télécharger un jeu de données, demander gentiment à un partenaire, ...
|
||||
- Parfois complexe : faire du scraping sur un site, constituer son jeu de données à la main, ...
|
||||
- Parfois impossible : certaines données sont inexistantes, trop couteuses, interdites, ...
|
||||
|
||||
-
|
||||
|
||||
### Exploration & contrôle
|
||||
- Regarder ses données, les lire, s'en "imprégner"
|
||||
- Ajuster ses hypothèses, re-re-formuler ses questions
|
||||
- Contrôler la qualité de ses données, l'adaptation à la tâche
|
||||
|
||||
-
|
||||
|
||||
### Choix des outils
|
||||
- Des outils libres, open source, gratuit
|
||||
- Des formats simples et ouverts : csv, json, txt
|
||||
- Des outils modulaires dont on comprend les entrées/sorties
|
||||
- Un "pipeline" dimensionné correctement
|
||||
|
||||
-
|
||||
|
||||
### Filtrage & enrichissement
|
||||
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
|
||||
- Possibilité de documenter, d'annoter, ou de joindre des données : manuellement ou à l'aide d'outils adaptés
|
||||
|
||||
-
|
||||
|
||||
### Analyse & visualisation
|
||||
- Analyse guidée par les hypothèses : pour répondre à une question précise, outillée correctement
|
||||
- Visualisation exploratoire, analytique ou de restitution ?
|
||||
|
||||
-
|
||||
|
||||
### Restitution et mise à disposition
|
||||
- Raconter une histoire avec des données
|
||||
- Mettre autant que possible à disposition ses sources de données et sa méthodes / outils / code
|
||||
|
||||
------
|
||||
|
||||
### Un exemple concret
|
||||
Le projet [Panda](https://www.unine.ch/ajm/panda/)
|
||||
|
||||
_Pandemic Data : Production, diffusion et compréhension des données en temps de pandémie_
|
||||
|
||||
-
|
||||
|
||||
### Données
|
||||
- __~180k articles - 5 partenaires médias - 3 ans__
|
||||
- ~40 entretiens qualitatifs
|
||||
- 3 expériences contrôlées sur la perception des données (N=600)
|
||||
|
||||
-
|
||||
|
||||
### Méthodes numériques
|
||||
- Analyse du contenu des articles "Covid-19"
|
||||
- Analyse des représentations de données / dataviz
|
||||
|
||||
|
||||
------
|
||||
|
||||
###
|
||||
|
||||
------
|
||||
|
||||
[Bibliographie](bibliographie.md)
|
||||
|
|
|
|||
Loading…
Reference in a new issue