Compare commits

..

No commits in common. "47f87f2efd0def4ee06a1cd425020726bc619f47" and "61626c0f81bf6142c02d13d6308a7937e716bff0" have entirely different histories.

View file

@ -64,7 +64,7 @@ Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code info
------
# Données
### Les données
Différents types de données impliquent différents outils, hypothèses, traitements, résultats...
-
@ -112,22 +112,19 @@ Sources journalistiques versus sources scientifiques ?
------
# Étapes
### Étapes
- Formulation d'hypothèses
- Identification des sources
- Collecte des données
- Exploration et contrôle
- Choix des outils adaptés
- Filtrage et enrichissement
- Analyse et visualisation
- Restitution et mise à disposition
-
1. Formulation d'hypothèses
2. Identification des sources
3. Collecte des données
4. Exploration et contrôle
5. Choix des outils adaptés
6. Filtrage et enrichissement
7. Analyse et visualisation
8. Restitution et mise à disposition
-
### 1. Formulation d'hypothèses
### Formulation d'hypothèses
Les questions doivent, autant que possible, précéder l'exploration et l'analyse
__Méthodes numériques =/= magie__
@ -136,7 +133,7 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
-
### 2. Sources
### Sources
- Sources officielles : opendata.swiss
- Sites web : europresse, smd.ch, scraping...
- Entrepôt de données : kaggle.com
@ -145,7 +142,7 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
-
### 3. Collecte
### Collecte
- Parfois simple : télécharger un jeu de données, demander gentiment à un partenaire, ...
- Parfois complexe : faire du scraping sur un site, constituer son jeu de données à la main, ...
- Parfois impossible : certaines données sont inexistantes, trop couteuses, interdites, ...
@ -153,14 +150,14 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
-
### 4. Exploration & contrôle
### Exploration & contrôle
- Regarder ses données, les lire, s'en "imprégner"
- Ajuster et re-re-re-formuler ses hypothèses
- Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser
-
### 5. Choix des outils
### Choix des outils
- Des outils libres, open source, gratuits
- Des formats simples et ouverts : csv, json, txt
- Un "pipeline" dimensionné correctement
@ -168,35 +165,27 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
-
### 6. Filtrage & enrichissement
### Filtrage & enrichissement
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
- Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés
-
### 7. Analyse & visualisation
### Analyse & visualisation
- Warning : "J'ai fait tourner l'outil, j'ai fini !"
- Analyse guidée par les hypothèses : pour répondre à une question précise, outillée correctement
- Visualisation exploratoire, analytique ou de restitution ?
-
### 8. Restitution et repartage
### Restitution et repartage
- Raconter une histoire avec des données
- Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code
-
### ???
-
### Documentation
Tout au long d'un travail de recherche, il faut documenter ses choix
------
# Démystifier
### Démystifier
Ça peut vite devenir complexe...
-
@ -216,10 +205,6 @@ Tout au long d'un travail de recherche, il faut documenter ses choix
------
# Panda
-
### Un exemple concret
Le projet [Panda](https://www.unine.ch/ajm/panda/)
@ -252,7 +237,7 @@ Les manières dont les chiffres, les statistiques et les dataviz sont utilisées
Durant la pandémie, il est important de comprendre ces usages et pratiques en regard des / en rapport avec les "chiffres officiels"
Les communiqués de presse sont une donnée officielle, régulière, fiable, et disponible, qui permet d'enrichir nos données principales (les articles)
Les communiqués de presse sont une donnée officielles, régulière, fiable, et disponibles, qui permet d'enrichir nos données principales
-
@ -278,7 +263,8 @@ Les emails de contacts ne donnent rien... Que faire ?
------
# Outils
## Outils
[Il y en a tellement...](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/outils.csv)
-
@ -302,21 +288,13 @@ Les emails de contacts ne donnent rien... Que faire ?
-
### Raw Graphs
### Dataviz
- Le cours Data d'Andrew R. !
- Un outil / plein de dataviz
- [rawgraphs.io](https://app.rawgraphs.io/)
-
[Il y en a tellement...](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/outils.csv)
- [RawGraphs](https://app.rawgraphs.io/)
------
# Démystifier encore
-
### Démystifier
Ça paraît beaucoup, mais c'est faisable
Ça paraît facile, mais pas d'emportement
@ -325,6 +303,7 @@ Soyez confiant-e mais raisonnable, et demandez conseil : diego.antolinos@unine.c
-
### Démystifier encore
Un travail outillé n'est pas meilleur
Utiliser de nouvelles méthodes demande rigueur