Compare commits
No commits in common. "47f87f2efd0def4ee06a1cd425020726bc619f47" and "61626c0f81bf6142c02d13d6308a7937e716bff0" have entirely different histories.
47f87f2efd
...
61626c0f81
1 changed files with 27 additions and 48 deletions
|
|
@ -64,7 +64,7 @@ Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code info
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
# Données
|
### Les données
|
||||||
Différents types de données impliquent différents outils, hypothèses, traitements, résultats...
|
Différents types de données impliquent différents outils, hypothèses, traitements, résultats...
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
@ -112,22 +112,19 @@ Sources journalistiques versus sources scientifiques ?
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
# Étapes
|
### Étapes
|
||||||
|
- Formulation d'hypothèses
|
||||||
|
- Identification des sources
|
||||||
|
- Collecte des données
|
||||||
|
- Exploration et contrôle
|
||||||
|
- Choix des outils adaptés
|
||||||
|
- Filtrage et enrichissement
|
||||||
|
- Analyse et visualisation
|
||||||
|
- Restitution et mise à disposition
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
1. Formulation d'hypothèses
|
### Formulation d'hypothèses
|
||||||
2. Identification des sources
|
|
||||||
3. Collecte des données
|
|
||||||
4. Exploration et contrôle
|
|
||||||
5. Choix des outils adaptés
|
|
||||||
6. Filtrage et enrichissement
|
|
||||||
7. Analyse et visualisation
|
|
||||||
8. Restitution et mise à disposition
|
|
||||||
|
|
||||||
-
|
|
||||||
|
|
||||||
### 1. Formulation d'hypothèses
|
|
||||||
Les questions doivent, autant que possible, précéder l'exploration et l'analyse
|
Les questions doivent, autant que possible, précéder l'exploration et l'analyse
|
||||||
|
|
||||||
__Méthodes numériques =/= magie__
|
__Méthodes numériques =/= magie__
|
||||||
|
|
@ -136,7 +133,7 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### 2. Sources
|
### Sources
|
||||||
- Sources officielles : opendata.swiss
|
- Sources officielles : opendata.swiss
|
||||||
- Sites web : europresse, smd.ch, scraping...
|
- Sites web : europresse, smd.ch, scraping...
|
||||||
- Entrepôt de données : kaggle.com
|
- Entrepôt de données : kaggle.com
|
||||||
|
|
@ -145,7 +142,7 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### 3. Collecte
|
### Collecte
|
||||||
- Parfois simple : télécharger un jeu de données, demander gentiment à un partenaire, ...
|
- Parfois simple : télécharger un jeu de données, demander gentiment à un partenaire, ...
|
||||||
- Parfois complexe : faire du scraping sur un site, constituer son jeu de données à la main, ...
|
- Parfois complexe : faire du scraping sur un site, constituer son jeu de données à la main, ...
|
||||||
- Parfois impossible : certaines données sont inexistantes, trop couteuses, interdites, ...
|
- Parfois impossible : certaines données sont inexistantes, trop couteuses, interdites, ...
|
||||||
|
|
@ -153,14 +150,14 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### 4. Exploration & contrôle
|
### Exploration & contrôle
|
||||||
- Regarder ses données, les lire, s'en "imprégner"
|
- Regarder ses données, les lire, s'en "imprégner"
|
||||||
- Ajuster et re-re-re-formuler ses hypothèses
|
- Ajuster et re-re-re-formuler ses hypothèses
|
||||||
- Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser
|
- Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### 5. Choix des outils
|
### Choix des outils
|
||||||
- Des outils libres, open source, gratuits
|
- Des outils libres, open source, gratuits
|
||||||
- Des formats simples et ouverts : csv, json, txt
|
- Des formats simples et ouverts : csv, json, txt
|
||||||
- Un "pipeline" dimensionné correctement
|
- Un "pipeline" dimensionné correctement
|
||||||
|
|
@ -168,35 +165,27 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### 6. Filtrage & enrichissement
|
### Filtrage & enrichissement
|
||||||
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
|
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
|
||||||
- Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés
|
- Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### 7. Analyse & visualisation
|
### Analyse & visualisation
|
||||||
- Warning : "J'ai fait tourner l'outil, j'ai fini !"
|
- Warning : "J'ai fait tourner l'outil, j'ai fini !"
|
||||||
- Analyse guidée par les hypothèses : pour répondre à une question précise, outillée correctement
|
- Analyse guidée par les hypothèses : pour répondre à une question précise, outillée correctement
|
||||||
- Visualisation exploratoire, analytique ou de restitution ?
|
- Visualisation exploratoire, analytique ou de restitution ?
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### 8. Restitution et repartage
|
### Restitution et repartage
|
||||||
- Raconter une histoire avec des données
|
- Raconter une histoire avec des données
|
||||||
- Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code
|
- Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code
|
||||||
|
|
||||||
-
|
|
||||||
|
|
||||||
### ???
|
|
||||||
|
|
||||||
-
|
|
||||||
|
|
||||||
### Documentation
|
|
||||||
Tout au long d'un travail de recherche, il faut documenter ses choix
|
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
# Démystifier
|
### Démystifier
|
||||||
|
Ça peut vite devenir complexe...
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
|
|
@ -216,10 +205,6 @@ Tout au long d'un travail de recherche, il faut documenter ses choix
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
# Panda
|
|
||||||
|
|
||||||
-
|
|
||||||
|
|
||||||
### Un exemple concret
|
### Un exemple concret
|
||||||
Le projet [Panda](https://www.unine.ch/ajm/panda/)
|
Le projet [Panda](https://www.unine.ch/ajm/panda/)
|
||||||
|
|
||||||
|
|
@ -252,7 +237,7 @@ Les manières dont les chiffres, les statistiques et les dataviz sont utilisées
|
||||||
|
|
||||||
Durant la pandémie, il est important de comprendre ces usages et pratiques en regard des / en rapport avec les "chiffres officiels"
|
Durant la pandémie, il est important de comprendre ces usages et pratiques en regard des / en rapport avec les "chiffres officiels"
|
||||||
|
|
||||||
Les communiqués de presse sont une donnée officielle, régulière, fiable, et disponible, qui permet d'enrichir nos données principales (les articles)
|
Les communiqués de presse sont une donnée officielles, régulière, fiable, et disponibles, qui permet d'enrichir nos données principales
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
|
|
@ -278,7 +263,8 @@ Les emails de contacts ne donnent rien... Que faire ?
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
# Outils
|
## Outils
|
||||||
|
[Il y en a tellement...](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/outils.csv)
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
|
|
@ -302,21 +288,13 @@ Les emails de contacts ne donnent rien... Que faire ?
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### Raw Graphs
|
### Dataviz
|
||||||
- Le cours Data d'Andrew R. !
|
- Le cours Data d'Andrew R. !
|
||||||
- Un outil / plein de dataviz
|
- [RawGraphs](https://app.rawgraphs.io/)
|
||||||
- [rawgraphs.io](https://app.rawgraphs.io/)
|
|
||||||
|
|
||||||
-
|
|
||||||
|
|
||||||
[Il y en a tellement...](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/outils.csv)
|
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
# Démystifier encore
|
### Démystifier
|
||||||
|
|
||||||
-
|
|
||||||
|
|
||||||
Ça paraît beaucoup, mais c'est faisable
|
Ça paraît beaucoup, mais c'est faisable
|
||||||
|
|
||||||
Ça paraît facile, mais pas d'emportement
|
Ça paraît facile, mais pas d'emportement
|
||||||
|
|
@ -325,6 +303,7 @@ Soyez confiant-e mais raisonnable, et demandez conseil : diego.antolinos@unine.c
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
|
### Démystifier encore
|
||||||
Un travail outillé n'est pas meilleur
|
Un travail outillé n'est pas meilleur
|
||||||
|
|
||||||
Utiliser de nouvelles méthodes demande rigueur
|
Utiliser de nouvelles méthodes demande rigueur
|
||||||
|
|
|
||||||
Loading…
Reference in a new issue