last update before next

This commit is contained in:
diegantobass 2025-11-24 17:16:25 +01:00
parent 61626c0f81
commit 5e6708420e

View file

@ -64,7 +64,7 @@ Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code info
------ ------
### Les données # Données
Différents types de données impliquent différents outils, hypothèses, traitements, résultats... Différents types de données impliquent différents outils, hypothèses, traitements, résultats...
- -
@ -112,19 +112,22 @@ Sources journalistiques versus sources scientifiques ?
------ ------
### Étapes # Étapes
- Formulation d'hypothèses
- Identification des sources
- Collecte des données
- Exploration et contrôle
- Choix des outils adaptés
- Filtrage et enrichissement
- Analyse et visualisation
- Restitution et mise à disposition
- -
### Formulation d'hypothèses 1. Formulation d'hypothèses
2. Identification des sources
3. Collecte des données
4. Exploration et contrôle
5. Choix des outils adaptés
6. Filtrage et enrichissement
7. Analyse et visualisation
8. Restitution et mise à disposition
-
### 1. Formulation d'hypothèses
Les questions doivent, autant que possible, précéder l'exploration et l'analyse Les questions doivent, autant que possible, précéder l'exploration et l'analyse
__Méthodes numériques =/= magie__ __Méthodes numériques =/= magie__
@ -133,7 +136,7 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
- -
### Sources ### 2. Sources
- Sources officielles : opendata.swiss - Sources officielles : opendata.swiss
- Sites web : europresse, smd.ch, scraping... - Sites web : europresse, smd.ch, scraping...
- Entrepôt de données : kaggle.com - Entrepôt de données : kaggle.com
@ -142,7 +145,7 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
- -
### Collecte ### 3. Collecte
- Parfois simple : télécharger un jeu de données, demander gentiment à un partenaire, ... - Parfois simple : télécharger un jeu de données, demander gentiment à un partenaire, ...
- Parfois complexe : faire du scraping sur un site, constituer son jeu de données à la main, ... - Parfois complexe : faire du scraping sur un site, constituer son jeu de données à la main, ...
- Parfois impossible : certaines données sont inexistantes, trop couteuses, interdites, ... - Parfois impossible : certaines données sont inexistantes, trop couteuses, interdites, ...
@ -150,14 +153,14 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
- -
### Exploration & contrôle ### 4. Exploration & contrôle
- Regarder ses données, les lire, s'en "imprégner" - Regarder ses données, les lire, s'en "imprégner"
- Ajuster et re-re-re-formuler ses hypothèses - Ajuster et re-re-re-formuler ses hypothèses
- Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser - Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser
- -
### Choix des outils ### 5. Choix des outils
- Des outils libres, open source, gratuits - Des outils libres, open source, gratuits
- Des formats simples et ouverts : csv, json, txt - Des formats simples et ouverts : csv, json, txt
- Un "pipeline" dimensionné correctement - Un "pipeline" dimensionné correctement
@ -165,27 +168,26 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
- -
### Filtrage & enrichissement ### 6. Filtrage & enrichissement
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur - Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
- Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés - Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés
- -
### Analyse & visualisation ### 7. Analyse & visualisation
- Warning : "J'ai fait tourner l'outil, j'ai fini !" - Warning : "J'ai fait tourner l'outil, j'ai fini !"
- Analyse guidée par les hypothèses : pour répondre à une question précise, outillée correctement - Analyse guidée par les hypothèses : pour répondre à une question précise, outillée correctement
- Visualisation exploratoire, analytique ou de restitution ? - Visualisation exploratoire, analytique ou de restitution ?
- -
### Restitution et repartage ### 8. Restitution et repartage
- Raconter une histoire avec des données - Raconter une histoire avec des données
- Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code - Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code
------ ------
### Démystifier # Démystifier
Ça peut vite devenir complexe...
- -
@ -205,6 +207,10 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
------ ------
# Panda
-
### Un exemple concret ### Un exemple concret
Le projet [Panda](https://www.unine.ch/ajm/panda/) Le projet [Panda](https://www.unine.ch/ajm/panda/)
@ -263,8 +269,7 @@ Les emails de contacts ne donnent rien... Que faire ?
------ ------
## Outils # Outils
[Il y en a tellement...](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/outils.csv)
- -
@ -288,13 +293,21 @@ Les emails de contacts ne donnent rien... Que faire ?
- -
### Dataviz ### Raw Graphs
- Le cours Data d'Andrew R. ! - Le cours Data d'Andrew R. !
- [RawGraphs](https://app.rawgraphs.io/) - Un outil / plein de dataviz
- [rawgraphs.io](https://app.rawgraphs.io/)
-
[Il y en a tellement...](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/outils.csv)
------ ------
### Démystifier # Démystifier encore
-
Ça paraît beaucoup, mais c'est faisable Ça paraît beaucoup, mais c'est faisable
Ça paraît facile, mais pas d'emportement Ça paraît facile, mais pas d'emportement
@ -303,7 +316,6 @@ Soyez confiant-e mais raisonnable, et demandez conseil : diego.antolinos@unine.c
- -
### Démystifier encore
Un travail outillé n'est pas meilleur Un travail outillé n'est pas meilleur
Utiliser de nouvelles méthodes demande rigueur Utiliser de nouvelles méthodes demande rigueur