updates content
Some checks are pending
Tests / build (18) (push) Waiting to run
Tests / build (20) (push) Waiting to run

This commit is contained in:
diegantobass 2025-11-24 15:18:17 +01:00
parent 329e969999
commit 67624f3c7f

View file

@ -42,7 +42,7 @@ _Merci à Nicolas Becquet et Antonin Descampe_
-
### Méthodes wat ?!
"Méthode" comme dans méthode scientifique
"Méthode" comme dans _méthode scientifique_
Un procédé d'investigation qui recquiert l'observation, la classification, l'hypothèse et la vérification, et qui permet de chercher la vérité
@ -51,19 +51,21 @@ Un procédé d'investigation qui recquiert l'observation, la classification, l'h
### Numériquoi ?!
"Numérique" en français, "digital" en anglais
Intimement lié à la définition des humanités numériques. Généralement entendu comme "qui utilise un ordi", les "digits" étant les 0/1 du code informatique.
Lié aux _humanités numériques_. Généralement entendu comme "qui utilise un ordi, des données".
Pas une réalité claire, mais un ensemble varié de pratiques liées à l'utilisation d'ordinateurs dans des disciplines traditionnellement "papier-crayon".
-
### Méthodes numériques
Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types (quantitatives ou qualitatives)
Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types
Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code informatique
------
### Les données
Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats
Différents types de données impliquent différents outils, hypothèses, traitements, résultats...
-
@ -101,6 +103,10 @@ Différents types de données impliquent différents types d'hypothèses, de tra
N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donne un résultat ?
-
------
### Étapes
@ -118,19 +124,18 @@ N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donn
### Formulation d'hypothèses
Les questions doivent, autant que possible, précéder l'exploration et l'analyse
__Les méthodes numériques =/= magie__
__Méthodes numériques =/= magie__
_Conseil : noter/(re)formuler vos pistes et intuitions_
-
### Sources
- Sources officielles
- Sites web
- Entrepôt de données
- Constitution manuelle d'un jeu de données
- Capteurs
...
- Sources officielles : opendata.swiss
- Sites web : europresse, smd.ch, scraping...
- Entrepôt de données : kaggle.com
- Constitution manuelle de données
- Capteurs, crowdsourcing...
-
@ -143,22 +148,22 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
### Exploration & contrôle
- Regarder ses données, les lire, s'en "imprégner"
- Ajuster ses hypothèses, re-re-formuler ses questions
- Contrôler la qualité de ses données, l'adaptation à la tâche
- Ajuster et re-re-re-formuler ses hypothèses
- Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser
-
### Choix des outils
- Des outils libres, open source, gratuit
- Des outils libres, open source, gratuits
- Des formats simples et ouverts : csv, json, txt
- Des outils modulaires dont on comprend les entrées/sorties
- Un "pipeline" dimensionné correctement
- Des outils modulaires dont on comprend les entrées / sorties / interactions
-
### Filtrage & enrichissement
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
- Possibilité de documenter, d'annoter, ou de joindre des données : manuellement ou à l'aide d'outils adaptés
- Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés
-
@ -168,9 +173,9 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
-
### Restitution et mise à disposition
### Restitution et repartage
- Raconter une histoire avec des données
- Mettre autant que possible à disposition ses sources de données et sa méthodes / outils / code
- Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code
------
@ -188,15 +193,55 @@ _Pandemic Data : Production, diffusion et compréhension des données en temps d
-
### Méthodes numériques
- Analyse du contenu des articles "Covid-19"
- Analyse des représentations de données / dataviz
- Hypothèses de Panda
- 5 sources différentes : ArcInfo, Le Temps, Heidi News, Tribune de Genève, RTS, 24 Heures
- Données fournies + scrapées avec Python
- Partage spreadsheets, csv, notebooks, github...
- Contrôle outillé (Python, xan) + manuel
- Plein d'outils : Iramuteq, beautifulSoup, xan...
- Enrichissement + croisement + données secondaires
- Analyse de texte, analyse de séquences
- Visualisation d'exploration + analyse
- Papiers de recherche en préparation + entrepôt de données de l'UniNE
------
###
## Outils
-
### Warning
Les outils, ça donnne envie / semble magique
De bonnes hypothèses de travail, c'est mieux
-
### Open Refine
- Excel sous stéroïdes
- Explorer, contrôler, enrichir
- [openrefine.org](https://openrefine.org/)
-
### Voyant Tools
- Toute l'analyse de texte lexicométrique à portée de main...presque
- [voyant-tools.org](https://voyant-tools.org/)
-
### Open QDA
- Analyse qualitative, codage d'entretien
- Pas de fonction d'analyses avancées
- [openqda.org](https://openqda.org/)
-
### Dataviz
- Le cours Data d'Andrew R. !
- [RawGraphs](https://app.rawgraphs.io/)
------
[Bibliographie](bibliographie.md)
[Liste d'outils](outils.csv)