updates content
Some checks are pending
Tests / build (18) (push) Waiting to run
Tests / build (20) (push) Waiting to run

This commit is contained in:
diegantobass 2025-11-24 15:18:17 +01:00
parent 329e969999
commit 67624f3c7f

View file

@ -42,7 +42,7 @@ _Merci à Nicolas Becquet et Antonin Descampe_
- -
### Méthodes wat ?! ### Méthodes wat ?!
"Méthode" comme dans méthode scientifique "Méthode" comme dans _méthode scientifique_
Un procédé d'investigation qui recquiert l'observation, la classification, l'hypothèse et la vérification, et qui permet de chercher la vérité Un procédé d'investigation qui recquiert l'observation, la classification, l'hypothèse et la vérification, et qui permet de chercher la vérité
@ -51,19 +51,21 @@ Un procédé d'investigation qui recquiert l'observation, la classification, l'h
### Numériquoi ?! ### Numériquoi ?!
"Numérique" en français, "digital" en anglais "Numérique" en français, "digital" en anglais
Intimement lié à la définition des humanités numériques. Généralement entendu comme "qui utilise un ordi", les "digits" étant les 0/1 du code informatique. Lié aux _humanités numériques_. Généralement entendu comme "qui utilise un ordi, des données".
Pas une réalité claire, mais un ensemble varié de pratiques liées à l'utilisation d'ordinateurs dans des disciplines traditionnellement "papier-crayon".
- -
### Méthodes numériques ### Méthodes numériques
Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types (quantitatives ou qualitatives) Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types
Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code informatique Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code informatique
------ ------
### Les données ### Les données
Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats Différents types de données impliquent différents outils, hypothèses, traitements, résultats...
- -
@ -101,6 +103,10 @@ Différents types de données impliquent différents types d'hypothèses, de tra
N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donne un résultat ? N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donne un résultat ?
-
------ ------
### Étapes ### Étapes
@ -118,19 +124,18 @@ N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donn
### Formulation d'hypothèses ### Formulation d'hypothèses
Les questions doivent, autant que possible, précéder l'exploration et l'analyse Les questions doivent, autant que possible, précéder l'exploration et l'analyse
__Les méthodes numériques =/= magie__ __Méthodes numériques =/= magie__
_Conseil : noter/(re)formuler vos pistes et intuitions_ _Conseil : noter/(re)formuler vos pistes et intuitions_
- -
### Sources ### Sources
- Sources officielles - Sources officielles : opendata.swiss
- Sites web - Sites web : europresse, smd.ch, scraping...
- Entrepôt de données - Entrepôt de données : kaggle.com
- Constitution manuelle d'un jeu de données - Constitution manuelle de données
- Capteurs - Capteurs, crowdsourcing...
...
- -
@ -143,22 +148,22 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
### Exploration & contrôle ### Exploration & contrôle
- Regarder ses données, les lire, s'en "imprégner" - Regarder ses données, les lire, s'en "imprégner"
- Ajuster ses hypothèses, re-re-formuler ses questions - Ajuster et re-re-re-formuler ses hypothèses
- Contrôler la qualité de ses données, l'adaptation à la tâche - Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser
- -
### Choix des outils ### Choix des outils
- Des outils libres, open source, gratuit - Des outils libres, open source, gratuits
- Des formats simples et ouverts : csv, json, txt - Des formats simples et ouverts : csv, json, txt
- Des outils modulaires dont on comprend les entrées/sorties
- Un "pipeline" dimensionné correctement - Un "pipeline" dimensionné correctement
- Des outils modulaires dont on comprend les entrées / sorties / interactions
- -
### Filtrage & enrichissement ### Filtrage & enrichissement
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur - Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
- Possibilité de documenter, d'annoter, ou de joindre des données : manuellement ou à l'aide d'outils adaptés - Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés
- -
@ -168,9 +173,9 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
- -
### Restitution et mise à disposition ### Restitution et repartage
- Raconter une histoire avec des données - Raconter une histoire avec des données
- Mettre autant que possible à disposition ses sources de données et sa méthodes / outils / code - Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code
------ ------
@ -188,15 +193,55 @@ _Pandemic Data : Production, diffusion et compréhension des données en temps d
- -
### Méthodes numériques - Hypothèses de Panda
- Analyse du contenu des articles "Covid-19" - 5 sources différentes : ArcInfo, Le Temps, Heidi News, Tribune de Genève, RTS, 24 Heures
- Analyse des représentations de données / dataviz - Données fournies + scrapées avec Python
- Partage spreadsheets, csv, notebooks, github...
- Contrôle outillé (Python, xan) + manuel
- Plein d'outils : Iramuteq, beautifulSoup, xan...
- Enrichissement + croisement + données secondaires
- Analyse de texte, analyse de séquences
- Visualisation d'exploration + analyse
- Papiers de recherche en préparation + entrepôt de données de l'UniNE
------ ------
### ## Outils
-
### Warning
Les outils, ça donnne envie / semble magique
De bonnes hypothèses de travail, c'est mieux
-
### Open Refine
- Excel sous stéroïdes
- Explorer, contrôler, enrichir
- [openrefine.org](https://openrefine.org/)
-
### Voyant Tools
- Toute l'analyse de texte lexicométrique à portée de main...presque
- [voyant-tools.org](https://voyant-tools.org/)
-
### Open QDA
- Analyse qualitative, codage d'entretien
- Pas de fonction d'analyses avancées
- [openqda.org](https://openqda.org/)
-
### Dataviz
- Le cours Data d'Andrew R. !
- [RawGraphs](https://app.rawgraphs.io/)
------ ------
[Bibliographie](bibliographie.md) [Bibliographie](bibliographie.md)
[Liste d'outils](outils.csv)