updates content
This commit is contained in:
parent
329e969999
commit
67624f3c7f
1 changed files with 68 additions and 23 deletions
|
|
@ -42,7 +42,7 @@ _Merci à Nicolas Becquet et Antonin Descampe_
|
||||||
-
|
-
|
||||||
|
|
||||||
### Méthodes wat ?!
|
### Méthodes wat ?!
|
||||||
"Méthode" comme dans méthode scientifique
|
"Méthode" comme dans _méthode scientifique_
|
||||||
|
|
||||||
Un procédé d'investigation qui recquiert l'observation, la classification, l'hypothèse et la vérification, et qui permet de chercher la vérité
|
Un procédé d'investigation qui recquiert l'observation, la classification, l'hypothèse et la vérification, et qui permet de chercher la vérité
|
||||||
|
|
||||||
|
|
@ -51,19 +51,21 @@ Un procédé d'investigation qui recquiert l'observation, la classification, l'h
|
||||||
### Numériquoi ?!
|
### Numériquoi ?!
|
||||||
"Numérique" en français, "digital" en anglais
|
"Numérique" en français, "digital" en anglais
|
||||||
|
|
||||||
Intimement lié à la définition des humanités numériques. Généralement entendu comme "qui utilise un ordi", les "digits" étant les 0/1 du code informatique.
|
Lié aux _humanités numériques_. Généralement entendu comme "qui utilise un ordi, des données".
|
||||||
|
|
||||||
|
Pas une réalité claire, mais un ensemble varié de pratiques liées à l'utilisation d'ordinateurs dans des disciplines traditionnellement "papier-crayon".
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### Méthodes numériques
|
### Méthodes numériques
|
||||||
Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types (quantitatives ou qualitatives)
|
Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types
|
||||||
|
|
||||||
Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code informatique
|
Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code informatique
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
### Les données
|
### Les données
|
||||||
Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats
|
Différents types de données impliquent différents outils, hypothèses, traitements, résultats...
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
|
|
@ -101,6 +103,10 @@ Différents types de données impliquent différents types d'hypothèses, de tra
|
||||||
|
|
||||||
N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donne un résultat ?
|
N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donne un résultat ?
|
||||||
|
|
||||||
|
-
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
### Étapes
|
### Étapes
|
||||||
|
|
@ -118,19 +124,18 @@ N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donn
|
||||||
### Formulation d'hypothèses
|
### Formulation d'hypothèses
|
||||||
Les questions doivent, autant que possible, précéder l'exploration et l'analyse
|
Les questions doivent, autant que possible, précéder l'exploration et l'analyse
|
||||||
|
|
||||||
__Les méthodes numériques =/= magie__
|
__Méthodes numériques =/= magie__
|
||||||
|
|
||||||
_Conseil : noter/(re)formuler vos pistes et intuitions_
|
_Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### Sources
|
### Sources
|
||||||
- Sources officielles
|
- Sources officielles : opendata.swiss
|
||||||
- Sites web
|
- Sites web : europresse, smd.ch, scraping...
|
||||||
- Entrepôt de données
|
- Entrepôt de données : kaggle.com
|
||||||
- Constitution manuelle d'un jeu de données
|
- Constitution manuelle de données
|
||||||
- Capteurs
|
- Capteurs, crowdsourcing...
|
||||||
...
|
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
|
|
@ -143,22 +148,22 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||||
|
|
||||||
### Exploration & contrôle
|
### Exploration & contrôle
|
||||||
- Regarder ses données, les lire, s'en "imprégner"
|
- Regarder ses données, les lire, s'en "imprégner"
|
||||||
- Ajuster ses hypothèses, re-re-formuler ses questions
|
- Ajuster et re-re-re-formuler ses hypothèses
|
||||||
- Contrôler la qualité de ses données, l'adaptation à la tâche
|
- Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### Choix des outils
|
### Choix des outils
|
||||||
- Des outils libres, open source, gratuit
|
- Des outils libres, open source, gratuits
|
||||||
- Des formats simples et ouverts : csv, json, txt
|
- Des formats simples et ouverts : csv, json, txt
|
||||||
- Des outils modulaires dont on comprend les entrées/sorties
|
|
||||||
- Un "pipeline" dimensionné correctement
|
- Un "pipeline" dimensionné correctement
|
||||||
|
- Des outils modulaires dont on comprend les entrées / sorties / interactions
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### Filtrage & enrichissement
|
### Filtrage & enrichissement
|
||||||
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
|
- Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur
|
||||||
- Possibilité de documenter, d'annoter, ou de joindre des données : manuellement ou à l'aide d'outils adaptés
|
- Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
|
|
@ -168,9 +173,9 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### Restitution et mise à disposition
|
### Restitution et repartage
|
||||||
- Raconter une histoire avec des données
|
- Raconter une histoire avec des données
|
||||||
- Mettre autant que possible à disposition ses sources de données et sa méthodes / outils / code
|
- Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
|
|
@ -188,15 +193,55 @@ _Pandemic Data : Production, diffusion et compréhension des données en temps d
|
||||||
|
|
||||||
-
|
-
|
||||||
|
|
||||||
### Méthodes numériques
|
- Hypothèses de Panda
|
||||||
- Analyse du contenu des articles "Covid-19"
|
- 5 sources différentes : ArcInfo, Le Temps, Heidi News, Tribune de Genève, RTS, 24 Heures
|
||||||
- Analyse des représentations de données / dataviz
|
- Données fournies + scrapées avec Python
|
||||||
|
- Partage spreadsheets, csv, notebooks, github...
|
||||||
|
- Contrôle outillé (Python, xan) + manuel
|
||||||
|
- Plein d'outils : Iramuteq, beautifulSoup, xan...
|
||||||
|
- Enrichissement + croisement + données secondaires
|
||||||
|
- Analyse de texte, analyse de séquences
|
||||||
|
- Visualisation d'exploration + analyse
|
||||||
|
- Papiers de recherche en préparation + entrepôt de données de l'UniNE
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
###
|
## Outils
|
||||||
|
|
||||||
|
-
|
||||||
|
|
||||||
|
### Warning
|
||||||
|
Les outils, ça donnne envie / semble magique
|
||||||
|
|
||||||
|
De bonnes hypothèses de travail, c'est mieux
|
||||||
|
|
||||||
|
-
|
||||||
|
|
||||||
|
### Open Refine
|
||||||
|
- Excel sous stéroïdes
|
||||||
|
- Explorer, contrôler, enrichir
|
||||||
|
- [openrefine.org](https://openrefine.org/)
|
||||||
|
|
||||||
|
-
|
||||||
|
|
||||||
|
### Voyant Tools
|
||||||
|
- Toute l'analyse de texte lexicométrique à portée de main...presque
|
||||||
|
- [voyant-tools.org](https://voyant-tools.org/)
|
||||||
|
|
||||||
|
-
|
||||||
|
|
||||||
|
### Open QDA
|
||||||
|
- Analyse qualitative, codage d'entretien
|
||||||
|
- Pas de fonction d'analyses avancées
|
||||||
|
- [openqda.org](https://openqda.org/)
|
||||||
|
|
||||||
|
-
|
||||||
|
|
||||||
|
### Dataviz
|
||||||
|
- Le cours Data d'Andrew R. !
|
||||||
|
- [RawGraphs](https://app.rawgraphs.io/)
|
||||||
|
|
||||||
------
|
------
|
||||||
|
|
||||||
[Bibliographie](bibliographie.md)
|
[Bibliographie](bibliographie.md)
|
||||||
|
[Liste d'outils](outils.csv)
|
||||||
|
|
|
||||||
Loading…
Reference in a new issue