diff --git a/digitalmethods.md b/digitalmethods.md index bada943c..3af41986 100644 --- a/digitalmethods.md +++ b/digitalmethods.md @@ -42,7 +42,7 @@ _Merci à Nicolas Becquet et Antonin Descampe_ - ### Méthodes wat ?! -"Méthode" comme dans méthode scientifique +"Méthode" comme dans _méthode scientifique_ Un procédé d'investigation qui recquiert l'observation, la classification, l'hypothèse et la vérification, et qui permet de chercher la vérité @@ -51,19 +51,21 @@ Un procédé d'investigation qui recquiert l'observation, la classification, l'h ### Numériquoi ?! "Numérique" en français, "digital" en anglais -Intimement lié à la définition des humanités numériques. Généralement entendu comme "qui utilise un ordi", les "digits" étant les 0/1 du code informatique. +Lié aux _humanités numériques_. Généralement entendu comme "qui utilise un ordi, des données". + +Pas une réalité claire, mais un ensemble varié de pratiques liées à l'utilisation d'ordinateurs dans des disciplines traditionnellement "papier-crayon". - ### Méthodes numériques -Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types (quantitatives ou qualitatives) +Mot-valise qui recouvre de nombreuses techniques et outils d'analyse de données de tous types Du simple tableau Excel au "pipeline" complexe d'analyses utilisant du code informatique ------ ### Les données -Différents types de données impliquent différents types d'hypothèses, de traitements, de résultats +Différents types de données impliquent différents outils, hypothèses, traitements, résultats... - @@ -101,6 +103,10 @@ Différents types de données impliquent différents types d'hypothèses, de tra N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donne un résultat ? +- + + + ------ ### Étapes @@ -118,19 +124,18 @@ N'importe quoi est une donnée, si ça rentre dans un algorithme et que ça donn ### Formulation d'hypothèses Les questions doivent, autant que possible, précéder l'exploration et l'analyse -__Les méthodes numériques =/= magie__ +__Méthodes numériques =/= magie__ _Conseil : noter/(re)formuler vos pistes et intuitions_ - ### Sources -- Sources officielles -- Sites web -- Entrepôt de données -- Constitution manuelle d'un jeu de données -- Capteurs -... +- Sources officielles : opendata.swiss +- Sites web : europresse, smd.ch, scraping... +- Entrepôt de données : kaggle.com +- Constitution manuelle de données +- Capteurs, crowdsourcing... - @@ -143,22 +148,22 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_ ### Exploration & contrôle - Regarder ses données, les lire, s'en "imprégner" -- Ajuster ses hypothèses, re-re-formuler ses questions -- Contrôler la qualité de ses données, l'adaptation à la tâche +- Ajuster et re-re-re-formuler ses hypothèses +- Contrôler la qualité de ses données, l'adaptation à la tâche, les besoins d'enrichir ou de croiser - ### Choix des outils -- Des outils libres, open source, gratuit +- Des outils libres, open source, gratuits - Des formats simples et ouverts : csv, json, txt -- Des outils modulaires dont on comprend les entrées/sorties - Un "pipeline" dimensionné correctement +- Des outils modulaires dont on comprend les entrées / sorties / interactions - ### Filtrage & enrichissement - Inutile de garder des données énormes si ça n'est pas nécessaire : difficile à manipuler, ajoute des possibilités d'erreur -- Possibilité de documenter, d'annoter, ou de joindre des données : manuellement ou à l'aide d'outils adaptés +- Possibilité de documenter, d'annoter, ou de _joindre_ des données : manuellement ou à l'aide d'outils adaptés - @@ -168,9 +173,9 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_ - -### Restitution et mise à disposition +### Restitution et repartage - Raconter une histoire avec des données -- Mettre autant que possible à disposition ses sources de données et sa méthodes / outils / code +- Mettre autant que possible à disposition ses sources, sa méthode, ses outils, son code ------ @@ -188,15 +193,55 @@ _Pandemic Data : Production, diffusion et compréhension des données en temps d - -### Méthodes numériques -- Analyse du contenu des articles "Covid-19" -- Analyse des représentations de données / dataviz - +- Hypothèses de Panda +- 5 sources différentes : ArcInfo, Le Temps, Heidi News, Tribune de Genève, RTS, 24 Heures +- Données fournies + scrapées avec Python +- Partage spreadsheets, csv, notebooks, github... +- Contrôle outillé (Python, xan) + manuel +- Plein d'outils : Iramuteq, beautifulSoup, xan... +- Enrichissement + croisement + données secondaires +- Analyse de texte, analyse de séquences +- Visualisation d'exploration + analyse +- Papiers de recherche en préparation + entrepôt de données de l'UniNE ------ -### +## Outils + +- + +### Warning +Les outils, ça donnne envie / semble magique + +De bonnes hypothèses de travail, c'est mieux + +- + +### Open Refine +- Excel sous stéroïdes +- Explorer, contrôler, enrichir +- [openrefine.org](https://openrefine.org/) + +- + +### Voyant Tools +- Toute l'analyse de texte lexicométrique à portée de main...presque +- [voyant-tools.org](https://voyant-tools.org/) + +- + +### Open QDA +- Analyse qualitative, codage d'entretien +- Pas de fonction d'analyses avancées +- [openqda.org](https://openqda.org/) + +- + +### Dataviz +- Le cours Data d'Andrew R. ! +- [RawGraphs](https://app.rawgraphs.io/) ------ [Bibliographie](bibliographie.md) +[Liste d'outils](outils.csv)