corrections postcours
This commit is contained in:
parent
92409d0ff3
commit
235fe55857
2 changed files with 20 additions and 32 deletions
|
|
@ -10,7 +10,6 @@ diego.antolinos@unine.ch
|
|||
- Research software engineer à l'AJM
|
||||
- Formation de linguiste-informaticien
|
||||
- Je code pour des chercheurs en sciences sociales
|
||||
- [let-me-google-myself-for-you](https://www.google.com/search?q=diego+antolinos+basso)
|
||||
|
||||
-
|
||||
|
||||
|
|
@ -79,10 +78,13 @@ Différents types de données impliquent différents outils, hypothèses, traite
|
|||
|
||||
-
|
||||
|
||||
Tableau de chiffres
|
||||

|
||||
|
||||
-
|
||||
|
||||
Entretien retranscrit
|
||||
|
||||
\- Locuteur A : Alors moi, perso, quand je travaillais à \<Entreprise 1\> j'ai eu à gérer plusieurs cas assez bordeline \<inaudible\> ça impliquait toujours la même personne
|
||||
|
||||
\- Locuteur B : \<rires\> Je serais intéressé par connaître le profil de la personne !
|
||||
|
|
@ -91,22 +93,27 @@ Différents types de données impliquent différents outils, hypothèses, traite
|
|||
|
||||
-
|
||||
|
||||
Carte
|
||||

|
||||
|
||||
-
|
||||
|
||||
Données geocodées
|
||||

|
||||
|
||||
-
|
||||
|
||||
Le format JSON
|
||||

|
||||
|
||||
-
|
||||
|
||||
Du HTML
|
||||

|
||||
|
||||
-
|
||||
|
||||
Des images
|
||||

|
||||
|
||||
-
|
||||
|
|
@ -117,9 +124,9 @@ Sources journalistiques versus sources scientifiques ?
|
|||
|
||||
-
|
||||
|
||||
Un article et ses métadonnées
|
||||

|
||||
|
||||
|
||||
------
|
||||
|
||||
# Étapes
|
||||
|
|
@ -197,12 +204,8 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
|
|||
|
||||
-
|
||||
|
||||
### ???
|
||||
|
||||
-
|
||||
|
||||
### Documentation
|
||||
Tout au long d'un travail de recherche, il faut documenter ses choix
|
||||
### + Documentation
|
||||
Tout au long d'un travail de recherche, à chaque étape, il faut documenter ses choix
|
||||
|
||||
------
|
||||
|
||||
|
|
@ -244,19 +247,6 @@ _Pandemic Data : Production, diffusion et compréhension des données en temps d
|
|||
|
||||
-
|
||||
|
||||
- Hypothèses de Panda
|
||||
- 5 sources différentes : ArcInfo, Le Temps, Heidi News, Tribune de Genève, RTS, 24 Heures
|
||||
- Données fournies + scrapées avec Python
|
||||
- Partage spreadsheets, csv, notebooks, github...
|
||||
- Contrôle outillé (Python, xan) + manuel
|
||||
- Plein d'outils : Iramuteq, beautifulSoup, xan...
|
||||
- Enrichissement + croisement + données secondaires
|
||||
- Analyse de texte, analyse de séquences
|
||||
- Visualisation d'exploration + analyse
|
||||
- Papiers de recherche en préparation + entrepôt de données de l'UniNE
|
||||
|
||||
-
|
||||
|
||||
### Hypothèses
|
||||
Les manières dont les chiffres, les statistiques et les dataviz sont utilisées dans les articles de presse nous informent sur les pratiques journalistiques
|
||||
|
||||
|
|
@ -267,24 +257,26 @@ Les communiqués de presse sont une donnée officielle, régulière, fiable, et
|
|||
-
|
||||
|
||||
### Admin.ch
|
||||
Un site gouvernemental cassé parmi tant d'autres (flux rss)
|
||||
Un site gouvernemental cassé parmi tant d'autres
|
||||
|
||||
Les emails de contacts ne donnent rien... Que faire ?
|
||||
Les données sont consultables en lignes, mais pas téléchargeables
|
||||
|
||||
-
|
||||
|
||||
### Scraping et mise en forme
|
||||
(HTML + code + csv)
|
||||
Le scraping permet de récupérer des données structurées depuis un site internet
|
||||
|
||||
Attention le code est souvent "ad-hoc" : il faut analyser le html pour structurer ses données de sorties
|
||||
|
||||
-
|
||||
|
||||
### Analyse de texte
|
||||
(Code + principes)
|
||||
On répère avec un algorithme simple des mots-clés dans les texte pour catégoriser les communiqués et compter les prises de paroles officielles sur les sujets "covid"
|
||||
|
||||
-
|
||||
|
||||
### Visualisation des résultats
|
||||
(Timelines des indicateurs)
|
||||

|
||||
|
||||
------
|
||||
|
||||
|
|
@ -293,7 +285,7 @@ Les emails de contacts ne donnent rien... Que faire ?
|
|||
-
|
||||
|
||||
### Open Refine
|
||||
- Excel sous stéroïdes
|
||||
- Un Excel sous stéroïdes
|
||||
- Explorer, contrôler, enrichir
|
||||
- [openrefine.org](https://openrefine.org/)
|
||||
|
||||
|
|
@ -307,7 +299,7 @@ Les emails de contacts ne donnent rien... Que faire ?
|
|||
|
||||
### Open QDA
|
||||
- Analyse qualitative, codage d'entretien
|
||||
- Pas de fonction d'analyses avancées
|
||||
- Pas de fonction d'analyses/visualisations avancées
|
||||
- [openqda.org](https://openqda.org/)
|
||||
|
||||
-
|
||||
|
|
@ -341,10 +333,6 @@ Utiliser de nouvelles méthodes demande rigueur
|
|||
|
||||
On abandonne pas la déontologie en chemin
|
||||
|
||||
-
|
||||
|
||||
### Des idées ?
|
||||
|
||||
------
|
||||
|
||||
[Bibliographie](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/bibliographie.md)
|
||||
|
|
|
|||
BIN
images/timeline.png
Normal file
BIN
images/timeline.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 64 KiB |
Loading…
Reference in a new issue