corrections postcours
Some checks failed
Tests / build (18) (push) Has been cancelled
Tests / build (20) (push) Has been cancelled

This commit is contained in:
diegantobass 2025-11-25 15:16:07 +01:00
parent 92409d0ff3
commit 235fe55857
2 changed files with 20 additions and 32 deletions

View file

@ -10,7 +10,6 @@ diego.antolinos@unine.ch
- Research software engineer à l'AJM - Research software engineer à l'AJM
- Formation de linguiste-informaticien - Formation de linguiste-informaticien
- Je code pour des chercheurs en sciences sociales - Je code pour des chercheurs en sciences sociales
- [let-me-google-myself-for-you](https://www.google.com/search?q=diego+antolinos+basso)
- -
@ -79,10 +78,13 @@ Différents types de données impliquent différents outils, hypothèses, traite
- -
Tableau de chiffres
![tableur](images/tableur.jpg) ![tableur](images/tableur.jpg)
- -
Entretien retranscrit
\- Locuteur A : Alors moi, perso, quand je travaillais à \<Entreprise 1\> j'ai eu à gérer plusieurs cas assez bordeline \<inaudible\> ça impliquait toujours la même personne \- Locuteur A : Alors moi, perso, quand je travaillais à \<Entreprise 1\> j'ai eu à gérer plusieurs cas assez bordeline \<inaudible\> ça impliquait toujours la même personne
\- Locuteur B : \<rires\> Je serais intéressé par connaître le profil de la personne ! \- Locuteur B : \<rires\> Je serais intéressé par connaître le profil de la personne !
@ -91,22 +93,27 @@ Différents types de données impliquent différents outils, hypothèses, traite
- -
Carte
![aubervilliers](images/auber_inegalites.png) ![aubervilliers](images/auber_inegalites.png)
- -
Données geocodées
![geojson](images/geojson.jpeg) ![geojson](images/geojson.jpeg)
- -
Le format JSON
![json](images/json.jpeg) ![json](images/json.jpeg)
- -
Du HTML
![html](images/html.jpeg) ![html](images/html.jpeg)
- -
Des images
![images](images/images.jpeg) ![images](images/images.jpeg)
- -
@ -117,9 +124,9 @@ Sources journalistiques versus sources scientifiques ?
- -
Un article et ses métadonnées
![article](images/article.jpeg) ![article](images/article.jpeg)
------ ------
# Étapes # Étapes
@ -197,12 +204,8 @@ _Conseil : noter/(re)formuler vos pistes et intuitions_
- -
### ??? ### + Documentation
Tout au long d'un travail de recherche, à chaque étape, il faut documenter ses choix
-
### Documentation
Tout au long d'un travail de recherche, il faut documenter ses choix
------ ------
@ -244,19 +247,6 @@ _Pandemic Data : Production, diffusion et compréhension des données en temps d
- -
- Hypothèses de Panda
- 5 sources différentes : ArcInfo, Le Temps, Heidi News, Tribune de Genève, RTS, 24 Heures
- Données fournies + scrapées avec Python
- Partage spreadsheets, csv, notebooks, github...
- Contrôle outillé (Python, xan) + manuel
- Plein d'outils : Iramuteq, beautifulSoup, xan...
- Enrichissement + croisement + données secondaires
- Analyse de texte, analyse de séquences
- Visualisation d'exploration + analyse
- Papiers de recherche en préparation + entrepôt de données de l'UniNE
-
### Hypothèses ### Hypothèses
Les manières dont les chiffres, les statistiques et les dataviz sont utilisées dans les articles de presse nous informent sur les pratiques journalistiques Les manières dont les chiffres, les statistiques et les dataviz sont utilisées dans les articles de presse nous informent sur les pratiques journalistiques
@ -267,24 +257,26 @@ Les communiqués de presse sont une donnée officielle, régulière, fiable, et
- -
### Admin.ch ### Admin.ch
Un site gouvernemental cassé parmi tant d'autres (flux rss) Un site gouvernemental cassé parmi tant d'autres
Les emails de contacts ne donnent rien... Que faire ? Les données sont consultables en lignes, mais pas téléchargeables
- -
### Scraping et mise en forme ### Scraping et mise en forme
(HTML + code + csv) Le scraping permet de récupérer des données structurées depuis un site internet
Attention le code est souvent "ad-hoc" : il faut analyser le html pour structurer ses données de sorties
- -
### Analyse de texte ### Analyse de texte
(Code + principes) On répère avec un algorithme simple des mots-clés dans les texte pour catégoriser les communiqués et compter les prises de paroles officielles sur les sujets "covid"
- -
### Visualisation des résultats ### Visualisation des résultats
(Timelines des indicateurs) ![timeline](images/timeline.png)
------ ------
@ -293,7 +285,7 @@ Les emails de contacts ne donnent rien... Que faire ?
- -
### Open Refine ### Open Refine
- Excel sous stéroïdes - Un Excel sous stéroïdes
- Explorer, contrôler, enrichir - Explorer, contrôler, enrichir
- [openrefine.org](https://openrefine.org/) - [openrefine.org](https://openrefine.org/)
@ -307,7 +299,7 @@ Les emails de contacts ne donnent rien... Que faire ?
### Open QDA ### Open QDA
- Analyse qualitative, codage d'entretien - Analyse qualitative, codage d'entretien
- Pas de fonction d'analyses avancées - Pas de fonction d'analyses/visualisations avancées
- [openqda.org](https://openqda.org/) - [openqda.org](https://openqda.org/)
- -
@ -341,10 +333,6 @@ Utiliser de nouvelles méthodes demande rigueur
On abandonne pas la déontologie en chemin On abandonne pas la déontologie en chemin
-
### Des idées ?
------ ------
[Bibliographie](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/bibliographie.md) [Bibliographie](https://weave.andrezieux.de/dab/AJM_digitalmethods_course/src/branch/main/bibliographie.md)

BIN
images/timeline.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 64 KiB