Date de publication
20 Février 2021

Mise à jour des fichiers de base de données téléchargeables (csv)

Cela fait quelques années que le GEIPAN propose en téléchargement des fichiers d’archive pour l'ensemble des cas et témoignages publiés sur son site. Avec la fusion des bases ces fichiers évoluent.

Mise à jour des fichiers de base de données téléchargeables (csv)


Cela fait quelques années que le GEIPAN propose en téléchargement des fichiers d’archive pour l'ensemble des cas et témoignages publiés sur le site (menu « recherche de cas »). Or, comme nous vous l’avions précédemment annoncé, le GEIPAN a fait évoluer son système de base de données (voir l'historique des évolutions des bases du GEIPAN en fin d’article). Et, ces fichiers d’archive en téléchargement n’avaient pas encore été convertis à notre nouveau format de base.

 

Nous vous proposons aujourd’hui de découvrir leur mise à jour. Au format .csv ils peuvent être importés dans des systèmes de gestion de base de données ou des tableurs. Ils permettront à tous ceux qui le souhaitent de réaliser des études sur les cas du GEIPAN.

 
Ce que vous y trouverez
 

Les données téléchargeables se présentent en deux fichiers :

  • Un fichier .csv présentant les données au niveau [cas]
  • Un fichier .csv présentant les données au niveau [temoignages] et [observations]

Des informations détaillées sur leur contenu sont disponibles en fin d’article : nous joignons un fichier Excel dans lequel nous décrivons les tables de données utilisées, leurs relations, la description des champs liés. 

 

Notez que, compte tenu du grand nombre de demandes habituellement reçues par le GEIPAN, nous ne serons pas en mesure de répondre aux questions que vous vous poseriez sur ceux-ci. Néanmoins, si vous avez des remarques, n’hésitez pas à nous les communiquer : nous essayerons, dans la mesure du possible d’en tenir compte. 

 
 
Remarques complémentaires
 

1. Vous observerez que dans ces fichiers, de nombreux champs apparaissent encore vides 

 

Outre les manques toujours possibles, il y a deux raisons principales à cela : 

  • La première est liée à l’évolution des témoignages depuis l'ancienne base Access vers la nouvelle base de données, qui a conduit à l’ajout de nouveaux champs, mais aussi de nouvelles références qui n’existaient pas originellement. A moins de refaire les enquêtes, ces champs pour les anciens témoignages et cas continueront à apparaître vides. 
  • Toutes les données présentées ne sont pas toujours utiles à une enquête, et certaines enquêtes suivent un processus de classification simplifié. Pour ces derniers, tous les champs ne sont pas toujours remplis.
  • Rien n’empêchera - et nous l’espérons - que ces champs soient progressivement complétés dans le futur, éventuellement par des systèmes de traitement automatique. En attendant, plutôt que de les masquer, nous avons préféré les publier en l'état.

 

2. Certains champs de données ne sont pas exportés 

 

Cela est volontaire quand:

  • Il s’agit de données liées au processus interne de traitement du GEIPAN
  • Il s’agit de données liées à la confidentialité du témoin 

Les données anonymisées sont indiquées dans le fichier Excel joint.

De plus, toujours pour des questions d'anonymisation, certains champs ont été publiés mais sont filtrés :

  • Les latitudes et longitudes sont arrondies à 1/10° de degré près, ce qui représente environ 10km d’approximation en France Métropolitaine
  • Les catégories socio-professionnelles INSEE exportées sont présentées au niveau 2 de la nomenclature (24 catégories) ou au niveau 1 lorsque la précision n'était pas suffisante (voir l’onglet "~tem_activite_socio_pro" du fichier excel joint
  • L’âge des témoins est ventilé par tranches de 10 années

3. Des données spécifiques ne sont actuellement pas exportées mais le seront prochainement :

  •  Les récits libres complets : ils sont toujours en cours de relecture. Ils sont d'un grand intérêt car ils représentent la matière essentielle au travail d’enquête. De fait, ils demandent une vérification plus appuyée, de manière à ne pas porter atteinte à la confidentialité des témoins
  • Les données des tables complémentaires (météo, avions) qui demandent des traitements spécifiques pour les rendre lisibles

Documents de référence