Il est recommandé d’élaborer un plan de gestion de données qui précisera, dès le début d’un projet de recherche, les données et les documents afférents qui seront à conserver et à protéger à l’aide de copies de sauvegarde.
Une bonne règle est celle du 3-2-1 : 3 copies, dont 2 copies de sauvegarde avec 1 copie hors site.
Idéalement, il faudrait conserver toutes les données de recherche jugées de qualité avec les documents afférents, c’est-à-dire : les métadonnées, les documents décrivant la méthodologie de collecte de données et de conception de la base de données, ainsi que les documents décrivant les façons d’utiliser ou de transformer la base de données.
À quelle fréquence les copies de sauvegarde doivent-elles être mises à jour?
- Il n’y a pas de règle générale sur la fréquence des mises à jour des copies de sauvegarde des bases de données. Lorsque le projet de recherche progresse et que de nouvelles données sont disponibles, les fichiers conservés doivent être régulièrement mis à jour.
- Par la suite, il est recommandé d’avoir et d'utiliser un plan de mise à jour qui peut faire un rappel automatique de révision pour déterminer si des modifications à la base de données ou à un des documents afférents seraient nécessaires.
Quelle technologie utiliser pour enregistrer et conserver les copies?
Puisque aucun type de technologie n’est parfait, il est recommandé d’utiliser plusieurs technologies pour copier une même base de données. Voici une liste des technologies courantes :
- Répertoires réseau : Ces répertoires sont placés sur des serveurs institutionnels qui sont normalement bien protégés et dont des copies de sauvegarde automatiques sont régulièrement effectuées.
- Disque dur d’ordinateur : C’est une technologie flexible tandis que la base de données est en élaboration, mais elle devrait être utilisée en complément avec une autre technologie, car le risque de bris ou de perte n’est pas négligeable.
- Instruments externes d’enregistrement (clés USB, CD, DVD) : Ce sont des produits abordables et particulièrement utiles à court terme, comme lors de déplacements. Toutefois, il est risqué d’utiliser uniquement ces technologies pour conserver une base de données à long terme, car leur durabilité est limitée et le risque de perte ou de vol est élevé.
- Services infonuagiques : Les services comme Dropbox, Google Drive ou OneDrive offrent de l’espace d’enregistrement gratuit ou à faible coût. Même si la plupart offrent des technologies de cryptage, la protection des données n’est pas assurée. En outre, la bande passante est limitée, ce qui peut restreindre l’utilisation de grandes bases de données. Finalement, le service est sujet à changement selon les orientations et la stabilité du fournisseur de service.
Quel format de fichier utiliser?
Il est important d’utiliser un format de fichier permettant une utilisation à long terme aisée de la base de données et ne nécessitant pas de conversion importante des données enregistrées. Il est recommandé d’utiliser des formats en logiciel libre (txt, csv, tab, mp3, flac, xml), idéalement avec un encodage Unicode (ex. UTF-8). Si la base de données inclut de nombreuses métadonnées, il est alors suggéré d’utiliser des formats structurés comme SPSS, SAS ou Stata.
Si vous utilisez un logiciel propriétaire, il est important de préciser lequel.