Les fichiers de la sonothèque bioacoustique "OQCQ"

Accueil

le son
les textes
les images


menu

introduction

L'informatique est l'un des outils les plus puissants et des plus pratiques pour archiver sons et documents associés: Cela était encore impensable dans les années 1980 qui voyaient déjà la sortie du DAT. Sans nous étendre sur les avantages de l'informatique, énumérons les principaux

- Performances: un ordinateur puissant équipé direct-to-disc est en fait un banc de montage direct-to-disc tout numérique entier, ce qui fait que les prises de son sur DAT ne subissent pas de pertes lors de multiples copies.

- Coût: un ordinateur puissant avec cartes son et logiciels est largement moins cher qu'un studio classique (d'ailleurs même dans les studios l'ordinateur devient de plus en plus présent et supplante le matériel classique: le point faible de l'ordinateur est le nombre d'effet en temps réel, (cela ne gêne guère que les musiciens sur scène)

- Facilité de travail: il suffit d'archiver des fichiers peu volumineux pour reprendre un travail en cours de route

- Facilité de tri et de mises à jour des documents annexes aux prises de son.. etc.


Les inconvénients sont l'évolution rapide des techniques, mais ce dernier n'est finalement pas propre à l'informatique (comparez avec l'évolution du matériel de prise de son, c'est pire encore).

L'archivage de données en numérique garantit cependant la survivance des données sonores: pour monter d'une technique ancienne à une plus récente il faudra copier les données: ce n'est pas grave, car transmises en numérique elles ne subiront pas de pertes, et les débits rapides des périphériques actuels aident cette opération.


Choisir des formats les plus universels possible pour les textes, images et les sons.

Écrit sous la norme iso9660 un CD contenant des waves et des textes peut être exploité par presque tous les ordinateurs (Mac, Linux, et Windows...)

Un CD contenant au contraire des fichiers propres à Paradox ou, à Microsoft word ou publisher, ne pourra être consulté qu'avec une machine disposant des même logiciels de la même version...

Règle de base à respecter avant tout: survivre à l'évolution informatique: tous les fichiers de base (archivage) doivent pouvoir être ouverts et consultés sans logiciel spécifique, mais avec les programmes inclus dans tous les systèmes d'exploitation (linux ou windows ou Mac Os...). par exemple nous pourrions utiliser Paradox pour trier et indexer les prises de son enfin de faciliter la recherche par thème (fiches)... Le travail de recherche peut aussi avec un minimum de méthode utiliser simplement la fonction "rechercher" sur un simple fichier de texte tout simple, il sera peut être plus fastidieux mais pourra être mené sur n'importe quelle machine n'importe où
Cela est important pour éviter les dépendances avec des logiciels évoluant si vite qu'il faudrait sans cesse refaire certains documents de la sonothèque sur Cdrom, en particuliers pour les textes.
D'autre part cela favorisera la facilité de l'échange de données: On ne s'étendra pas sur les éternels problèmes d'échanges de fichiers même entre plusieurs versions différentes du même logiciels (exemple Publisher 98 crée des fichiers que ne peuvent même pas ouvrir les possesseurs de Publischer 97. C'est après avoir soupésé toutes ces constatations que il a été décidé de noter l'essentiel: où et quand a été fait l'enregistrement dans le nom du fichier..


Le support audio de base est le CD audio, mais le CD-rom  est plus performant en correction d'erreur.

D'ici 10 à 15 ans, un support d'archivage à laser bleu ressemblant au CD-rom. Ces disques de près de 100Go pourraient justifier une copie de la sonothèque en ce format... le plus sur est cependant le double disque dur (2 disques durs redondants): le prix de stockage est identique au CD-rom.

Dans tous les cas une sauvegarde devrait être faite tous les 20 ans pour prévenir mla perte de donnée par dégradation chimique des CD-rom avec le temps...
 
  S'appuyer sur les systèmes d'exploitations les plus stables et, important les plus répandus: windows NT XP pro et LINUX... Pour la majorité des opérations d'archivages LINUX devrait suffire pour archiver et trier les prises de son brutes, ainsi que pour toute tache de bureautique. Windows peut servir à faire les travaux spécifiques de montages sonores avec certains logiciels commerciaux bien abouties, mais le coût élevé des licences limitera le nombre de postes au strict minimum (Les logiciels les mieux adaptés sont samplitude 2496 pour le montage, cool edit pro pour le tri et l'analyse). Linux et Windows NT peuvent partager les fichiers waves, textes, htlm et jpg pour les images. Il est fort probable que Linux s'impose dans un avenir proche. Le logiçiel gratuit "audacity" est un grand espoir pour au moins faire l'archivage.



Le son: fichiers waves.

Ne Jamais stocker dans un format compressé!

C'est eux qui représentent le son qui est codé sur 16 bits stéréo 44.1KHz: un CD-rom contient 60mn de son wave. (il reste un peu de place.) Ils sont acquis grâce au DAT et à un transfert direct à partir de la carte son numérique. Les archives sur CD-rom peuvent être relues par l'ordinateur 30 fois plus vite que la lecture audio normale, ce qui est intéressant pour tout travail ultérieur.
 Protocole de notation des waves: ils devront respecter le critère OQ (où? Quand?)
le nom de fichier sonore doit impérativement contenir les informations de date, jour, heure, minutes, code QRAloc (lieu).
l'heure doit être
l'heure solaire au début de la prise de son (pour faciliter les comparaisons)
à titre d'exemple, La prise de son faite le 03 septembre 1998 à 20h30 solaire, dans le carré JN25UTBA,
codé selon le QRA locator  sera noté comme ceci: 19980903_2030_JN25UTBA.wav .


Les pistes CD audio
A part dans le mode CD-texte; les pistes CD audio ne peuvent recevoir autre chose qu'un index numéroté.
Ces pistes sonores ne seront que la copie de fichiers wav, mais non des outils de travail: la correction d'erreur du CD audio étant beaucoup moins sure que celle des cd-rom mode1, des erreurs (sauts ou microcoupures peuvent être commises lors d'une lecture)
Le référencement se fera en faisant figurer le numéro de CD et d'index dans le descriptif du fichier d'indexation, le fichier dans lequel se trouve toutes les références des prises de son accumulées.
Par contre, sur les CD audio, on peut imaginer faire de temps à autre quelques montages sonores. On veillera alors à ce que les commentaires suivent dans la pochette du disque (édition de la TOC). Ces travaux peuvent alors être une première étape vers la création des bandes son de documentaires, encyclopédies multimédia, ou disques de découverte sonore...
 


les textes:

Le fichier index.txt des CDrom d'archivage.
Chaque CD rom contient un fichier listant les fichiers contenus dedans.

Ce fichier index.txt permet de faciliter les opérations de recherche et la mise à jour du fichier d'indexation: il contient simplement la liste des fichiers wav, avec le descriptif des informations annexes qui ont pu être récupérées avec les prises de son. En imaginant que l'on se trouve avec une pile de CD-rom, il suffit alors de "copier coller" tous les fichiers.txt dans un seul (plutôt que d'avoir à chercher une prise de son directement). Une fois ce fichier d'indexation obtenu, il suffit de chercher une channe de caractères.


Le fichier d'indexation principal.
C'est un  fichier texte au format .txt permettant la recherche en se servant simplement d'outils de recherche de base:
C'est l'équivalent du fichier index.txt d'un CD-rom étendu  à la sonothèque en entier: il est mis à jour par l'ajout du contenu des fichiers index.txt des nouveaux cd-rom, et également de commentaires au sujet des prises de son, récentes ou anciennes. On aura donc de plus en plus de mots clés et un descriptif pour chaque prise de son.
Sont également référencé les adresses de documents pouvant être rapportés aux prises de son.
Ce fichier est donc sans arrêt modifié: il sera inscrit sur un support réinscriptible (bande exabit par exemple). On peut s'attendre à ce que celui-ci devienne volumineux, mais ce n'est pas un problèmes pour les ordinateurs actuels. le format TXT est le moins encombrant et le plus universel (sous Linux on veillera cependant à convertir au format texte OEM, que windows et mac peuvent tous deux ouvrir).

HTLM ce format compatible avec tous les systèmes, même plus encore que le format texte peut servir à diriger des liens vers d'autres documents, doit ont rappeler que le concept de lien hypertexte a été immaginé et utilisé en premier par le CNRS?. Les avantages ne sont pas moindres: ce format permet des liens entre pages et l'insertions d'images; peu encombrant; universel. Cependant il est parfois difficile de récupérer le texte pour le mettre en forme dans d'autres documents (cela nécessite Star Office sous Windows ou Linux!). Il sera possible alors de faire des liens vers ces cibles, pour faire des rapprochements avec d'autres documents.


les images:
 

le format JPEG est un des plus reconnus, sinon il faut adopter le format TIF, qui n'est pas compressé.

On s'intéressera par exemple à des images de le terre vu par NOAA et datant du même jour, des images diapositives scannées de l'expédition. La compression JPG est préférable à la compression GIF, à encombrement égal, les teintes sont respectées.
une image JPG de 1Mo est largement suffisante pour donner un bon aperçu des lieux et être placée si possible avec les waves sur le même CD.
Pour de la qualité (en vue de publier des documents imprimés) il faudrait une image de 10Mo ou mieux une image au format TIF (60Mo). Avec près de 10 Millions de pixels (très peu compressée), ceci permet d'imprimer une carte IGN sur une feuille A4 en 21 29.7cm et en 600dpi (5000 par 7000 pixels),

tous les documents pouvant être notés compatibles (
Où? Quand?)  devront être référencés dans le fichier d'indexation: ils auront alors des chaînes de caractère en commun avec les fichiers wav qu'ils peuvent illustrer ou compléter et seront présents dans la recherche.



Pourquoi l'heure locale "solaire"?

Dans le cadre d'une sonothèque internationale; il deviendra vite fastidieux d'opérer une recherche du fuseau horaire adopté à telle année, dans tel pays, alors que seule l'heure solaire restera valable, immuable (même l'heure internationale peut changer!)
En effet: Seule l'heure solaire permet des comparaisons de comportement liés à l'heure entre deux endroits différents, simplement parce que la terre étant ronde, l'angle du soleil donc l'avancement de la journée diffère dés que l'on se déplace. Il est logique de favoriser la recherche des prises de son correspondantes à un même état d'avancement dans la journée. Cette notion peut être fondamentale dans les exemples suivants, non exhaustifs:

- Faire des statistiques sur l'heure de disparition des martinets dans différentes régions de France.
- Noter à quelle heure commence à chanter le merle avant le lever du soleil.
- Comparer les prises de son d'insectes à différents endroits et noter les heures de démarrage ou d'arrêt (qui souvent sont précises à une minute près d'un jour à l'autre!)... Noter comme cela hélas se fait trop souvent des horaires rigoureux à la minute près, mais en heure légale n'a plus de sens si le lieu n'est pas précisé, et si de plus on ne sait même pas si c'est l'heure d'hiver ou d'été qui est utilisée (car pour tout arranger, le changement d'heure ne se fait jamais aux mêmes dates!!!)
Selon que la prise de son a été faite en Bretagne ou dans les Vosges, il y a en fait 50mn d'écart pour la nature!!! (quand le soleil brille encore en Bretagne, il fait nuit dans les Vosges).

Pour obtenir l'heure solaire, il suffit d'ajouter à l'heure GMT la longitude EST  divisée par 360 puis multiplié par 24. (dans le cas de Longitude Ouest, on retranche). ! si on trouve 1.58 heures par exemple, cela  représente 1 heure + 0.58 fois 60mn  = 1h34mn non 1h58mn!!!.
Rappel: la longueur des jours donc des horaires de crépuscule varient selon la latitude, et le décalage entre l'heure solaire et l'heure GMT selon la longitude!!!
me contacter
menu