Les fichiers de la sonothèque bioacoustique "OQCQ"
introduction
L'informatique est l'un des outils les plus puissants et des plus pratiques pour archiver sons et documents associés: Cela était encore impensable dans les années 1980 qui voyaient déjà la sortie du DAT. Sans nous étendre sur les avantages de l'informatique, énumérons les principaux
- Performances: un ordinateur puissant équipé direct-to-disc est en fait un banc de montage direct-to-disc tout numérique entier, ce qui fait que les prises de son sur DAT ne subissent pas de pertes lors de multiples copies.
- Coût: un ordinateur puissant avec cartes son et logiciels est largement moins cher qu'un studio classique (d'ailleurs même dans les studios l'ordinateur devient de plus en plus présent et supplante le matériel classique: le point faible de l'ordinateur est le nombre d'effet en temps réel, (cela ne gêne guère que les musiciens sur scène)
- Facilité de travail: il suffit d'archiver des fichiers peu volumineux pour reprendre un travail en cours de route
- Facilité de tri et de mises à jour des documents annexes aux prises de son.. etc.
Les inconvénients sont l'évolution rapide des techniques, mais ce dernier n'est finalement pas propre à l'informatique (comparez avec l'évolution du matériel de prise de son, c'est pire encore).
L'archivage de données en numérique garantit cependant la survivance des données sonores: pour monter d'une technique ancienne à une plus récente il faudra copier les données: ce n'est pas grave, car transmises en numérique elles ne subiront pas de pertes, et les débits rapides des périphériques actuels aident cette opération.
Choisir des formats les plus universels possible pour les textes, images et les sons.
Écrit sous la norme iso9660 un CD contenant des waves et des textes peut être exploité par presque tous les ordinateurs (Mac, Linux, et Windows...)
Un CD contenant au contraire des fichiers propres à Paradox ou, à Microsoft word ou publisher, ne pourra être consulté qu'avec une machine disposant des même logiciels de la même version...
Règle
de base à respecter avant tout: survivre à l'évolution
informatique: tous les fichiers de base (archivage) doivent pouvoir
être ouverts et consultés sans logiciel spécifique,
mais avec les programmes inclus dans tous les systèmes
d'exploitation (linux ou windows ou Mac Os...). par exemple nous
pourrions utiliser Paradox pour trier et indexer les prises de son
enfin de faciliter la recherche par thème (fiches)... Le
travail de recherche peut aussi avec un minimum de méthode
utiliser simplement la fonction "rechercher" sur un simple
fichier de texte tout simple, il sera peut être plus fastidieux
mais pourra être mené sur n'importe quelle machine
n'importe où
Cela est important pour éviter les
dépendances avec des logiciels évoluant si vite qu'il
faudrait sans cesse refaire certains documents de la sonothèque
sur Cdrom, en particuliers pour les textes.
D'autre part cela
favorisera la facilité de l'échange de données:
On ne s'étendra pas sur les éternels problèmes
d'échanges de fichiers même entre plusieurs versions
différentes du même logiciels (exemple Publisher 98 crée
des fichiers que ne peuvent même pas ouvrir les possesseurs de
Publischer 97. C'est après avoir soupésé
toutes ces constatations que il a été décidé
de noter l'essentiel: où et quand a été fait
l'enregistrement dans le nom du fichier..
Le support audio de base est le CD audio, mais le CD-rom est plus performant en correction d'erreur.
D'ici 10 à 15 ans, un support d'archivage à laser bleu ressemblant au CD-rom. Ces disques de près de 100Go pourraient justifier une copie de la sonothèque en ce format... le plus sur est cependant le double disque dur (2 disques durs redondants): le prix de stockage est identique au CD-rom.
Dans
tous les cas une sauvegarde devrait être faite tous les 20 ans
pour prévenir mla perte de donnée par dégradation
chimique des CD-rom avec le temps...
S'appuyer sur les systèmes d'exploitations les plus stables
et, important les plus répandus: windows NT XP pro et
LINUX... Pour la majorité des opérations d'archivages
LINUX devrait suffire pour archiver et trier les prises de son
brutes, ainsi que pour toute tache de bureautique. Windows peut
servir à faire les travaux spécifiques de montages
sonores avec certains logiciels commerciaux bien abouties, mais le
coût élevé des licences limitera le nombre de
postes au strict minimum (Les logiciels les mieux adaptés sont
samplitude 2496 pour le montage, cool edit pro pour le tri et
l'analyse). Linux et Windows NT peuvent partager les fichiers waves,
textes, htlm et jpg pour les images. Il est fort probable que Linux
s'impose dans un avenir proche. Le logiçiel gratuit "audacity"
est un grand espoir pour au moins faire l'archivage.
Ne Jamais stocker dans un format compressé!
C'est
eux qui représentent le son qui est codé sur 16 bits
stéréo 44.1KHz: un CD-rom contient 60mn de son wave.
(il reste un peu de place.) Ils sont acquis grâce au DAT et à
un transfert direct à partir de la carte son numérique.
Les archives sur CD-rom peuvent être relues par l'ordinateur 30
fois plus vite que la lecture audio normale, ce qui est intéressant
pour tout travail ultérieur.
Protocole de notation
des waves: ils devront respecter le critère OQ (où?
Quand?)
le nom de fichier sonore doit impérativement
contenir les informations de date, jour, heure, minutes, code QRAloc
(lieu).
l'heure doit être l'heure
solaire au début
de la prise de son (pour faciliter les comparaisons)
à
titre d'exemple, La prise de son faite le 03 septembre 1998 à
20h30 solaire, dans le carré JN25UTBA,
codé selon le QRA locator
sera noté comme ceci: 19980903_2030_JN25UTBA.wav .
Les pistes CD
audio
A part dans le mode CD-texte; les pistes CD
audio ne peuvent recevoir autre chose qu'un index numéroté.
Ces pistes sonores ne seront que la copie de fichiers wav, mais
non des outils de travail: la correction d'erreur du CD audio étant
beaucoup moins sure que celle des cd-rom mode1, des erreurs (sauts ou
microcoupures peuvent être commises lors d'une lecture)
Le
référencement se fera en faisant figurer le numéro
de CD et d'index dans le descriptif du fichier d'indexation, le
fichier dans lequel se trouve toutes les références des
prises de son accumulées.
Par contre, sur les CD audio, on
peut imaginer faire de temps à autre quelques montages
sonores. On veillera alors à ce que les commentaires suivent
dans la pochette du disque (édition de la TOC). Ces travaux
peuvent alors être une première étape vers la
création des bandes son de documentaires, encyclopédies
multimédia, ou disques de découverte sonore...
Le
fichier index.txt des CDrom d'archivage.
Chaque CD rom
contient un fichier listant les fichiers contenus dedans.
Ce fichier index.txt permet de faciliter les opérations de recherche et la mise à jour du fichier d'indexation: il contient simplement la liste des fichiers wav, avec le descriptif des informations annexes qui ont pu être récupérées avec les prises de son. En imaginant que l'on se trouve avec une pile de CD-rom, il suffit alors de "copier coller" tous les fichiers.txt dans un seul (plutôt que d'avoir à chercher une prise de son directement). Une fois ce fichier d'indexation obtenu, il suffit de chercher une channe de caractères.
Le fichier d'indexation
principal.
C'est un fichier texte au format .txt
permettant la recherche en se servant simplement d'outils de
recherche de base:
C'est l'équivalent du fichier index.txt
d'un CD-rom étendu à la sonothèque en
entier: il est mis à jour par l'ajout du contenu des
fichiers index.txt des nouveaux cd-rom, et également de
commentaires au sujet des prises de son, récentes ou
anciennes. On aura donc de plus en plus de mots clés et un
descriptif pour chaque prise de son.
Sont également
référencé les adresses de documents pouvant être
rapportés aux prises de son.
Ce fichier est donc sans
arrêt modifié: il sera inscrit sur un support
réinscriptible (bande exabit par exemple). On peut s'attendre
à ce que celui-ci devienne volumineux, mais ce n'est pas un
problèmes pour les ordinateurs actuels. le format TXT est le
moins encombrant et le plus universel (sous Linux on veillera
cependant à convertir au format texte OEM, que windows et mac
peuvent tous deux ouvrir).
HTLM ce format compatible avec tous les systèmes, même plus encore que le format texte peut servir à diriger des liens vers d'autres documents, doit ont rappeler que le concept de lien hypertexte a été immaginé et utilisé en premier par le CNRS?. Les avantages ne sont pas moindres: ce format permet des liens entre pages et l'insertions d'images; peu encombrant; universel. Cependant il est parfois difficile de récupérer le texte pour le mettre en forme dans d'autres documents (cela nécessite Star Office sous Windows ou Linux!). Il sera possible alors de faire des liens vers ces cibles, pour faire des rapprochements avec d'autres documents.
le format JPEG est un des plus reconnus, sinon il faut adopter le format TIF, qui n'est pas compressé.
On
s'intéressera par exemple à des images de le terre vu
par NOAA et datant du même jour, des images diapositives
scannées de l'expédition. La compression JPG est
préférable à la compression GIF, à
encombrement égal, les teintes sont respectées.
une
image JPG de 1Mo est largement suffisante pour donner un bon aperçu
des lieux et être placée si possible avec les waves sur
le même CD.
Pour de la qualité (en vue de publier
des documents imprimés) il faudrait une image de 10Mo ou mieux
une image au format TIF (60Mo). Avec près de 10 Millions de
pixels (très peu compressée), ceci permet d'imprimer
une carte IGN sur une feuille A4 en 21 29.7cm et en 600dpi (5000 par
7000 pixels),
tous les documents pouvant être notés
compatibles (Où?
Quand?) devront
être référencés dans le fichier
d'indexation: ils auront alors des chaînes de caractère
en commun avec les fichiers wav qu'ils peuvent illustrer ou compléter
et seront présents dans la recherche.
Pourquoi
l'heure locale "solaire"?
Dans
le cadre d'une sonothèque internationale; il deviendra vite
fastidieux d'opérer une recherche du fuseau horaire adopté
à telle année, dans tel pays, alors que seule l'heure
solaire restera valable, immuable (même l'heure internationale
peut changer!)
En effet: Seule l'heure solaire permet des
comparaisons de comportement liés à l'heure entre deux
endroits différents, simplement parce que la terre étant
ronde, l'angle du soleil donc l'avancement de la journée
diffère dés que l'on se déplace. Il est logique
de favoriser la recherche des prises de son correspondantes à
un même état d'avancement dans la journée. Cette
notion peut être fondamentale dans les exemples suivants, non
exhaustifs:
-
Faire des statistiques sur l'heure de disparition des martinets dans
différentes régions de France.
- Noter à
quelle heure commence à chanter le merle avant le lever du
soleil.
- Comparer les prises de son d'insectes à
différents endroits et noter les heures de démarrage ou
d'arrêt (qui souvent sont précises à une minute
près d'un jour à l'autre!)... Noter comme cela hélas
se fait trop souvent des horaires rigoureux à la minute près,
mais en heure légale n'a plus de sens si le lieu n'est pas
précisé, et si de plus on ne sait même pas si
c'est l'heure d'hiver ou d'été qui est utilisée
(car pour tout arranger, le changement d'heure ne se fait jamais aux
mêmes dates!!!)
Selon que la prise de son a été
faite en Bretagne ou dans les Vosges, il y a en fait 50mn d'écart
pour la nature!!! (quand le soleil brille encore en Bretagne, il fait
nuit dans les Vosges).
Pour
obtenir l'heure solaire, il suffit d'ajouter à l'heure GMT la
longitude EST divisée par 360 puis multiplié par
24. (dans le cas de Longitude Ouest, on retranche). ! si on trouve
1.58 heures par exemple, cela représente 1 heure + 0.58
fois 60mn = 1h34mn non 1h58mn!!!.
Rappel: la longueur des
jours donc des horaires de crépuscule varient selon la
latitude, et le décalage entre l'heure solaire et l'heure GMT
selon la longitude!!!
me
contacter
menu