-
Notifications
You must be signed in to change notification settings - Fork 0
WAVE
Le format WAVE (Waveform Audio File Format) dit également « WAV » en raison de son extension de fichier .wav est un format conteneur mis au point par Microsoft et IBM en 1991 afin de transporter des flux audio. Le format WAVE est construit conformément à la structure Resource Interchange File Format, c'est pourquoi on parle aussi parfois de « RIFF/WAVE ».
Le format WAVE est en théorie propriétaire car développé par des entreprises privées. En réalité, ce format et ses dérivés (WAVE RF64 et BWF notamment), eux totalement libres car maintenus par l'EBU (Eureopean Broadcast Union), ne connaissent aucune restriction d'utilisation : leurs spécifications sont publiées (CPO-DOC) et aucun brevet ne porte sur eux (CPO-LIB).
Les données audio PCM ont une profondeur d’échantillonnage de 4 à 32 bits. Les caractéristiques du flux PCM les plus courantes sont 16 bits / 44,1 kHz (qualité CD) et 24 bits / 88,2, 96 ou 192 kHz (haute qualité).
Jusqu'à Windows 2000, le format WAVE pouvait comprendre des données audio sur un ou deux canaux. À partir de Windows 2000 et sa version WAVE Format Extensible, le format supporte le multi-canal (et en particulier la présence de deux « pistes » audio alternatives, l'une stéréo, l'autre surround).
Le format WAVE peut également embarquer des flux PCM « très haute définition » avec une profondeur d'échantillonnage sur 24 bits et des fréquences d’échantillonnage de 352,8 kHz à 384 kHz. Ce type de flux audio, nommé DXD, est souvent utilisé dans les étapes intermédiaires de production de fichiers DSD.
Le format WAVE est très largement géré par les logiciels et matériels audiovisuels. Il est devenu un standard de facto et demeure aujourd'hui encore le format de prédilection pour la production musicale et audiovisuelle broadcast et l’archivage du son, qu'il soit nativement numérique ou numérisé (voir les Recommandations pour la production et la conservation des objets audionumériques produites par l'IASA TC-04).
L'emploi du format WAVE a été conçu pour le système d'exploitation Windows et est supporté par Linux ; son équivalent pour les systèmes d'exploitation Apple est l'AIFF (non compressé) / AIFC (compressé).
BWF (Broadcast Wave Format) : l'EBU a standardisé une extension du format WAVE qui lui ajoute un nouveau chunk (bloc) de données permettant de renseigner des métadonnées utiles à la production broadcast comme le timecode, la localisation, ou encore l'ajout de remarques sur la qualité de prise de son.
WAVE RF64, également nommé MBWF : le format WAVE (et le BWF) est limité à une taille de fichier de 4 Gio, ce qui peut être problématique dans certains domaines. Cette limite a été repoussée à 16 Eio avec le format WAVE RF64 (ou MBWF). Ce format, bien que reposant sur le format WAVE, n'est cependant pas rétro-compatible et nécessite par conséquent un lecteur adapté.
Sony WAVE64 : le nom parfois utilisé de « WAVE64 » désigne une variante propriétaire de WAVE développée par Sony.
Le plus souvent, le format WAVE embarque des flux audio PCM (pulse-code modulation) sans perte, mais il peut aussi contenir des flux audio compressés (avec perte) de type MP3, AC-3, MQA, ATRAC ou ADPCM. L'utilisation d'un conteneur WAVE pour transporter un flux audio compressé est néanmoins déconseillée : outre que le conteneur n'est pas particulièrement adapté à cette utilisation, elle peut induire en erreur l'utilisateur sur la nature du flux contenu.
Le format WAVE, reposant sur RIFF, a une structure extensible. Il peut donc être enrichi de chunks comportant des données ou des métadonnées de nature très différente, éventuellement propriétaires. Ces données ne sont pas supportées par tous les lecteurs et outils de manipulation, mais elles ne compromettent généralement pas la lecture du flux audio.
La documentation du format RIFF/WAVE est accessible via les documents suivants :
- Multimedia Programming Interface and Data Specifications 1.0 (voir pages 56-65) ;
- New Multimedia Data Types and Data Techniques (voir pages 12-22) ;
- Multiple Channel Audio Data and WAVE Files ;
- Sur le WAVE RF64 : MBWF / RF64: An extended File Format for Audio, spécification technique EBUTech 3306, Genève : EBU/UER, 2009 ;
- Sur le WAVE RF64 : Long-form file format for the international exchange of audio programme materials with metadata, recommandation ITU-R BS.2088, International Telecommunications Union, 2019.
La British Library a réalisé une évaluation de ce format pour la préservation à long terme.
Extension : généralement .wav, parfois .wave. Pour la variante RF64, .rf64.
Type MIME : Microsoft n'ayant pas soumis officiellement de RFC à l'IANA, plusieurs types MIME non officiels ont été adoptés :
-
audio/vnd.wave; -
audio/wav; -
audio/wave; -
audio/x-wav.
| Registre | Identifiant |
|---|---|
| Wikidata |
Q217570 pour le format de fichier RIFF/WAVE Q3241497 pour le codec PCM Q3928266 pour le format de fichier WAVE RF64 |
| Bibliothèque du Congrès |
fdd000001 pour le format de fichier RIFF/WAVE fdd000011 pour le codec PCM |
| PRONOM |
fmt/6 pour le format RIFF/WAVE fmt/712 pour le format RF64 |
| Just Solve the File Format Problem | WAVE |
Le flux audio PCM étant non compressé, les fichiers RIFF/WAVE sont d'une taille conséquente. Le format est donc particulièrement adapté dans les cas où l'espace de stockage n'est pas contraint et où, pour des besoins d'édition audio par exemple, les processus de compression / décompression sont problématiques.
Le format WAVE contenant un flux non compressé PCM est le format audio le plus simple (CPO-SIM), et un des plus stables (CPO-STA). Il est également assez robuste, la plupart des lecteurs étant capables de restituer un flux audio partiellement altéré. Néanmoins, contrairement aux formats destinés à être diffusés en streaming comme MP3 et FLAC, il ne permet pas d'embarquer des empreintes numériques internes (CPO-ROB).
Le format WAVE peut embarquer des métadonnées internes selon le formalisme RIFF tags.
La Federal Agencies Digitization Guidelines Initiative produit une recommandation visant à insérer des métadonnées minimales d'identification dans les fichiers WAVE issus d'une numérisation. Le sous-ensemble des RIFF tags défini par ces recommandations est éditable par l'outil BWF MetaEdit. Cette recommandation, dans sa version 3 draft au 22 avril 2021, présente des bonnes pratiques pour indiquer des points d'intérêt spécifiques (cue points) dans le flux audio, en utilisant les chunks cue et adtl (associated data list). Ces points peuvent être utilisés pour associer des métadonnées à une partie du flux ; ni la norme ni la recommandation ne limitent le type des métadonnées qui peuvent être ainsi insérées (techniques, comme une erreur de lecture du support original, ou descriptives, comme un changement d'orateur).
Le format étant extensible, il arrive parfois que l'on trouve également des chunks comportant des métadonnées internes aux formats ID3 ou XMP.
L'outil d'analyse et d'extraction de métadonnées techniques pour la BnF est MediaInfo, qui dispose d'une sortie native dans le format de métadonnées de caractérisation préféré par la BnF, MPEG-7.
Le module WAVE du logiciel JHOVE permet de valider la conformité de la structure des fichiers RIFF/WAVE au regard des spécifications du format. Il est conseillé d'utiliser des versions du logiciel postérieures à la version 1.20, version à partir de laquelle il est capable d'identifier des fichiers WAVE tronqués. Le module est également capable de repérer des chunks dont le type lui est inconnu. Néanmoins, le module ne contrôle pas le flux audio ; si ce dernier a été corrompu, JHOVE ne le signalera pas.
Plusieurs initiatives comme Lossless Audio Checker visent à élaborer des outils capables d'analyser si un flux dans un codec audio sans perte n'a effectivement pas subi d'opérations de sur-échantillonnage (upsampling) d'interpolation ou de conversion depuis un flux compressé. Ces outils sont pour la plupart encore à un stade de développement bêta.
La migration de supports opérée par la BnF ou par des prestataires sur les CD audio (pressés) et les CD-R reçus par dépôt légal est à l'origine d’un très grand nombre de fichiers WAVE conservés par la BnF. D’autres fichiers de ce type peuvent aussi avoir été reçus en dépôt légal sous forme nativement dématérialisée.
La première campagne de numérisation du plan de sauvegarde de la BnF débuté en 1997 était conservée sur CD-R (Gold). L’ensemble de ces documents numérisés au format « CD » (PCM - 16 bits - 44,1 kHz) a été par la suite transféré au format WAVE et stocké sur cartouches LTO.
Des fonds originaux de la BnF d’enregistrements musicaux, collectes, conférences et entretiens ont été enregistrés au format WAVE. Ils peuvent être issus de numérisation ou de recopie de supports numériques, comme par exemple de cassettes R-DAT.
Depuis 2009, l’ensemble des fichiers audio de numérisation patrimoniale sont au format WAVE (PCM - 24 bits - 96 kHz). Pour des enregistrements de longue durée, les fichiers sont au format WAVE RF64. Pour des enregistrements devant conserver des informations de synchronisation par timecode, le format de fichier BWF a été retenu.