Comment choisir l'échantillonage et la quantification de mon enregistrement?
VFA vous propose différents choix quant à la "qualité" des prestations de prise de son:
- valeurs d'échantillonages: 96 khz / 88.2 khz / 48 khz / 44.1 khz,
- quantification en: 32 bit Floating point / 24 bit / 16 bit.
Ces valeurs vont principalement jouer sur la "finesse" de l'enregistrement, le confort de mixage, sur la taille des fichiers informatiques contenant votre musique.
En faisant une recherche sur internet, vous trouverez toutes sortes d'avis sur l'utilité d'utiliser un échantillonnage et une quantification à l'enregistrement, de valeurs supérieures à celle du support final, qui sera souvent au mieux de 44,1 khz et de 16 bit, voire un mp3.
Pour VFA les meilleures valeurs sont celles qui vous conviennent.
Pour vous aider à les choisir, vous trouverez ci-dessous des éléments de réponse sur les principales caractéristiques de ces valeurs.
L'échantillonage
VFA vous propose 4 valeurs d'échantillonage:
- 96 khz,
- 88.2 khz,
- 48 khz,
- 44,1 khz.
A quoi correspondent-elles? Communément on considère que l'oreille humaine entend de 20 hz à 22,5khz au meilleur de sa forme. Le théorème d'échantillonnage de Nyquist-Shannon dit que pour obtenir une résolution agréable à l'écoute il faut doubler la fréquence d'échantillonage soit 44,1 khz, fréquence choisie comme norme pour les cds audio. On peut lire ailleurs que le choix de cette valeur serait lié au format des bandes VHS. Quoi qu'il en soit, cette valeur est théoriquement suffisante pour obtenir un signal audio de bonne qualité. Sauf que dans le cadre d'un enregistrement multipiste numérique vient s'ajouter un facteur de détérioration du son lié à la conversion du signal analogique vers un signal numérique puis numérique vers analogique.
La conversion
Ce schéma montre les opérations basiques de conversion pour un son capté par un micro, transmis sous la forme d'un signal analogique par un câble le reliant au mixeur numérique Presonus RM32 AI de VFA, ou il est convertit en signal numérique. Ensuite il peut être reconverti immédiatement en signal analogique pour l'écoute directe dans les casques des musiciens ou sur le système d'écoute (pour le mixage par exemple). Pour cet usage des plus simples le signal à déjà subit deux conversions. Ou alors il peut être gravé sur un support tel qu'un CD, gardant son caractère numérique après avoir subit une première conversion, mais devant en subir une autre à la lecture pour fournir un signal analogique au système hi-fi. Le son subira donc au minimum deux conversions. Les conversions sont génératrices de bruit. Des filtres permettent de le réduire de façon à le rendre imperceptible à l'écoute. Si les convertisseurs sont de bonne qualité, ces opérations s'effectuent sans problème en 44,1 khz puisque cette valeur à été choisie pour laisser suffisamment de marge aux filtres pour travailler.La chose se complique lors du mixage de plusieurs sources converties, en particulier si le son est traité à l'aide d'effets numériques, qui nécessitent souvent encore des conversions. La meilleure solution pour se mettre à l'abri de problèmes liés à la multiplication des conversions, consiste alors à augmenter la marge en élevant la fréquence d'échantillonage. La capacité de stockage nécessaire peut alors plus que doubler (voir cet article) mais la garantie de pouvoir mener à bien son projet sans problème est à ce prix. Dans un contexte de prise de son "studio" avec traitement et mixage numérique, sont donc préférées les fréquences d'échantillonages:
De ce point de vue l'échantillonage en 48 khz équivaut quasiment le 44,1 khz, mais correspond aux besoins de la télévision. Il est par contre souvent associé à une quantification en 24 bit qui améliore le rendu et nous amène à: |
La quantification
VFA vous propose trois valeurs de quantification:
- 32 bit Floating Point,
- 24 bit,
- 16 bit.
Ces différentes valeurs vont définir la précision d'encodage de l'amplitude du signal et la plage dynamique de l'enregistrement. La valeur 16 bit est a priori suffisante pour restituer fidèlement une prise de son puisque c'est la norme choisie pour l'encodage sur cd. Pourquoi vous proposer des valeurs supérieures?
Là encore, l'enregistrement de sources multiples dans l'intention des les mixer demande une plus grande précision d'encodage. Encoder en 24 bit permet une plus grande finesse de conversion du signal analogique en signal numérique. Cette opération consiste à transformer une onde en une série d'échantillons dont l'amplitude est définie par paliers. Le convertisseur choisira le palier le plus proche de la valeur réelle pour l'encoder. Le nombre de paliers (résolution) et donc la précision de l'encodage se détermine à l'aide de la formule:
où "n" est la valeur de quantification en bit. |
Ce qui concrètement donne pour 16 bit : 65536 paliers ou valeurs possibles et pour 24 bit: 16777216. Soit 256 fois plus de valeurs possibles en 24 bit qu'en 16 bit pour encoder la même plage dynamique. Ce gain en fidélité s'accompagne de plus d'un autre avantage majeur lié au signal numérique: l'augmentation de la plage dynamique.
Un des inconvénients majeur de l'enregistrement puis du traitement (utilisation d'effets, mixage, masterisation...) analogique de la musique, est l'apparition d'un phénomène de détérioration du son lorsque l'on approche ou dépasse la limite de la plage de dynamique: la distorsion. Utilisé avec finesse ce défaut peut servir à "colorer" le son d'une piste ou un mixage. Mal maitrisé il peut s'avérer fatidique. Ce phénomène n'a pas d'équivalent dans le domaine numérique. Si la limite de la plage dynamique est dépassé, le signal ne peut être convertit correctement engendrant un "clipping". Le "clip" est le bruit produit à la place du son qui n'a pu être traité.
Pour éviter ces problèmes la même solution peut être appliquée aux deux techniques: enregistrer à des niveaux plus faibles de façon à se laisser une marge pour appliquer des effets, mixer et masteriser, opérations qui augmentent (souvent volontairement) la dynamique. Mais cette astuce à une limite dans le domaine analogique: si le niveau enregistré est trop bas, le signal peut devenir trop faible par rapport au bruit de fond ("souffle",résonances,...) présent dans toutes prises de son, ce qui rendra difficile le traitement des pistes. Ce problème existe aussi dans le domaine numérique mais peut être anticipé en augmentant la plage dynamique! Le format 16 bit permet 96 db (16 x 6db) de plage dynamique sans perception notable du bruit de fond. Le format 24 bit permet quant à lui 144 db! Soit une marge de manœuvre de 48 db sans le moindre risque de détérioration du signal! Le site "Sound on sound" a publié un article intéressant à ce sujet, confrontant la théorie à la pratique. Vous le trouverez sur cette page. Vous y trouverez aussi les avantages du format 32 bit Floating point par rapport à des valeurs plus faible et sans virgule flottante. Pour simplifier, ce choix de quantification permet de s'approcher bien plus de la valeur analogique lors de sa conversion, et de se ménager une marge de traitement quasi-infinie puisque la plage dynamique atteint les 1500 db. Il est aussi intéressant de souligner le fait que la plupart des logiciels professionnels qui vous permettront de traiter au mieux vos pistes disposent de modules d'effets et des outils de masterisation travaillant en 32 bit Floating Point. Utiliser ce format dès la prise de son dispense votre logiciel de faire des conversions lorsque vous les utiliser.
Une fois de plus le gain en confort et qualité se paie par de la capacité de stockage: les fichiers codés en 32 bit Floating point sont 2 fois (le 24 bit une fois et demie) plus volumineux qu'un fichier codé en 16 bit pour une durée d'enregistrement équivalente, comme le montre ce tableau. Toutefois ce critère est le dernier à retenir pour le choix des valeurs d'échantillonage et de quantification, puisque le stockage et la gestion de fichiers volumineux se font sans problèmes sur un ordinateur moderne.
En résumé, pour choisir vos valeurs posez-vous la question de vos besoins:
- votre enregistrement n'est pas destiné à être profondément retravaillé ultérieurement et restera assez brut: Vous pouvez opter pour la simplicité et le faible encombrement du format 16 bit / 44,1 khz,
- vous voulez pouvoir tirer le meilleur de la prise de son et être en mesure de produire et diffuser votre musique comme vous l'entendez: choisissez le format "pro" 32 bit / 96 khz!
Entre ces deux valeurs, vous disposez de toute une gamme de formats qui vous permettront de choisir en fonction:
- du ou des logiciels que vous pensez utiliser pour votre musique. Renseignez-vous auprès du(des) fabricant(s) pour savoir ce qu'il(s) préconise(nt),
- des besoins de l'éventuelle personne qui fera le mixage et/ou la masterisation,
- des standards utilisés par les professionnels auxquels vous ferez éventuellement appel.