Er zijn veel methodes om geluid te digitaliseren. Vooral de laatste jaren zijn er een aantal efficiënte manieren bijgekomen. Deze nieuwe technologieën maken gebruik van eigenschappen van het menselijk oor en verwijderen delen uit het geluid die weinig bijdragen aan de perceptie van de toehoorder.
Pulscodemodulatie
De basis van de meeste digitale coderingen is pulscodemodulatie (PCM). Hierbij wordt, nadat het signaal door een laagdoorlaatfilter is gegaan, met een vaste frequentie monsters (samples) van het geluid genomen. Voor het bemonsteren gebruiken we een bemonster en houd (sample and hold) schakeling. De uitgang van deze schakeling is verbonden met een digitaal naar analoog omzetter. Aan de uitgang van deze keten krijgen we dus een reeks getallen, die we opslaan op schijf of versturen over een dataverbinding.
De oorspronkelijke analoge vorm krijgt na bemonstering een hoekige vorm. Hoe vaker we bemonsteren, hoe meer het bemonsterde signaal op het oorspronkelijke signaal lijkt.
Uit de digitale representatie van het bemonsterde signaal kunnen we weer het oorspronkelijke analoge signaal verkrijgen. Dit doen we door de digitale informatie om te zetten in een analoog signaal (digitaal naar analoog omzetting) en daarna door een laagdoorlaatfilter te sturen. Theoretisch hebben we dan zonder verlies het oorspronkelijke signaal weer verkregen.
Dit is uiteraard een theoretisch verhaal. De werkelijkheid is altijd weerbarstiger. De kwaliteit van deze totale keten wordt bepaald door:
- De filters;
- De (nauwkeurigheid van de) bemonsteringsfrequentie;
- De nauwkeurigheid van de bemonsteringsschakeling;
- De nauwkeurigheid van de analoog naar digitaal omzetting en vice versa.
De filters
Feitelijk gebruiken we hier een beperking van het menselijk oor. Er wordt vanuit gegaan dat boven bepaalde frequenties het menselijk oor geen geluid meer waarneemt. De filters moeten zeer scherp zijn of ver boven de hoorbare frequenties liggen. Kortom, het dient een ideaal filter te zijn. Dit bestaat helaas niet. Steile filters hebben vaak oscillatieverschijnselen en geven dan bijgeluiden. Met moderne filtertechnieken is dit tegenwoordig wel te beheersen.
De bemonsteringsfrequentie
De bemonsteringsfrequentie dient minimaal tweemaal de afsnijfrequentie van het filter te bedragen. Naarmate het filter minder stijl is, dient de bemonsteringsfrequentie dus hoger te liggen. De nauwkeurigheid en stabiliteit van de bemonsteringsfrequentie is ook belangrijk. Variaties in de bemonsteringsfrequentie zullen fouten tot gevolg hebben en dus resulteren in vervorming van het gereproduceerde signaal.
Verder dient de bemonsteringsfrequentie gelijk te zijn aan de frequentie bij het reproduceren. Zijn die niet gelijk dan is de frequentie van het oorspronkelijke signaal veranderd.
Bemonsteringsschakeling
Voor de bemonsteringsschakeling is het van belang dat hij snel de waarde bepaald van het monster en deze waarde voldoende lang vasthoudt. Afwijkingen zullen zich openbaren als vervorming van het signaal.
De analoog naar digitaal omzetting
Hoe groter de nauwkeurigheid van de analoog naar digitaal omzetting en vice versa, hoe beter de reproductie is van het oorspronkelijke signaal. Hebben we te weinig stapjes, dan nemen we dat waar als zogenaamde quantiseringsruis. Dit hoor je dus het eerst bij zwakke signalen. Ook dienen de stapjes voldoende reproduceerbaar te zijn.
Muziekkwaliteit
Voor muziek van goede (cd) kwaliteit kan men volstaan met een frequentiespectrum tot 20 kilohertz, een bemonsteringsfrequentie van 44,1 kilohertz en 16-bits. Dat zijn 65.536 stapjes. Voor hogere kwaliteit en om meer dynamiek aan te kunnen bij films is bij de DVD gekozen voor een bemonsteringsfrequentie van 96 kilohertz en 24-bits. In de praktijk wordt vaak 48 kilohertz en 16-bits gebruikt.
Pulscode modulatie wordt onder andere ook gebruikt om wave tabellen in de moderne synthesizer op te slaan.
Pulscodemodulatie (a-law en µ-law)
Bandbreedte was vroeger duur. Dus moest men zuinig omgaan met bandbreedte. In de telefonie is hoge kwaliteit niet het belangrijkste. Wat telt, is verstaanbaarheid. Om de kosten te drukken wordt daarom het frequentiespectrum beperkt tot 4 kilohertz en past men compressie bij het coderen en expansie bij het decoderen toe. Bij de analoog naar digitaal conversie kan men dan volstaan met 8-bits. Dat wil zeggen 256 stapjes. Deze techniek wordt ook bij Internet telefonie volgens het SIP protocol gebruikt. Waarom zijn er twee typen codering? Wel, de Europeanen en Amerikanen konden het niet eens worden over de keuze van de compressiekarakteristiek en hebben dus daardoor ieder een eigen standaard. De µ-law is de Amerikaanse standaard. De a-law wordt in Europa gebruikt en in de meeste landen buiten Amerika.
Deltamodulatie
Een andere manier om zuinig met bandbreedte om te gaan is deltapulscodemodulatie (DPCM). Hierbij wordt niet de bemonsterde waarde verzonden of opgeslagen, maar het verschil met het vorige monster. Bij spraak en muziek is het verschil tussen de twee monsters in de praktijk zodanig klein dat met een mindere nauwkeurigheid van de analoog naar digitaal omzetting kan worden volstaan. Een variant hierop is adaptieve deltapulscodemodulatie (ADPCM). Hierbij zijn de te coderen verschillen niet even groot. Voor muziek gaat het te ver om op deze details in te gaan.