Marele mit audio: de ce nu ai nevoie de acel DAC pe 32 de biți

Autor: Randy Alexander
Data Creației: 1 Aprilie 2021
Data Actualizării: 1 Iulie 2024
Anonim
DOCUMENTAR RECORDER. 30 de ani de democrație
Video: DOCUMENTAR RECORDER. 30 de ani de democrație

Conţinut


După cum probabil ați observat, există o nouă tendință în industria smartphone-urilor, inclusiv includerea cipurilor audio de „calitate de studio” în interiorul smartphone-urilor moderne. Deși un DAC pe 32 de biți (convertor digital în analog) cu suport audio de 192 kHz, cu siguranță arată bine pe foaia de specificații, pur și simplu nu are niciun beneficiu să creștem dimensiunea colecțiilor noastre audio.

Sunt aici pentru a explica de ce această lățime a bitului de profunzime și rata de eșantion este doar o altă instanță a industriei audio care profită de lipsa de cunoștințe pentru consumatori și chiar audiofili pe această temă. Donează-ți capetele de tocilar, vom intra în câteva puncte serios tehnice pentru a explica aspectele și ieșirile audio audio pro. Și să sperăm că îți voi dovedi și de ce ar trebui să ignori majoritatea hype de marketing.

Auzi aia?

Înainte de a ne afunda, acest prim segment oferă câteva informații de fundal necesare despre cele două concepte principale de audio digital, profunzime de biți și rata de eșantion.


Rata de eșantion se referă la cât de des urmează să surprindem sau să reproducem informații despre amplitudine despre un semnal. În esență, tăiem o formă de undă în multe părți mici pentru a afla mai multe despre ea la un moment dat specific. Teorema lui Nyquist afirmă că cea mai mare frecvență posibilă care poate fi capturată sau reprodusă este exact jumătate din rata de eșantion. Acest lucru este destul de simplu de imaginat, deoarece avem nevoie de amplitudinile pentru partea superioară și inferioară a formei de undă (care ar necesita două probe) pentru a cunoaște cu exactitate frecvența acesteia.

Creșterea ratei eșantionului (sus) duce la eșantioane suplimentare pe secundă, în timp ce o adâncime de biți mai mare (partea de jos) oferă mai multe valori posibile pentru a înregistra eșantionul la.

În ceea ce privește sunetul audio, ne preocupăm doar de ceea ce putem auzi și de marea majoritate a auzurilor ascunse ale oamenilor chiar înainte de 20kHz. Acum că știm despre Teorema lui Nyquist, putem înțelege de ce 44,1kHz și 48kHz sunt frecvențe obișnuite de eșantionare, întrucât sunt puțin peste două ori față de frecvența maximă pe care o putem auzi. Adoptarea standardelor de calitate de studio de 96kHz și 192kHz nu are nicio legătură cu captarea datelor de frecvență mai mare, ceea ce ar fi inutil. Dar ne vom cufunda în mai multe lucruri într-un minut.


Deoarece analizăm amplitudinile de-a lungul timpului, adâncimea de biți se referă pur și simplu la rezoluția sau numărul de puncte disponibile pentru a stoca aceste date de amplitudine. De exemplu, 8 biți ne oferă 256 de puncte diferite la rezultate rotunde, 16 biți în 65.534 de puncte, iar date în valoare de 32 de biți ne oferă 4.294.967.294 puncte de date. Deși, evident, acest lucru mărește considerabil dimensiunea oricăror fișiere.

Ar putea fi ușor să ne gândim imediat la adâncimea de biți în ceea ce privește exactitatea amplitudinii, dar conceptele mai importante de înțeles aici sunt cele ale zgomotului și ale distorsiunii. Cu o rezoluție foarte scăzută, probabil vom lipsi bucăți de informații de amplitudine mai mică sau vom tăia vârfurile formelor de undă, ceea ce introduce inexactitatea și denaturarea (erori de cuantizare). Interesant, acest lucru va răsuna adesea ca zgomot dacă ar fi să redați un fișier cu rezoluție joasă, deoarece am mărit efectiv dimensiunea celui mai mic semnal posibil care poate fi capturat și reprodus. Aceasta este exact aceeași cu adăugarea unei surse de zgomot la forma noastră de undă. Cu alte cuvinte, scăderea adâncimii biților scade, de asemenea, podeaua zgomotului. De asemenea, ar putea ajuta să ne gândim la acest lucru în termeni de eșantion binar, unde bitul cel mai puțin semnificativ reprezintă podeaua zgomotului.

Prin urmare, o adâncime de biți mai mare ne oferă o podea de zgomot mai mare, dar există o limită finită a cât de practic este acest lucru în lumea reală. Din păcate, există zgomot de fond peste tot și nu mă refer la autobuzul care trece pe stradă. De la cabluri la căști, tranzistoarele dintr-un amplificator și chiar urechile din interiorul capului, raportul semnal maxim la zgomot în lumea reală este în jur de 124dB, ceea ce înseamnă o valoare de aproximativ 21 de biți.Jargon Buster:

DAC- Un convertor digital-analog ia date audio digitale și o transformă într-un semnal analogic pentru a trimite căști sau difuzoare.

Rata simpla- Măsurat în Hertz (Hz), acesta este numărul de eșantioane de date digitale capturate în fiecare secundă.

SNR- Raportul semnal-zgomot este diferența dintre semnalul dorit și zgomotul de fundal al sistemului. Într-un sistem digital, acesta este legat direct de adâncimea de biți.

Pentru comparație, captarea de 16 biți oferă un raport semnal / zgomot (diferența dintre semnal și zgomotul de fundal) de 96,33 dB, în timp ce 24 biți oferă 144,49 dB, care depășește limitele de captare hardware și percepția umană. Deci DAC-ul dvs. pe 32 de biți va fi capabil să scoată cel mult 21 de biți de date utile, iar ceilalți biți vor fi mascați de zgomotul circuitului. Cu toate acestea, în realitate, echipamentele cu prețuri moderate sunt superioare cu un SNR de 100 până la 110 dB, deoarece majoritatea celorlalte elemente de circuit își vor introduce propriul zgomot. În mod clar, fișierele pe 32 de biți par deja destul de redundante.

După ce am înțeles elementele de bază ale audio digitalului, să trecem la unele dintre punctele mai tehnice.

Drumul către Rai

Majoritatea problemelor legate de înțelegerea și concepția greșită a sunetului sunt legate de modul în care resursele educaționale și companiile încearcă să explice beneficiile folosind indicii vizuale. Probabil ați văzut toate reprezentările audio ca o serie de trepte de scară pentru linii cu adâncime de biți și dreptunghiulare pentru rata probei. Cu siguranță, acest lucru nu arată foarte bine atunci când îl compari cu o formă de undă analogă cu aspect neted, așa că este ușor să descoperiți scări mai „fine”, cu aspect mai fin, pentru a reprezenta o formă de undă mai precisă.

Deși ar putea fi o vânzare ușoară pentru public, această analogie comună a exactității „scărilor” este o misiune foarte mare și nu reușește să aprecieze modul în care funcționează de fapt audio digital. Ignora.

Cu toate acestea, această reprezentare vizuală reprezintă greșit modul în care funcționează audio. Deși poate părea dezordonat, matematic datele sub frecvența Nyquist, care reprezintă jumătate din rata de eșantionare, au fost surprinse perfect și pot fi reproduse perfect. Imaginează asta, chiar și la frecvența Nyquist, care poate fi adesea reprezentată ca o undă pătrată, mai degrabă decât o undă sinusoidală lină, avem date exacte pentru amplitudinea la un moment dat specific, care este tot ce avem nevoie. Noi, oamenii, adesea analizăm spațiul dintre eșantioane, dar un sistem digital nu funcționează în același mod.

Adâncimea de biți este adesea legată de precizia, dar chiar definește performanța zgomotului sistemelor. Cu alte cuvinte, cel mai mic semnal detectabil sau reproductibil.

Atunci când vine vorba de redare, acest lucru poate deveni un pic mai complicat, din cauza conceptului ușor de înțeles de DAC-uri „de reținere de ordin zero”, care va schimba pur și simplu între valori la o rată de eșantion stabilită, producând un rezultat în trepte de scară. Acesta nu este de fapt o reprezentare corectă a modului în care funcționează DAC-urile audio, dar în timp ce suntem aici, putem folosi acest exemplu pentru a demonstra că nu ar trebui să vă preocupați de aceste scări.

Un fapt important de remarcat este faptul că toate formele de undă pot fi exprimate ca suma mai multor unde sinusoidale, o frecvență fundamentală și componente suplimentare la multipli armonici. O undă triunghiulară (sau o treaptă de scară) constă în armonice impare la diminuarea amplitudinilor. Deci, dacă avem o mulțime de pași foarte mici care au loc la rata noastră de eșantionare, putem spune că există un anumit conținut suplimentar armonic, dar apare la dubla frecvență audibilă (Nyquist) și probabil câteva armonice dincolo de asta, așa că am câștigat oricum nu le voi putea auzi. În plus, acest lucru ar fi destul de simplu de a filtra folosind câteva componente.

Dacă separăm probele DAC, putem observa cu ușurință că semnalul dorit este perfect reprezentat împreună cu o formă de undă suplimentară la rata probei DAC.

Dacă acest lucru este adevărat, ar trebui să putem observa acest lucru printr-un experiment rapid. Să luăm o ieșire direct dintr-un DAC de bază pentru a menține un zero de bază și să alimentăm și semnalul printr-un foarte simplu 2nd comandați filtru de trecere scăzut setat la jumătatea ratei noastre de eșantion. De fapt, am folosit aici un semnal pe 6 biți, doar pentru a putea vedea efectiv ieșirea pe un osciloscop. Un fișier audio de 16 biți sau 24 de biți ar avea mult mai puțin zgomot atât înainte, cât și după filtrare.

Un exemplu destul de grosolan, dar acest lucru dovedește punctul în care datele audio sunt perfect recreate în această scară cu aspect dezordonat.

Și parcă prin magie, scara care pășea aproape complet a dispărut, iar ieșirea este „netezită”, doar folosind un filtru de trecere joasă care nu interferează cu ieșirea de unde sinusoidale. În realitate, tot ce am făcut este să filtrăm părți ale semnalului pe care oricum nu le-ai fi auzit. Acesta nu este într-adevăr un rezultat rău pentru alte patru componente care sunt practic libere (doi condensatori și două rezistențe costă mai puțin de 5 pence), dar există de fapt tehnici mai sofisticate pe care le putem folosi pentru a reduce acest zgomot și mai departe. Mai bine, acestea sunt incluse ca standard în majoritatea DAC-urilor de bună calitate.

Tratând un exemplu mai realist, orice DAC pentru utilizare cu audio va avea, de asemenea, un filtru de interpolare, cunoscut și sub denumirea de prelevare de probe. Interpolarea este pur și simplu o modalitate de a calcula punctele intermediare între două probe, astfel încât DAC-ul dvs. face de fapt o mulțime de această „netezire” de unul singur și cu atât mai mult decât dublarea sau cuadruplarea ratei probei. Mai bine, nu ocupă niciun spațiu suplimentar pentru fișiere.

Filtrele de interpolare găsite în mod obișnuit în orice DAC în valoare de sare sunt o soluție mult mai bună decât transportarea fișierelor cu rate de eșantionare mai mari.

Metodele pentru a face acest lucru pot fi destul de complexe, dar în esență DAC-ul dvs. își schimbă valoarea de ieșire mult mai des decât ar sugera frecvența de eșantion a fișierului dvs. audio. Acest lucru împinge armele inaudibile ale treptei scării mult în afara frecvenței de eșantionare, permițând utilizarea unor filtre mai lente, mai ușor realizabile, care au mai puțin ondulare, păstrând, așadar, biții pe care dorim să-i auzim de fapt.

Dacă sunteți curios de ce dorim să eliminăm acest conținut pe care nu îl putem auzi, simplul motiv este că reproducerea acestor date suplimentare mai departe în lanțul de semnal, să spunem într-un amplificator, ar risipi energie. Mai mult, în funcție de alte componente din sistem, acest conținut de „ultra-sonic” de frecvență mai mare ar putea duce de fapt la cantități mai mari de distorsionare a intermodulării în componente de lățime de bandă limitată. Prin urmare, fișierul dvs. de 192 kHz ar provoca probabil mai mult rău decât bine, dacă în aceste fișiere ar exista conținut ultra-sonic.

Dacă mai este nevoie de o dovadă suplimentară, voi arăta și o ieșire dintr-un DAC de înaltă calitate utilizând Circus Logic CS4272 (ilustrat în partea de sus). CS4272 are o secțiune de interpolare și un filtru abrupt încorporat în ieșire. Tot ceea ce facem pentru acest test este să folosim un micro-controler pentru a alimenta DAC două probe înalte și mici de 16 biți la 48 kHz, oferindu-ne forma de undă maximă posibilă la 24kHz. Nu există alte componente de filtrare utilizate, această ieșire provine direct de la DAC.

Semnalul de ieșire (de sus) de 24kHz de la această componentă DAC de calitate a studioului nu arată cu siguranță forma de undă dreptunghiulară asociată cu materialul obișnuit de marketing. Rata de eșantion (Fs) este afișată în partea de jos a osciloscopului.

Rețineți cum unda sinusoidală de ieșire (sus) este exact jumătate din viteza ceasului de frecvență (jos). Nu există trepte de scară vizibile, iar această formă de undă de înaltă frecvență pare aproape o undă sinusoidală perfectă, nu o undă pătrată cu aspect blocant, pe care materialul de marketing sau chiar o privire ocazională la datele de ieșire ar sugera. Acest lucru arată că, chiar și cu doar două eșantioane, teoria Nyquist funcționează perfect în practică și putem recrea o undă sinusoidală pură, absentă de orice conținut armonic suplimentar, fără o adâncime de biți mare sau o rată de eșantion.

Adevărul despre 32 biți și 192 kHz

La fel ca în majoritatea lucrurilor, există un oarecare adevăr ascuns în spatele întregului jargon și 32-biți, 192 kHz audio este ceva care are o utilizare practică, doar nu în palma mâinii. Aceste atribute digitale sunt de fapt utile atunci când vă aflați într-un mediu de studio, de unde și afirmațiile de a aduce „audio audio de calitate la mobil”, dar aceste reguli nu se aplică pur și simplu când doriți să introduceți piesa finalizată în buzunar.

În primul rând, să începem cu rata de eșantionare. Un avantaj adesea oferit de un sunet cu rezoluție mai mare este păstrarea de date ultra-sonice pe care nu le puteți auzi, dar care are impact asupra muzicii. Gunoiul, majoritatea instrumentelor se încadrează cu mult înaintea limitelor de frecvență ale auzului nostru, microfonul folosit pentru a captura un spațiu rulat cel mult în jurul valorii de 20 kHz și căștile pe care le utilizați, cu siguranță, nu se extind atât de departe. Chiar dacă ar putea, urechile tale pur și simplu nu o pot detecta.

Sensibilitatea obișnuită a auzului uman atinge valori maxime de 3 kHz și începe repede să se rostogolească după 16kHz.

Totuși, eșantionarea de 192 kHz este destul de utilă pentru a reduce zgomotul (acel cuvânt cheie încă o dată) atunci când datele de eșantionare, permit construirea mai simplă a filtrelor de intrare esențiale și este importantă și pentru efectul digital de mare viteză. Supravegherea peste spectrul sonor ne permite să mediem semnalul pentru a împinge podeaua zgomotului. Veți constata că cele mai bune ADC-uri (analogice la convertoare digitale) în aceste zile vin cu pre-eșantionare pe 64 de biți sau mai mult.

Fiecare ADC trebuie, de asemenea, să elimine frecvențele peste limita ei Nyquist sau veți termina cu aliasing-ul oribil al sunetului, deoarece frecvențele mai înalte sunt „rabatate” în spectrul sonor. Având un decalaj mai mare între frecvența colțului nostru de filtru de 20 kHz și rata maximă de eșantionare este mai adecvată pentru filtrele din lumea reală, care pur și simplu nu pot fi la fel de abrupte și stabile decât filtrele teoretice necesare. Acest lucru este valabil la sfârșitul DAC, dar după cum am discutat intermodularea poate împinge foarte eficient acest zgomot până la frecvențe mai mari pentru o filtrare mai ușoară.

Cu cât filtrul este mai abrupt, cu atât ondularea este mai mare în banda de acces. Creșterea ratei de eșantionare permite utilizarea filtrelor „mai lente”, ceea ce contribuie la păstrarea unui răspuns de frecvență plană în banda de acces sonoră.

În domeniul digital, se aplică reguli similare pentru filtrele care sunt adesea utilizate în procesul de amestecare în studio. Rata de eșantion mai mare permite filtrarea mai rapidă și mai rapidă care necesită date suplimentare pentru a funcționa corect. Nimic din toate acestea nu este necesar atunci când vine vorba de redare și DAC-uri, deoarece suntem interesanți doar de ceea ce puteți auzi de fapt.

Trecând la 32 de biți, oricine a încercat vreodată să codifice orice matematică complexă de la distanță va înțelege importanța profunzimii biților, atât cu date întregi, cât și în virgule flotant. După cum am discutat, cu atât sunt mai mulți biți cu atât mai puțin zgomot și acest lucru devine mai important atunci când începem să divizăm sau să scădem semnalele din domeniul digital din cauza erorilor de rotunjire și pentru a evita erorile de tăiere la înmulțire sau adăugare.

Adâncimea de biți suplimentară este importantă pentru păstrarea integrității unui semnal atunci când se efectuează operațiuni matematice, cum ar fi software-ul audio din studio. Dar putem arunca aceste date suplimentare odată ce masterizarea este terminată.

Iată un exemplu, să spunem că luăm un eșantion pe 4 biți și eșantionul nostru actual este 13, care este 1101 în mod binar. Încercați să împărțiți asta cu patru și rămânem cu 0011, sau pur și simplu 3. Am pierdut 0.25 în plus și acest lucru va reprezenta o eroare dacă am încercat să facem matematica suplimentară sau să ne transformăm semnalul într-o formă de undă analogică.

Aceste erori de rotunjire se manifestă ca cantități foarte mici de denaturare sau zgomot, care se pot acumula într-un număr mare de funcții matematice. Cu toate acestea, dacă am extins acest eșantion pe 4 biți cu biți suplimentari de informații pentru a fi folosit ca facțiune sau punct zecimal, putem continua să împărțim, să adăugăm și să multiplicăm mult mai mult, mulțumită punctelor de date suplimentare. Așadar, în lumea reală, eșantionarea pe 16 sau 24 de biți și apoi transformarea acestor date într-un format pe 32 de biți pentru procesare din nou ajută la economisirea zgomotului și a denaturării. După cum am precizat deja, 32 de biți reprezintă o mulțime de puncte de acuratețe.

Acum, ceea ce este la fel de important să recunoaștem este faptul că nu avem nevoie de această sală suplimentară atunci când revenim în domeniul analogic. Așa cum am discutat deja, în jur de 20 de biți de date (-120dB de zgomot) maximul absolut care poate fi detectat, deci putem converti înapoi la o dimensiune de fișier mai rezonabilă fără a afecta calitatea audio, în ciuda faptului că „audiofilii” sunt probabil lamentând aceste date pierdute.

Cu toate acestea, în mod inevitabil, vom introduce unele erori de rotunjire atunci când trecem la o adâncime mai mică de biți, astfel încât va exista întotdeauna o cantitate foarte mică de distorsiune suplimentară, deoarece aceste erori nu apar întotdeauna la întâmplare. Deși aceasta nu este o problemă cu sunetul pe 24 de biți, deoarece deja se extinde cu mult peste podeaua de zgomot analogic, o tehnică numită „dithering” rezolvă corect această problemă pentru fișierele pe 16 biți.

Un exemplu de comparație a distorsiunii introduse de trunchiere și secare.

Acest lucru se realizează prin randomizarea celui mai puțin bit semnificativ din eșantionul audio, eliminând erorile de distorsiune, dar introducând un zgomot de fundal aleatoriu foarte liniștit, care este răspândit pe frecvențe. Deși introducerea zgomotului poate considera contrar intuitiv, aceasta reduce de fapt cantitatea de distorsiune sonoră din cauza aleatoriei. În plus, folosind modele speciale de zgomot în formă de zgomot care abuzează de răspunsul de frecvență al urechii umane, audio audio cu 16 biți poate reține de fapt un plan de zgomot perceput foarte aproape de 120dB, chiar la limitele percepției noastre.

Datele pe 32 de biți și ratele de eșantion de 192 kHz au beneficii notabile în studio, dar aceleași reguli nu se aplică pentru redare.

Pur și simplu, lăsați studiourile să își înfunde hard disk-urile cu acest conținut de înaltă rezoluție, pur și simplu nu avem nevoie de toate aceste date de prisos când vine vorba de redare de înaltă calitate.

Învelire

Dacă sunteți în continuare cu mine, nu interpretați acest articol ca o respingere completă a eforturilor de îmbunătățire a componentelor audio ale smartphone-ului. Deși numărul care poate fi inutil poate fi inutil, componente de calitate superioară și un design mai bun al circuitului este încă o dezvoltare excelentă pe piața mobilă, trebuie doar să ne asigurăm că producătorii își concentrează atenția asupra lucrurilor corecte. DAC-ul pe 32 de biți din LG V10, de exemplu, sună uimitor, dar nu trebuie să vă deranjați cu dimensiuni imense de fișiere audio pentru a profita de acesta.

Posibilitatea de a conduce căști cu impedanță joasă, de a păstra o podea de zgomot redus de la DAC la mufă și de a oferi o distorsiune minimă sunt caracteristici mult mai importante pentru sunetul smartphone-ului decât adâncimea de biți sau rata de probă acceptată teoretic și vom spera să fim capabili pentru a vă scufunda în aceste puncte mai detaliat în viitor.

tatitic vorbind, majoritatea cadourilor dv. de vacanță din acet an vor fi provenite de la Amazon. Comanda online pentru ărbători a crecut de-a lungul anilor, depășind experiența din magazin. Amazon ar...

Ete Amazon Prime Day! Exită o mulțime de oferte excelente, dacă aveți chef de cumpărături. Am văzut deja câteva oferte generoae de martphone-uri, dar dacă produele canice inteligente unt mai mult...

Selectarea Site-Ului