Tidal ve Spotify'ın Müzik Kalitelerinin Teknik Açıdan Karşılaştırması

Tidal mı, Spotify mı? Müzik stream endüstrisinin önde gelen iki platformunu bir odyofilin (audiophile) yorumlarıyla kıyaslayalım.
Tidal ve Spotify'ın Müzik Kalitelerinin Teknik Açıdan Karşılaştırması

tidal'ı oturdum ölçtüm ben. gelin size sıkıcı mühendislik perspektifinden tidal mı spotify mı anlatayım. önce biraz bilgi* vereyim...

öncelikle kayıt-prodüksiyon vs yaptığım, profesyonel cihazlar (odyofil oyuncakları değil) ile donattığım bir stüdyom var. rme marka ses kartımı 192khz'de çalıştırdım. bu cihaz piyasanın "mastering grade" sınıfındaki en bilinen ve yaygın olarak kullanılan bir adda çeviricisidir. ayrıca dijital loopback özelliği sağlar. yani istediğim sesi, ses kartının içinden istediğim girişe ya da çıkışa yönlendirmemi sağlar. yani spotify'dan çalan sesi, ses kaydı için kullandığım programa (daw) kayıpsız yönlendirebilirim. ek bir programa vs ihtiyaç olmaz (voicemeeter gibi).

tidal ve spotify'da volume normalizasyonunu kapattım (kayıtların seviyesi ne ise onu çalıyor). tidal hifi üyeliğim var, spotify'da da en yüksek kaliteyi seçtim (ogg 320 kbps). 2 tane şarkı seçtim: birisi amy winehouse - back to black, diğeri billie eilish - happier than ever.

bu iki şarkıyı tidal ve spotify'dan .alarak kaydettim. şarkıların loudness değerini ve frekans cevabını ölçtüm.

billie eilish'in 1/3 oktav smoothing ile, 8192 çözünürlükte ortalama 10 saniyelik frekans cevabı:


bu grafiğe baktığınızda dikkat etmeniz gereken noktalar

1. pembe çizgiler insan kulağının sınırlarını gösteriyor. teoride 20khz üstü tiz sesleri duyamazsınız. pratikte ise duyabilme sınırınız 20khz'e kadar tamamen lineer çalabilen bir hoparlörde bile, eğer 12 yaşından büyükseniz 15-16khzler civarındadır. onu da sessiz ortamda dikkatle dinlerseniz ssss sesi olarak duyarsınız. pratikte yani 15-16khz sonrası yok gibi düşünebiliriz. sol tarafta görülebilen alt frekanslarda da 20hz altı bas sesleri duyamazsınız.

şimdi spotify'ın sıkıştırılmış ogg formatındaki dosyanın 20khz sonrasında sert bir şekilde düşüp 30khz civarında -112 dbfs'de söndüğünü görebilirsiniz. bu, kağıt üzerinde -112 dbfs'te 30khz frekansına kadar ses taşıyabiliyor manasına gelse de, realitede -60 -70 dbfs seviyelerinden sonraki seviyeleri duymamız imkansızdır. burada dbfs decibel full scale iken db desibel - ses şiddetidir.

bunu açıklamamız lazım

dijital ortamdaki ses seviyesinin ölçümü dbfs birimiyle olur. bunun tepe noktası 0'dır. yani -112 dbfs dediğim zaman, dijital ortamda 0 noktasından aşağı doğru 112 desibel kadar inen bir ses dinamik aralığından bahsediyoruz.

peki reel dünyada bu nasıl oluyor? diyelim bilgisayar karşısında hoparlör açtığımız zaman bir ses şiddeti ölçer ile (spl metre) çalan müziğin seviyesini ölçersek 70-80 desibel arası bir seviye çıkar. 85 desibel epey yüksektir. konserler mesela 110-115 desibel seviyesindedir. 85 db üstü seviyeye uzun süre maruz kalırsanız duyma hasarı olur. 120 desibel ses acı vericidir.

şimdi sizin bilgisayar dijital ortamda üretilen 0 dbfs seviyesinde çalan bir sinyali hoparlörlere voltaja dönüştürüp gönderdiğinde siz sesi 10 üstünden atıyorum 3 açarsanız 50 db ses şiddeti olurken, sonuna kadar açarsanız atıyorum 90 db ses oluşuyor. burada dijital ortamda 0 noktasında çalan sesin şiddeti hacmi hep sabit, reel dünyada havayı ittiren hoparlörün seviyesini değiştirerek odadaki sesin şiddetini değiştiriyoruz.

mesela 0 dbfs'te çalarken, 85db ses çıkaracak kadar hoparlörü açtık. bilgisayar üzerinden sesi -10 dbfs noktasına getirince, hoparlör 85 db'den 75 db'ye iniyor. -50 dbfs'e getirince hoparlör 35 db çalıyor. yani fısıltı seviyesinde.

şimdi sizin, dijital ortamda -110 dbfs'teki bir sinyali duymanız için, ses 0 dbfs'te iken, dışarıda 110 desibel ses üretebilecek amfi hoparlöre ihtiyacınız var. bu 110 desibellik ses de gemi düdüğü gibi bir şiddete sahip.

yani varacağım nokta şu... -dinleyicilerin 99.9999999%unda bulunan ses sistemlerinde- 60 dbfs seviyesinin altındaki sesleri duymanız imkansız. hele hele arabada, dışarıda, hatta eviniz merkezi bir yerde ise ev içindeki gürültüde bu sesleri duymanız imkansızdır. hele hele müzik içerisinde, daha yüksek seslerin olduğu bir yerde onlar arasından -60 db'de olan biteni duymanız imkansızdır.

bunun kabloyla, hoparlörle veya kulaklıkla vs hiçbir ilgisi yok. fiziksel bir olay. hava yeterince ittirilmezse o basınç kulaklarınıza ulaşmaz ve beyninize sinyal gitmez, beyniniz de gelmeyen sinyali yorumlayamadığı için hiçbir şey duyamazsınız.

şimdi - grafiğe tekrar bakarsanız tidal master kaydının 50khz civarlarına kadar çıktığını görüyoruz. spotify ogg ise 20khz'den sonra hızla düşüyor. bu demek midir tidal daha kaliteli müzik dinlemenizi sağlıyor? hayır.

insan kulağının duyma sınırları 20khz. üstünü duymuyoruz. eğer sizin kullandığınız cihaz 192khz sample rate'te çalışmıyor, dolayısıyla nyquist limiti 96khz frekansında tutmuyorsa, otomatik olarak hangi sample rate'te ise ona downsample ediyor (mesela iphone'ların max sample rate'i 48khz ) ve sizin maksimum frekans olarak 24khz'e düşmenize sebep oluyor. ancak bu yine insan kulağının duyma sınırı olan 20khz'in üstünde. yani siz 20khz'e kadar lineer bir şekilde (kayıpsız) hava ittirebilen bir hoparlöre sahip olsanız bile 24khz'e düştüğünü duyamayacaksınız (çünkü kulak üstünü algılayamıyor).

yani frekans cevabı olarak, yüksek sampling rate olması, playback esnasında size artı bir değer sunmuyor.

devam edersek

işin içinden biri olarak size kayıtların 99.9999%unun 48khz sampling rate ile yapıldığını söyleyebilirim. bu ne demek?

şu demek: enstrümanı-sesi gerçek dünyadan dijitale çevirme amaçlı mikrofonla kayıt alırken, analogdan dijitale çeviren cihaz (adc), 48khz sampling rate'e ayarlı oluyor. bu da 24khz üzeri tiz sesleri kayıt altına almaması manasına geliyor. 24khz üzeri sesler eğer mikrofon tarafından elektrik voltajına çevrildi ise bile, bu elektrik sinyalini sample alarak dijitale çevirmeden önce, keskin bir bir filtre uygulayıp (low pass filtre) 24khz üzerini kesiyor, altında kalan kısmını kayıt altına alıyor. yani sizin en baştan 48 khz ile kaydedilmiş bir kaydı, zaten 48 khz üzeri bir sampling rate ile çalmanızın hiçbir manası yok.

ölçebildiğiniz şey duyabildiğiniz şey demek değil. yüksek sampling rate ve bit derinliği ile kaydedilmiş müzikte bu yüksek rakamlardan faydalanan frekansları zaten çalacak alet sınırlı, duyabilecek kulak daha da sınırlı.

peki 16 bit 24 bit nanesi?

16 bit kaydın dinamik aralığı 96 dbfs. başta anlattığım gemi düdüğü olayını hatırlatırım.
24 bit dinamik aralığı 144 dbfs. bu iki şarkıyı loudness değerleri olarak da karşılaştırdım. sürekli tekrarlanan "tidal daha dinamik geliyor çünkü 24bit 192khz" yorumlar var.

analogdan dijitale çeviren cihazların üzerindeki line girişlerinin dinamik aralığı 120 desibel. yani bu cihazlar zaten max 120 desibel civarında fiziki olarak sınırlandırılıyorlar. peki 24 bit kaydı 120 desibellik bir dinamik aralıkta kaydetsek iyi olmaz mı? eğer -120 dbfs'ten 0 dbfs'e kadar farklılık gösteren bir sinyal kaydetmek lazımsa evet. zira 16 bit kaydın 96 db'lik aralığı, altta kalan 24 desibellik sesi kaydedemeyecek.

ama burada müzikten bahsediyoruz. perspektif olsun diye: standart pop müziğin dinamik aralığı sadece 8-9 desibel. yani dinlediğiniz pop şarkıların en kısık olduğu yerle en yüksek olduğu yer arasındaki fark 8 desibel kadar. yani sizin şarkı çalarken max 0 noktasına vuruyorsa, en az vurduğu yer de -8 desibel falan.

bunun altında kalan 100 desibellik bir alan var. bu ne işe yarıyor? noise floor dediğimiz dip gürültüyü aşağı ittirmeye yarıyor. bant kasetleri hatırlayın, walkman'e takınca ssssssss diye bi ses gelirdi ya? hah işte o noise floor. bantın elektroniklerin sesi. kasetlerin en en en iyi deck kasetçalarda, dolby noise reduction ile elde edebildiği dinamik aralık 60 db. gençken elimizdeki walkmen'lerde bu tahminen 40 db falandır.

özetle 16 bitlik cd kalitesi, -96 dbfs seviyesine ittirdiği dip gürültü ile, 24 bit'ten sonraki en temiz kayıt formatı.

kaldı ki, biz kayıtları yaparken kullandığımız mikrofonlar, pre-amp'ler, odanın sesi, elektrik gürültüsü vs gibi şeyler üst üste binince noise floor zaten 80 dbfs civarlarında oluyor. özetle 16 bit fazlasıyla yeter ve artar bir dinamik aralık.

şimdi geri geliyorum tidal ve spofity'a 

yaptığım ölçümlerde gördüm ki, tidal, 1:1 aynı master kaydın, sadece sample rate ve bit depth'i yüksek versiyonu. "daha dinamik" diye bir şey yok. 1:1 aynı loudness, 1:1 aynı peak to loudness ratio var her iki formatta da.

billie eilish şarkının son nakaratından aldığım ölçüm:

spotify


tidal


özetle

spotify' high quality modda dinleyen, sonra "tidal bariz daha iyi abi" diyen birisi ne dediğini bilmiyor. dijital sampling nasıl çalışır bilmiyor. duyduğu ses nasıl dijitale aktarılıyor, nasıl tekrar yaratılıyor ve kulağımıza geliyor, bilmiyor.

pahalı alet aldım, kağıt üstünde spesifikasyonları çok yüksek 768 khz sample rate'te çalışıyor diye daha iyi duyuyorum sanıyor. duymuyor.

bunun da testi çok kolay (daw programı ve hofa blind test diye bir plugin lazım). alıyorsunuz kanalları, blind test plug-in'ini açıp randomize ediyorsunuz sonra arada basıyorsunuz kanallar arası bir fark duyabiliyor muyum diye.

ben, daha önce bahsettiğim mastering grade dac'ımın beslediği, frekans cevabı ölçüm mikrofonu ve dsp ile düzeltilmiş 3 yollu referans hoparlörlerim, akustik düzenlemesi yapılmış odamda da, audeze lcd2 kulaklıklarımda da, ne dinlemem gerektiğini bilmeme rağmen kör testte bir fark duyamıyorum.

bu iş için tasarlanmış test tonları kullansak beeeelki farkı duyarım. ama kaydedilmiş ve mikslenmiş müziklerde yüksek kalite spotify ile tidal master arasında bir fark yok. sanatçılar ve plak şirketleri tüm stream platformlarına 1:1 aynı master'ı veriyorlar. spotify aldığı master'ı kompresliyor sadece. kompres tekniği de fazlasıyla transparan. ölçümlerde görünen farklar da duyulabilir aralık dışında.

özetle evet, yüksek sample rate ve bit depth matematiksel olarak daha çok veri taşıyan bir format, ancak müzik dinlemek için 16 bit 44.1khz - yani cd kalitesi fazlasıyla yeterli. çünkü duyulabilir aralık 20khz ile sınırlı, çünkü insanların duyumları yaşla birlikte hızla düşüyor ve efektif duyma tavanı 15-16khz'lerde oluyor, çünkü 24 bit'in sağladığı yüksek dinamik aralık reel dünyada faydasını görebileceğimiz bir seviye değil.

spotify ya da tidal ya da başka bir servis seçmenin ana sebebi ses kalitesinden ziyade keşif özellikleri, playlistlerin kalitesi, uygulama stabilitesi ve akıllı cihazlarla uyum (tv'ler, bt hoparlörler, ev sinema receiver'ları vs) olmalı. "kalite" tavanı 80'lerde cd format standardı ile çoktan yakalandı.

*sampling rate mevzusu

sampling rate'ten bahsederken de khz, frekans cevabından bahsederken de khz birimini kullanıyoruz.

bir tanesi, analog sinyali dijitalize ederken saniye başına alınan örneklem sayısı. (saniyede 44100 kez örnek alırsa 44.1khz sample rate diyoruz, saniyede 192000 kez örnek alırsa 192khz diyoruz.)

diğeri havanın saniyede titreşme hızını temsil eden frekans değeri. 20hz diyorsak saniyede 20 kez titriyor, 1000hz dersek 1000 kez, 24khz dersek 24000 kez titriyor demektir. sesler tizleştikte daha hızlı titrer. 10khz 1000hz'den daha tiz bir ses üretir.

sampling rate'in örneklem alınabilen en yüksek ses frekansına etkisi vardır. bunun için nyquist teoremine bakabilirsiniz. buna göre - bir analog sinyali, aslında sadık bir şekilde dijitale çevirip, tekrar analoga çevirmek için en yüksek frekanstaki sinyalin minimum 2 katı kadar sample rate kullanmanız lazım. yani 10khz bir sinyali aslında sadık dijitale çevirmek istiyorsak, 20khz sampling rate kullanmamız lazım.

44.1khz (cd standardı) insan kulağının maksimum duyabildiği frekans olan 20khz'ı yakalayacak ve üst frekanslarda bozulmaya sebep olan aliasing distortion etkisini yok edecek bir filtreye (anti aliasing filter) yer açmak için 22050 hz'i yakalayacak olan sampling rate olarak philips ve sony arasında görüşülüp seçilen bir standart. daha fazla detay isteyene: wiki