Dünden Bugüne Ses Formatları

Dünden Bugüne Ses Formatları

Dijital ses kayıtları uzun zamandır kullanılıyor ve bu sebeple sayabileceğinizden de fazla ses formatı ortalıkta arz-ı endam ediyor.

Ancak bunlardan bazıları daha sık kullanılıyor. İsterseniz bu yazımızda çok kullanılan bazı ses formatlarını ve ne için kullanıldıklarını kısaca anlatalım:

PCM Audio: Bu işin başı

Pulse-Code Modulation formatı üretildiğinde, muhtemelen babalarınız bile henüz doğmamıştı. Bu format ilk ortaya çıktığında, takvimler 1937’yi gösteriyordu ve kolayca tahmin edebileceğiniz gibi, analoğa en yakın dijital ses formatı buydu. Size bugün de tanıdık gelebilecek iki farklı özelliği ile tanınırdı: Sample rate (Örnekleme hızı) ve bit depth (bit derinliği).

Sample rate, hangi sıklıkla (saniyede kere cinsinden) dalganın genliğinin (amplitude) ölçüleceğini; bit depth ise hangi muhtemel dijital değerlerin verilebileceğini belirliyordu.

Üzerinde yaşadığımız dünyada, ses devamlılık arz eder. Halbuki dijital dünyada böyle değildir. Videoların bir birini takip eden hareketsiz resimlerden oluştuklarını ve bunların peş peşe oynatılmasıyla “hareketli görüntü” zannettiğimiz görüntülerin elde edildiğini hepimiz biliriz. Ancak sesler için de bunun böyle olduğunu çoğumuz bilmeyiz.

Aynen videolarda olduğu gibi, dijital ses kayıtlarında da, ses dalgalarının genliği “akışkan” değildir, yani sürekli değişmez. Değişimi, önceden belirlenmiş kriterlere bağlı olarak sabit aralıklarla oluşur.

Ses formatlarıyla sürekli çalışılan bir meslekle uğraşmıyorsanız, yukarıda bir yerlerde kopmuş olmanız çok normal. İsterseniz, hepimizin bildiği bir benzetmeden yola çıkarak kavramları bir daha anlatalım:

Açık bir musluktan akan suyun, analog ses kaynağımız olduğunu farz edelim. Bu suyun sıcaklığını, ses dalgasının genliğine benzetebiliriz. Örnekleme (Sampling), akan suya parmağınızı saniyede kaç kere tuttuğunuzdur. Parmağınızı ne sıklıkla akan suya tutarsanız, sıcaklıktaki değişim de o kadar “devamlı” olur ve doğru bir şekilde ölçüm yapma imkanınız artar. Mesela süper bir hıza sahip olsanız ve parmağınızı akan suya dakikada 44,100 kere tutabilseniz, parmağınızı neredeyse sürekli suda tutmuş gibi olursunuz, değil mi? İşte örnekleme kavramının altında yatan ana fikir de budur.

Bit depth (bit derinliği) biraz daha karışık bir kavramdır. Burada, sıcaklığı ölçmek için parmağınızı değil de kötü bir termometreyi kullandığınızı düşünebiliriz. Oda sıcaklığının üzerindeki her değer için “Sıcak”, altındaki her değer için ise “Soğuk” diyen bu termometre; suya ne sıklıkla tuttuğunuzdan bağımsız olarak size oldukça az bilgi verecektir.

Peki ya termometremiz “Sıcak” ve “Soğuk” olarak 2 değer vermek yerine, 16 değer verebilirse? Çok daha faydalı olur değil mi? İşte Bit Derinliği aynı şekilde çalışır. Yüksek değerlerde olması, ses genliğindeki dinamik değişikliklerin daha hassas bir şekilde yansıtılabilmesini sağlar.

PCM ses formatının, bu işin başı olduğunu en başta söylemiştik. Kayıpsız olan bu ses formatı, sıkıştırılmamıştır ve bu sebeple çok fazla yer kaplar. Diğer ses formatlarının çoğu, değişik algoritmalarla sesleri sıkıştırırlar ve bu sebeple bir yandan daha az yer kaplarken, bir yandan da çalıştırılabilmek için değişik decoderlara ihtiyaç duyarlar.

Sıkıştırılmamış Grup: WAV, AIFF

Hem WAV, hem de AIFF, PCM temelinde bilgi depolama sisiteminde küçük değişiklikler yapılmış kayıpsız ses depolama formatlarıdır. Çoğu insana PCM sesleri, kullandıkları işletim sisteminin Windows veya OS X olmasına bağlı olarak bu 2 formattan birinde gelirler ve kayıp olmaksızın birbirlerine çevrilebilirler. İkisi de “Kayıpsız” olarak kabul edilirler, sıkıştırılmamışlardır, stereo (2 kanallı) PCM ses dosyalarıdır, 44.1 kHz (yani saniyede 44100 kere) ile , 16 bitte örneklenmişlerdir (sampling). Genellikle 1 dakikalık kayıtları 10 MB civarında yer kaplar. Ses kaydı yapmak istiyorsanız, daha sonra tam kalitede kullanabilmek için sesinizi bu formatlarda kaydetmelisiniz.

Kayıpsız Formatlar: FLAC, ALAC, APE

FLAC (Free Lossless Audio Codec), ALAC (Apple Lossless Audio Codec) ve APE (Monkey’s Audio) sesi, dijital dünyada herhangi bir şeyin sıkıştırıldığı şekilde sıkıştırırlar: Algoritmalar kullanarak. Ziplenmiş bi dosyayla FLAC arasındaki fark, FLAC’nin özellikle ses dosyaları için üretilmiş olmasıdır. Bu sebeple veri kaybetmeden ziplenmiş hale göre çok daha fazla sıkıştırmaya imkan tanır. Genellikle WAV formatındaki bir dosyanın bu şekilde sıkıştırılmış hali, normalinin yarısı kadar yer kaplamaktadır. Yani “CD kalitesinde” stereo ses içeren bir FLAC dosyası, ortalama 5 MB/dakika yer kaplar.

Bu formatların avantajı, dosyalarda değişiklik yapmak istediğinizde, kayıp olmaksızın WAV formatına çevirme imkanınızın bulunmasıdır.

Kayıplı Formatlar: MP3, AAC, WMA, Vorbis

Günlük kullanımda gördüğünüz formatların çoğu “kayıplı”dır, dosya boyutundan ciddi miktarda kazanç sağlamak için ses kalitesinden belli oranda kayıp verilmiştir. Ortalama “CD kalitesinde” bir MP3, dakika başına 1 MB yer kaplar. Ciddi bir fark değil mi? Ancak bu dosyaların kalitesini eski haline çevirmek mümkün değildir.

Değişik dosya formatları, farklı algoritmalar kullanarak ses sıkıştırması yaptıkları için, dosya boyutlarında çok büyük değişiklikler olabilir. Kayıplı formatlar da ses kalitesinden bahsederken “bit rate” ifadesini kullanırlar. Bu da genellikle “192 kbit/s” veya “192 kbps” şeklinde belirtilir. Büyük sayılar, daha fazla bilginin sıkıştırıldığını ve daha fazla detayın korunduğunu gösterirler. Aşağıda, bazı popüler ses formatlarıyla ilgili kısa bilgiler yer alıyor:

MP3: MPEG 1 Audio Layer 3, bugün en sık kullanılan kayıplı ses codec’idir. Geçmişte patent problemleri sebebiyle de gündeme gelen bu ses formatı, insan kulağının ayırt edemeyeceği ses bölümlerini atmakta ve kalan kısımları da etkili bir biçimde sıkıştırmaktadır. Böylece 128 kbit/s’lik bir MP3 dosyası, orijinal ses kaydının 11’de biri kadar yer kaplayabilir.

Vorbis: Genellikle bilgisayar oyunlarında kullanılan açık kaynaklı ve ücretsiz bir kayıplı formattır. Açık kaynak kullanıcıları, sıklıkla bu formatı kullanırlar.

AAC: Advanced Audio Coding, artık MPEG4 video’da kullanılan standardize bir formattır. Dijital Haklar Düzenlemesi anlamına gelen DRM (mesela Apple’ın FairPlay’i) ile uyumu, mp3’e göre avantajlı olduğu noktalar ve yürütme ve dağıtma için lisans gerektirmemesi sebebiyle geniş bir grup tarafından desteklenmiştir. Apple kullanıcılarının muhtemelen bu formata aşina olduklarını söyleyebiliriz.

WMA: Windows Media Audio, Microsoft’un kayıplı ses formatıdır. MP3 formatının gerektirdiği lisans konularından kurtulmak için üretilmiştir. Ancak ilerleyen zamanlarda büyük geliştirmelere maruz kalması ve DRM uyumlu olması sebebiyle halen kullanılmaktadır.

Kayıplı formatlar, har disk alanınızı ekonomik kullanabilmeniz için üretilmişlerdir. Hangi formatı seçeceğiniz, kullanığınız yazılıma, sahip olduğunuz hard disk alanına, hassasiyetlerinize göre değişebilir. Bugünlerde bilgisayarlar hemen her formatı çalıştırabilmektedirler. Çoğu ses programı pek çok kayıplı formata dönüşüm yapabilir ve yine çoğu FLAC ve APE üretebilir. Apple ise sadece MP3, ALAC ve AAC’yi desteklemektedir.

Bu yazı, HTG Explains: What Are the Differences Between All Those Audio Formats? yazısından tercüme edilmiştir.

İbrahim

Hekim. Yazar, beğenirse çevirir, kod yazarak eğlenir. 2002'den beri internette yazıyor.

Sevebilirsin...

1 Yanıt

  1. Yaşar Ceyran dedi ki:

    Bilgiler için çok teşekkür ederim