Videoların Sıkıştırılması

Sinema filmindeki görüntülerin televizyon ve bilgisayar gibi cihazlarda oynatılabilmesi için filmin dijital bir kopyası oluşturulur. Sinema filmini yüksek çözünürlükte tarayarak oluşturduğumuz dijital veriler kişisel kullanıma uygun değildir. Film tarama cihazları örneğin 35 mm filmi 4K çözünürlükte tararken yaklaşık saniyede 1.66 Gb dijital veri oluşturur. Bu veriler sinema sektöründe kullanılmak içindir. Filmin dijital kopyası kişisel kullanım için video sıkıştırma işlemlerinden geçer. Sıkıştırma işlemlerinden sonra çoğaltılıp disklere kayıt edilerek dağıtımı yapılır. Bu yazıda video sıkıştırmada kullanılan yöntemleri anlatmaya çalışacağım.

Resmin JPEG Olarak Sıkıştırılması

Videolar resimlerden oluşur, eğer resimlerin boyutunu düşürürsek video boyutunu da düşürmüş oluruz. Resmi oluşturan noktalar çoğunlukla içerisinde yumuşak renk geçişlerine sahiptir hatta bazen tamamen tek renkten oluşan arkaplanlar vardır. Bu durumdan faydalanarak geliştirilen JPEG resim sıkıştırma yöntemi, resimleri fark edilmesi güç kalite kayıpları ile büyük oranlarda sıkıştırabilir.

JPEG Sıkıştırma

Resimlerin Gruplanması

Şimdi aşağıdaki iki resmi inceleyelim ve aradaki farkları bulalım. Bu resimler ‘The Matrix‘ filmindeki bir dövüş sahnesinde peş peşe gelen iki resim karesidir.

The Matrix

Bu resimlerde farklara değil de benzerliklere bakarsanız iki resmin neredeyse aynı olduğunu fark edersiniz. Ana resmi hafızaya kayıt edersek, sonra da ana resim üzerine değişen kısmı belirtecek küçük boyutlu ikinci bir resim daha oluştursak, videoyu çok daha fazla sıkıştırabiliriz. Videoların genelinde bir sonraki kare bir öncekine benzer olur. Video sıkıştırmada (Group of pictures) GOP yöntemi ile resimleri gruplar ve sadece değişen bölümleri hafızaya kayıt ederiz. Grubun ilk resmine inter frame denir, bu resim tüm sahneyi içerir. Değişiklikleri ifade eden resme base frame denir, sadece iki fotoğraf karesi arasındaki farkları içerir. Birde ara resimler vardır bunlara predicted frame denir, ara resimler ana resim gibi tüm sahneyi içerir ama daha düşük kalitelidir. GOP sayısı ve base frame sayısı arttıkça video boyutu daha da düşer ama görüntüdeki bozulmalar artar.

Video Resim Grupları
  • I-Frame: Hafızada tüm resmi tuttuğu için fazla yer kaplar.
  • B-Frame: Sadece değişiklik bilgisi vardır hafızada az yer kaplar.
  • P-Frame: küçük resimdir, hafızada I-Frame den daha az yer kaplar.

Video Tarama Yöntemi (Scan Mode)

Tarama yöntemi resmin ekranda oluşma şeklidir. Resimler ekrana belli bir sıra ile taranarak oluşturulur. Yenilenme çok hızlı olduğu için insan güzü bu taramayı fark edemez ama sonuçlarını görebilir. Progressive ve Interlaced olarak iki tip tarama vardır. Progressive sıralı taramadır her satır sırayla taranır, videolarda bu durum 720p şeklinde çözünürlük rakamının sonuna p harfi konularak belirtilir. Interlaced atlamalı taramadır önce tek sayılı satırlar sonra çift sayılı satırlar taranır, videolarda bu durum 720i şeklinde çözünürlük rakamının sonuna i harfi konularak belirtilir. Interlaced taramada video hafızada daha az yer kaplar, özellikle televizyon yayınlarında sıkça kullanılır. Interlaced taramanın dezavantajı hızlı hareket olan görüntülerde görüntüyü oluşturan resim karelerinin iç içe girerek görüntüde bozulmalara sebep olmasıdır.

Hızlı hareket eden tenis topu

Kodlama Kütüphaneleri

Videoları sıkıştırabilmek için öncelikle kodlama kütüphanesi seçilir. Anlattığım yöntemler şuan için en sık kullanılan x264 kütüphanesi için geçerlidir. Farklı kütüphaneler ve sıkıştırma yöntemleri de vardır.

  • x264 (H.264)
  • x265 (H.265) -> Yüksek verimlilikte video sıkıştırıcı
  • FFmpeg -> MPEG-1, MPEG-2, MPEG-4
  • Xvid
  • libvpx

Bu kütüphaneleri kullanabilmek için montaj programı gereklidir. Adobe Premiere gibi ücretli uygulamalar satın alıp kullanabileceğiniz gibi Shotcut gibi ücretsiz programlar kullanarak da video kodlama işlemlerinizi yapabilirsiniz. Ayrıcı VLC gibi video oynatıcı programlar aynı zamanda video kodlama da yapabilmektedir.

YouTube Videoları Nasıl Kodlar?

Youtube yüklenen video dosyasını saklar. Bu dosyayı yapay zeka programları ile tarar, sakıncalı olmadığına karar verdiğinde videoyu kendi belirlediği yöntemlerle tekrar kodlar ve sitede yayınlar.

YouTube saniyeyi 2 parçaya böler, saniyede 24 kare resim varsa 12 resim bir grup olur, saniyede 60 kare resim varsa 30 resim bir grup olur. Base frame sayısı genellikle 2 dir. YouTube kodlama yöntemini değiştirmeye karar verirse, yüklenen orijinal video dosyasını saklandığı için bu dosya üzerinden tekrar kodlama yapabilir. YouTube videoları x264 kütüphanesini kullanarak kodlar, JPEG kalitesi %60 ile %70 arasındadır, uygulanan tarama yöntemi progressive dir.

0
0