Video sıkıştırma

Video sıkıştırma azaltmak için kullanılır veri hızını bir sayısallaştırılmış böylece video sinyali o depolanan veya daha kolay bulaşabileceğini. Ulaşılabilir sıkıştırma oranları tipik olarak 1: 5 ile 1: 500 arasındadır.

Video sıkıştırmanın kökenleri hareketsiz görüntü sıkıştırmaya dayanır. MJPEG gibi daha basit yöntemler , bir videodaki tek tek görüntüleri birbirinden bağımsız olarak sıkıştırır. Elde edilebilecek sıkıştırma oranları yaklaşık 1: 10'dur. Daha fazla geliştirilmiş yöntemler, kodlama için ayrı kısmi görüntüler arasındaki benzerlikleri de kullanır. Bugün bununla elde edilebilecek sıkıştırma oranları, kalitede neredeyse hiç azalma olmadan 1: 100'ün üzerindedir.

Video kodlama süreçlerinin standardizasyonu, Hareketli Resim Uzmanları Grubu (MPEG) ve Uluslararası Telekomünikasyon Birliği'nin (ITU) dahil olduğu uluslararası organizasyonları kapsayan bir süreç haline geldi . Bu nedenle, birçok özdeş işlemin arkasında aynı formatın gizlendiği H.264, MPEG-4 AVC, MPEG-4 / Part 10 veya ISO / IEC 14496-10 gibi farklı adları vardır .

Temel bilgiler

Artıklık azaltma
Alakasızlık azaltma

Sıkıştırma algoritmaları aşağıdakilere dayanmaktadır:

  • Video sinyalinin fazlalıkları (kendine benzerlikler) (artıklık azaltma) ve
  • İnsan görüşünün yetersizlikleri ve fizyolojik etkileri (ilgisizliğin azaltılması).

Artıklık azaltma ve ilgisizlik azaltma terimleri bilgi teorisinden gelir ve bilgi aktarılırken veri sıkıştırma olarak da bilinen veri miktarını azaltmaya yönelik iki farklı yaklaşımı açıklar. Bilginin bir kaynaktan lavaboya iletildiği bir model kullanılır. Spesifik video kodlama durumunda, kaynak, orijinal kamerada ortaya çıkan video görüntülerinin sırasına karşılık gelir; lavabo, izleyicinin gözüne karşılık gelir.

Artıklık azaltma

Artıklık azaltma, iletilecek veri miktarını azaltmak için kaynak verilerin özelliklerini kullanır. Video kodlama durumunda, olası en kompakt gösterimi elde etmek için görüntü sinyalinin istatistiksel özellikleri ve zamansal ve uzamsal olarak bitişik görüntü noktaları arasındaki benzerlikler (korelasyonlar) kullanılır. 1: 2'den 1: 5'e kadar sıkıştırma faktörleri elde edilebilir. Hiçbir bilgi kaybolmadığından kayıpsız kodlama denir .

Sadece tahmin hatalarını iletmek zorunda kalabilmek için halihazırda iletilmiş olan ayrı ayrı görüntülerden tahmini değerleri tahmin eden ara kodlama yöntemleri , zamansal korelasyonlardan yararlanmak için kullanılır . (→ Fark kodlama ) Uzamsal korelasyonlar için, görüntü noktalarını uzaysal olarak çevreleyen noktalardan tahmini değerlere olan farkı kullanarak kodlayan veya pikselleri kapsayan görüntü modellerini tanıyan ve bunları daha kompakt bir şekilde tanımlayabilen iç kodlama yöntemleri vardır . Sözde → entropi kodlaması, istatistiksel fazlalıktan yararlanmak için kullanılır .

Alakasızlık azaltma

Alakasızlık azaltmanın amacı, havuzla ilgili olmayan bu bilgiyi iletimden çıkarmaktır. İnsanın görsel algısının fizyolojik özelliklerini hesaba katar ve kasıtlı olarak bilgiyi reddeder, böylece ortaya çıkan rahatsızlıklar insan izleyiciler tarafından mümkün olduğunca az algılanabilir. Bu, işleme ve gerekli kaliteye bağlı olarak tipik olarak 1: 2 ila 1: 50 arasında daha fazla sıkıştırma sağlar. Bilgi atıldığından, kayıplı kodlamadan söz edilir .

Somut bir ifadeyle, video kodlama durumunda, bu , görüntü verilerinin yalnızca bir kısmının niceleme yoluyla iletildiği anlamına gelir .

Renk algısının mekansal çözünürlüğü, gözün anatomisine bağlı olarak parlaklıktaki farklılıkların çözünürlüğünden daha kötü olduğundan, renk bilgilerinin çözünürlüğü, farklılıklar güçlü bir şekilde algılanmadan azaltılabilmektedir. Bir söz rengi subsampling . Genellikle, kodlamadan önce karşılık gelen bir renk modeline dönüştürme gerçekleştirilir ve veri hızı genellikle% 50 oranında azaltılır.

Görsel sistemin istismar edilebilecek bir diğer özelliği de frekans bağımlılığıdır. Sesler gibi, görüntüler de iki boyutlu titreşimlerin üst üste binmesi olarak temsil edilebilir. Kaba görüntü yapılarından düşük kare hızları, ince ayrıntılar için yüksek hızlar sorumludur. Farklı frekans aralıklarındaki rahatsızlıklar, farklı derecelerde algılanır ve bu, basit bir test görüntüsü ile açıkça gösterilebilir.

Bu frekans bağımlılığı, nicelemede psiko-görsel bir faktör olarak uygun bir dönüşümden sonra MPEG ailesinin tüm video sıkıştırma yöntemlerinde kullanılır.

Temel teknikler

Video sıkıştırma teknikleri , çeşitli yedeklilik türlerinden yararlanan sıkıştırma araçları (İngilizce araçları ) adı verilen birkaç alt işlemden oluşur . Çerçeve içi tahmin (piksel tahmini ve diferansiyel kodlama ) ve dönüşüm kodlaması uzamsal olarak bitişik pikseller arasındaki korelasyonlara dayanır , geçici bağımlılıklar çerçeveler arası kodlamada kullanılır, örneğin hareket telafisi ve diferansiyel kodlama (DPCM) ve son olarak istatistiksel entropi kodlaması kullanılarak fazlalık azaltıldı.

Frekans dönüşümü

Blok tabanlı dönüşüm kodlaması durumunda (örneğin ayrık kosinüs dönüşümü , DCT ile), ayrı görüntüler ( çerçeveler ) kare bloklara bölünür ve bunlar karmaşıklıklarına göre değerlendirilir. Bu adım, codec bileşeninin hangi (karmaşık) görüntü blokları için çok fazla depolama alanına ihtiyaç duyduğunu ve (basit) bloklar için daha az bitin yeterli olduğunu "bilmesi" için gereklidir. Bu, ilgisizliğin azaltılmasının ön koşuludur.

Diferansiyel kodlama

Diferansiyel Darbe Kod Modülasyonu (DPCM) , genellikle komşu görüntü noktaları arasındaki veya ayrı ayrı görüntüler arasındaki benzerliklerden yararlanmak için kullanılır : Yalnızca önceden iletilmiş ayrı görüntü veya görüntü noktaları arasındaki farklar saklanır. Ara kodlama durumunda, prosedür hareket düzeltme ile desteklenir.

Hareket düzeltme

Hareket vektörlerinin çizilmiş olduğu fark kodlu görüntü

Veri miktarını azaltmak için bir başka olasılık da hareket düzeltmedir ( İngilizce hareket telafisi ). Son tek tek görüntüye göre taşınan eşleşen görüntü parçaları için bir arama yapılır. Bunun için bir hareket vektörü kaydedilir, hareket ettirilmemiş olanlar basitçe son tek görüntüden devralınır.

Entropi kodlaması

Değer serilerindeki istatistiksel fazlalıkları kaldırmak için değişken uzunluklu kodlara (VLC) sahip bir kod kullanılabilir. İletilecek tüm sembolleri sabit bir kod kelime uzunluğu ile kodlamak yerine, daha sık ortaya çıkan ya da daha muhtemel olan semboller, daha az yaygın olan sembollere göre daha kısa kod sözcükleri ile kodlanmaktadır. Bu, aritmetik kodlama yöntemlerinin en yaygın olduğu yerdir . Bununla birlikte, bazı durumlarda, daha eski Huffman kodlaması veya daha az karmaşık sayı uzunluğu kodlamasının ( örneğin CAVLC ) varyantları hala kullanımdadır.

Tarih

Standardizasyon , henüz pratik kullanım bulamayan H.120 standardıyla başladı . Yaygın video kodlama formatları genellikle halef H.261 (1988) ile oluşturulan temel tasarımı izler . En önemli özellikler blok tabanlı frekans dönüşümü , (hareket dengelemeli) diferansiyel darbe kod modülasyonu (DPCM) ve entropi kodlamadır. Bunun için ana teknikler 1979'da geliştirildi. Bu temel tasarım, o zamandan beri sürekli olarak iyileştirildi ve yardımcı teknolojiler geliştirildi, bu da daha sonra yüzlerce patentle sonuçlandı . Birçok eski teknik, mikroişlemci teknolojisinin performansındaki gelişmeler nedeniyle kullanımları pratik hale gelene kadar, yıllar sonra yaygın kullanım bulmayacaktır. Belirli bir alaka düzeyine sahip bir istisna örneği, dalgacık tabanlı VC-2 standardıdır (Dirac değişkeni).

ITU-T'den H.26x video formatı serisi ve MPEG video formatları şimdiye kadar (2016) baskın video kodlama standartları olmuştur.H.264'e kadar ve H.264 dahil olmak üzere , yayınlandıklarında düzenli olarak en son teknolojiyi işaretlediler ve birçoğu MPEG-1 (1991), MPEG-2 (1994) ve en son H.264 / MPEG-4 AVC (2003) dahil olmak üzere yaygın olarak kullanılmaktadır . Niş uygulamalar için özel formatlara ek olarak, Microsoft'un Windows Media Video 9 veya VC-1 gibi çeşitli daha ucuz ve kısmen tescilli ana rakipler , On2'nin VPx serisinden çeşitli formatlar ve son zamanlarda bunların halefleri olan VP8 ve VP9 vardı. edildi Google tarafından satın . Theora'dan bu yana , başlangıçta daha az fark edilen ve teknik olarak daha düşük olan ücretsiz lisanslı formatlar bulma çabaları olmuştur. Google'ın VP8 (2008) ve VP9 (2012) sürümleriyle, burada önemli teknik gelişmeler yaşandı ve ücretsiz formatların performansı büyük ölçüde en son teknolojiyi yakaladı. İle Açık Medya Alliance , endüstri 2015'ten lisanssız video formatları geniş destek kurdu. Bu ittifak lisans gerektirmeyen yayınlanan AV1 2018 yılında VP9 başarır.

In 1950, Bell Laboratuarları yakında bir video kodlama uygulandı DPCM bir patent için başvuruda bulundu. Entropi kodlaması , 1950'de geliştirilen ve yaygın olarak kullanılan Huffman kodlamasının dayandığı Shannon-Fano kodlamasıyla 1940'larda başladı ; daha modern bağlam uyarlamalı aritmetik kodlama (CABAC) 1990'ların başında yayınlandı. Dönüşüm kodlaması ( Hadamard dönüşümü kullanılarak ) 1969'da tanıtıldı ve popüler ayrık kosinüs dönüşümü (DCT) 1974'te bilimsel literatürde ortaya çıktı.

Ayrıca bakınız

Edebiyat

  • Lajos L. Hanzo, Peter J. Cherriman, Jürgen Streit (Southampton Üniversitesi): Video sıkıştırma ve iletişim . Temel bilgilerden DVB için H.261, H.263, H.264, MPEG2, MPEG4 ve HSDPA tarzı uyarlanabilir turbo alıcı-vericiler. 2. Baskı. IEEE Press, 2007, ISBN 978-0-470-51849-6 .

İnternet linkleri

Commons : video sıkıştırma  - görüntüler, videolar ve ses dosyaları koleksiyonu

Bireysel kanıt

  1. İnsan gözünün çözünürlük algısının frekans bağımlılığını göstermek için test görüntüsü ( İnternet Arşivi'nde 30 Ekim 2007 tarihli Memento )
  2. Patent US2605361 : İletişim Sinyallerinin Diferansiyel Nicelendirilmesi. 29 Haziran 1950'de tescil edildi , 29 Temmuz 1952'de yayınlandı , mucit: C. Chapin Cutler.
  3. ^ Claude Elwood Shannon : Bir Matematiksel İletişim Teorisi . In: Alcatel-Lucent (Ed.): Bell System Technical Journal . bant 27 , hayır. 3-4 , 1948 (İngilizce).
  4. ^ David Albert Huffman : Minimum fazlalık kodlarının oluşturulması için bir yöntem . In: IRE Tutanakları . bant 40 , hayır. 9 Eylül 1952, s. 1098–1101 , doi : 10.1109 / JRPROC.1952.273898 (İngilizce, sıkıştırma.ru [PDF]).
  5. ^ CCITT Çalışma Grubu VIII ve ISO / IEC Ortak Teknik Komite 1 / Alt Komite 29 / Çalışma Grubu 10 Ortak Fotoğraf Uzmanları Grubu (JPEG): Tavsiye T.81 . Sürekli Tonlu Durağan Görüntülerin Dijital Sıkıştırılması ve Kodlanması - Gereksinimler ve yönergeler. Ed.: ITU-T. 1993, Ek D - Aritmetik kodlama, s. 54 ff . (İngilizce, w3.org [PDF; 7 Kasım 2009'da erişildi]).
  6. ^ William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", Proceedings of the IEEE 57.1 (1969): s. 58-68
  7. ^ Nasir Ahmed, T. Natarajan, Kamisetty Ramamohan Rao: Ayrık Kosinüs Dönüşümü . In: Bilgisayarlarda IEEE İşlemleri . C-23, hayır. 1 Ocak 1974, s. 90–93 , doi : 10.1109 / TC.1974.223784 (İngilizce, tu-berlin.de [PDF]).
  8. Uçurum Okuyucu: Telif ücretsiz video kodlama için patent ortamı . In: Society of Photo-Optical Instrumentation Engineers (Ed.): Applications of Digital Image Processing XXXIX . San Diego, California 31 Ağustos 2016 (İngilizce, ders kaydı, 3:05:10 ).