Görüntü tanıma

Görüntü tanıma ( İngilizce görüntü analizi ), örüntü tanıma ve görüntü işlemenin bir dalıdır . Görüntü tanımada, bir görüntüdeki nesneleri segmentlere ayırmaya çalışır . Bunlara sembolik bir açıklama atanır, ancak model analizinde olağan olduğu gibi nesneler arasındaki bağlantılar aranmaz .

tanım

Görüntü işleme bağlamında görüntü tanıma , yazılımın görüntülerdeki nesneleri, yerleri, insanları, yazıları ve eylemleri tanımlama yeteneğidir . Bilgisayarlar , görüntülerdeki nesnelere ulaşmak için bir kamera ve yapay zeka yazılımıyla birlikte görüntü işleme teknolojilerini kullanabilir .

İnsanların ve hayvanların beyinleri nesneleri kolayca tanıyorken, bilgisayarlar bu tür görevlerde hala zorluklar yaşamaktadır. Görüntü tanıma yazılımı , derinlemesine makine öğrenimi gerektirir . Yapay sinir ağı evrişim işlemcileri en iyi performansı gösterir, çünkü belirli bir görev aksi takdirde yoğun hesaplama özelliği nedeniyle muazzam donanım kaynakları gerektirir. Görüntü tanıma algoritmaları, karşılaştırmalı 3B modellerin , farklı açılardan görünümlerin kenar tanıma yardımıyla veya bileşenler yardımıyla çalışabilir . Bu tür algoritmalar genellikle önceden etiketlenmiş milyonlarca görüntü üzerinde makine tarafından eğitilir.

Başvurular

Dijital görüntü tanıma için sayısız uygulama alanı vardır:

  • Büyük görüntü veritabanlarında görüntülerdeki nesneleri otomatik olarak etiketleyin ve etiketleyin , e . B. flickr.com'da veya Google'ın sunduğu Cloud Vision API'de.
  • Medya ürünlerinin görüntülerini veya görüntü bölümlerini tanıyın ve bunları ilgili ürüne atayın. Ürünlerle ilgili bilgiler, örneğin içerik bilgileri, tür, atama, eleştiri, incelemeler veya fiyat karşılaştırmaları daha sonra sorgulanabilir.
  • yüz tanıma
  • Otonom robotları , sürücüsüz arabaları ve kaza önleme sistemlerini kontrol etmek.
  • Endüstride tescil işareti tanınırlığı. Mümkün olan en doğru montajı elde etmek için elektronik bileşenler ve tescil işaretleri ölçülür.
  • Sıralama ve hata tespiti, ör. B. toplu mallar, devre kartları, fotoğraf baskısı.
  • Nesne tabanlı görüntü analizi Bir coğrafya yöntemi olarak OBIA
  • Suç önleme için kamu gözetim kameralarının video veri akışlarındaki kişilerin "anormal davranışlarının" otomatik tespiti , tartışmalı AB projesi INDECT'e bakın
  • TapTapSee uygulamasıyla, kör insanlar çevrelerinin fotoğraflarını çekebilir. Sonra bir ses resimde görülebilen şeyi söylüyor. Örneğin, kör insanlar bir giysinin rengini bulabilir. Uygulama ücretsizdir, yani bu teknolojiyi kendiniz test edebilirsiniz.

Edebiyat

  • H. Niemann: Örüntü Analizi ve Anlama. Bilgi Bilimlerinde Springer Serisi, Berlin 1990
  • A. Pinz: Görüntüleri anlamak. Bilgisayar bilimleri ders kitapları, Springer-Verlag

İnternet linkleri

Bireysel kanıt

  1. TechTarget: görüntü tanıma
  2. Ücretsiz bir uygulama, körlere dünya chip.de'yi gösterir.