Hesaplamalı dilbilimleri

In bilgisayarlı dil ( CL ) ya da dilsel veri işleme ( LDV nasıl) o incelenir doğal dil metin veya dil verilerinin şeklinde olabilir algoritmik işlem yardımı ile bilgisayara . Dilbilim ve bilgisayar bilimi arasındaki arayüzdür . İngiliz edebiyatı ve bilgisayar bilimlerinde, doğal dil işleme (NLP) terimi kullanılmaktadır .

Öykü

Hesaplamalı dilbilim bir terim olarak (veya başka bir ifadeyle) 1960'lara kadar izlenebilir. Yapay zekanın başlamasıyla birlikte, görev zaten belliydi. Noam Chomsky'nin 1957 tarihli Sözdizimsel Yapıları , dili uygun bir şekilde yeni bir biçimsel çerçeve içinde sundu. Buna Saul Kripke ve Richard Montague'nin dil mantığı da eklendi . Bir kısmı ABD savunma bütçesinden büyük ölçüde finanse edilen araştırma, umulan atılımları üretmedi. Chomsky ve Joseph Weizenbaum, özellikle dil çevirisinin otomasyonu konusundaki beklentileri azalttı. Bilimin davranışçıdan zihinsel (Chomsky) kavramlarına geçişi, bilişsel bilimlerdeki kapsamlı kavramlar izledi .

Yetmişlerde, başlığında hesaplamalı dilbilim terimi bulunan yayınlar giderek daha sık ortaya çıktı . Halihazırda tefsir uygulamalarında (uyumlar, kelime ve form istatistikleri) finansal olarak pahalı girişimlerde bulunulmuştur, ancak aynı zamanda makine dili analizi ve çevirileri üzerine daha büyük projeler de olmuştur. Almanya'daki ilk hesaplamalı dilbilim kursları Saarland Üniversitesi'nde ve Stuttgart'ta kuruldu . Hesaplamalı dilbilim, kişisel bilgisayarların yaygınlaşması ve İnternet'in ortaya çıkmasıyla yeni uygulama alanları kazandı . Özellikle insan dil davranışını ve onun İnternet'te ve onun aracılığıyla indüklediği dil oluşumlarını inceleyen İnternet dilbiliminin aksine, hesaplamalı dilbilim daha bilgilendirici ve pratik bir yönelime sahiptir. Bununla birlikte, konu klasik felsefi-dilbilimsel sorulardan tamamen vazgeçmedi ve bugün teorik ve pratik hesaplamalı dilbilim arasında bir ayrım yapılıyor.

Hesaplamalı dilbilim görevi

“Hesaplamalı dilbilim, doğal dillerin makine ile işlenmesini araştırır. Makineler tarafından sözlü ve yazılı dilin temsili, tanınması ve üretilmesinin teorik temellerini geliştirir. "

- Münih Ludwig Maximilians Üniversitesi

Saarbrücken boru hattı modeli

Bilgisayarlar dili ya ses bilgisi biçiminde (dil akustik ise) ya da harf dizileri biçiminde (dil yazılı biçimdeyse) görür. Dili çözümlemek için, bu ilk temsilden adım adım anlam doğrultusunda, çeşitli dilsel temsil düzeylerinden geçerek çalışılır. Pratik sistemlerde, bu adımlar tipik olarak sırayla gerçekleştirilir, bu nedenle boru hattı modelinden aşağıdaki adımlarla söz edilir:

ses tanıma
Metin sesli bilgi olarak mevcutsa, önce metin biçimine dönüştürülmelidir.
Tokenizasyon
Harf zinciri kelimelere, cümlelere vb.
Morfolojik analiz
Dilbilgisel bilgileri çıkarmak ve metindeki sözcükleri temel biçimlere kadar takip etmek için personel formları veya durum işaretleri analiz edilir, örn. B. sözlükte.
Sözdizimsel Analiz
Her cümlenin kelimeleri, cümledeki yapısal işlevleri için analiz edilir (örneğin, özne, nesne, değiştirici, makale, vb.).
anlamsal analiz
Cümlelere veya bölümlerine anlam verilir. Bu adım, anlamı kavramak zor olduğu için potansiyel olarak çok sayıda farklı bireysel adımı içerir.
Diyalog ve söylem analizi
Ardışık cümleler arasındaki ilişkiler tanınır. Diyalogda bu, örn. B. bir soru-cevap, söylemdeki bir ifade ve gerekçesi veya sınırlaması olmak.

Ancak, tüm hesaplamalı dilbilim süreçlerinin bu zincirin tamamından geçmesi söz konusu değildir. Makine öğrenimi süreçlerinin artan kullanımı, dilsel fenomenleri modellemek için kullanılabilecek analiz düzeylerinin her birinde istatistiksel düzenliliklerin var olduğu anlayışına yol açmıştır. Örneğin, birçok güncel makine çevirisi modeli sözdizimini yalnızca sınırlı bir ölçüde ve anlambilimi ise neredeyse hiç kullanır; bunun yerine, kendilerini sözcük düzeyindeki yazışma kalıplarını kullanmakla sınırlarlar.

Ölçeğin diğer ucunda, önce anlambilim, sonra sözdizimi ilkesiyle çalışan süreçler vardır . Göre bilişsel yönelimli dil işleme ile MultiNet paradigma dile özgü biçimbilimsel eklemelerle, esas olarak dil bağımsız semantik çekirdeği üzerine dayanan bir anlam tabanlı bir bilgisayar sözlüğü dayanır. Bu sözlük, anlamsal yapıların doğrudan üretilmesi için sözcük sınıfı kontrollü bir analizle ayrıştırma sırasında kullanılır .

Dil işleme sorunlarına örnekler

  • Sözdizimsel belirsizliklerin çözümü . Bazı durumlarda, bir cümle birkaç şekilde analiz edilebilir ve yorumlanabilir. Doğru olanı seçmek bazen söz edimi ve konuşmacının niyeti hakkında semantik bilgi gerektirir , ancak en azından kelimelerin ortak kullanımı hakkında istatistiksel ön bilgi gerektirir. Örnek: "Peter, Maria'yı dürbünle gördü" - burada, Peter'ın elinde dürbün tutan Maria'yı görüp görmediği veya Peter'ın Maria'yı dürbün yardımıyla görüp görmediği kesin değildir.
  • Belirleyin anlambilim . Aynı kelime biçimi, bağlama göre farklı bir anlama sahip olabilir ( anlamlı , çok anlamlılık karşılaştırın ). Kişi, bağlama uygun olan anlamı seçmelidir. Öte yandan, kelime anlamlarını temsil etmek için formalizmlere ihtiyacınız var.
  • Dilsel bir ifadenin amacını tanımak (bkz. pragmatik ). Bazı cümleler tam anlamıyla kastedilmemiştir. Örneğin, “Saatin kaç olduğunu söyler misiniz?” sorusuna “Evet” veya “Hayır” gibi bir yanıt beklenmez, saat hakkında bilgi istenir.

Uygulamadaki uygulamalar

Pratik hesaplamalı dilbilim , bazı üniversiteler tarafından sunulan kurslar yelpazesinde kendini kanıtlamış bir terimdir. Bu tür eğitim kursları, dil işleme makinelerinin ve programlarının BT bakımı ve geliştirilmesi için belirli iş tanımlarına yakındır . Bunlar, örneğin:

dersler

Hesaplamalı dilbilim, Almanca konuşulan ülkelerdeki çeşitli üniversitelerde bağımsız bir eğitim kursu olarak sunulmaktadır. Hesaplamalı dilbilim, Alman üniversite politikasında yan dal olarak sınıflandırılır . Lisans ve yüksek lisans derecesi mümkündür. En iyi bilinen teklifler arasında Bielefeld Üniversitesi, Ruprecht-Karls-Heidelberg Üniversitesi, Münih Ludwig-Maximilians-Üniversitesi, Potsdam Üniversitesi, Saarland Üniversitesi ve Trier Üniversitesi yer almaktadır.

Toplantılar

  • "Hesaplamalı Dilbilim Derneği (ACL)" yıllık konferansı
  • "COLING": 1965'ten beri iki yılda bir düzenlenen uluslararası konferans
  • "Hesaplamalı Dilbilimde Son Gelişmeler (RANLP)" 2001'den beri iki yılda bir bir yaz okulunda ortaya çıktı.
  • "Uluslararası Doğal Dil İşleme Konferansı (IJCLP)" 2004'ten beri Asya bölgesinde düzensiz aralıklarla düzenleniyor.
  • Yıllık " Öğrenci Konferansı Dilbilimi (StuTS)" - öğrenciler tarafından öğrenciler için üç ila dört günlük konferans;
  • 1992'den beri her yıl farklı bir üniversitede düzenlenen Almanca konuşulan üniversitelerin "Hesaplamalı Dilbilim Öğrencileri Konferansı (TaCoS)";
  • Her iki yılda bir "Dilsel Veri İşleme Derneği (GLDV)" veya (2008'den beri) "Dil Teknolojisi ve Hesaplamalı Dilbilim Derneği (GSCL)"nin yıllık konferansı.
  • "KONVENS - Doğal Dilin İşlenmesi Konferansı": 1992'den beri her iki yılda bir, dönüşümlü olarak ÖGAI, DGfS-CL ve GSCL şirketleri tarafından düzenlenen bir konferans

Organizasyonlar

Ayrıca bakınız

Edebiyat

  • James Allen: Doğal Dil Anlayışı . Benjamin / Cummings Yayıncılık Şirketi, Redwood City, CA 1995, ISBN 0-8053-0334-0 .
  • Kai-Uwe Carstensen, Christian Ebert, Cornelia Ebert, Susanne Jekat, Ralf Klabunde, Hagen Langer (ed.): Hesaplamalı Dilbilim ve Dil Teknolojisi. 3. Baskı. Spektrum Akademischer Verlag, Heidelberg 2010, ISBN 978-3-8274-2023-7 .
  • Roland Hausser: Hesaplamalı Dilbilimin Temelleri: Doğal Dilde İnsan-Bilgisayar İletişimi. 3. Baskı. Springer, 2014, ISBN 978-3-642-41430-5 .
  • Nitin Indurkhya, Fred J. Damerau: Doğal Dil İşleme El Kitabı. 2. Baskı. Chapman ve Hall / CRC, 2010, ISBN 978-1-4200-8592-1 .
  • Daniel Jurafsky, James H. Martin: Konuşma ve Dil İşleme - Doğal Dil İşleme, Hesaplamalı Dilbilim ve Konuşma Tanımaya Giriş. 2. Baskı. Prentice Hall, Upper Saddle River, New Jersey 2008, ISBN 978-0-13-187321-6 .
  • Henning Lobin: Hesaplamalı Dilbilim ve Metin Teknolojisi. Fink, Paderborn / Münih 2010, ISBN 978-3-8252-3282-5 .
  • Christopher D. Manning, Hinrich Schütze: İstatistiksel Doğal Dil İşlemenin Temelleri. MIT Press, Cambridge / MA 1999, ISBN 0-262-13360-1 .
  • Ruslan Mitkov (Ed.): The Oxford Handbook of Computational Linguistics. Oxford University Press, 2003, ISBN 0-19-823882-7 .

İnternet linkleri

Vikisözlük: Hesaplamalı Dilbilim  - anlamların açıklamaları, kelime kökenleri, eş anlamlılar, çeviriler

Bireysel kanıt

  1. ^ I. Bátori, J. Krause, HD Lutz (ed.): Dilsel veri işleme. Bilgi dilbilimi ve yapay zeka alanındaki konumu belirlemeye çalışmak. Niemeyer Verlag, Tübingen 1982.
  2. David Crystal , 1960'ların ortalarında medyada ve makalelerinde bu konuda birkaç kez yorum yaptı. Alan Turing geleneği 1930'lardan beri İngiltere'de de öldürücüydü.
  3. BDT BİLGİSAYAR DİLLERİ. (PDF) Bilgi ve Dil Arabuluculuğu Merkezi, Ludwig Maximilians Münih Üniversitesi, 10 Kasım 2015'te erişildi .
  4. Hans Uszkoreit: VL Dil İşlemede Hesaplamalı Dilbilim, Temsil ve Süreçlere Giriş.
  5. Peter Kolb: İstatistiksel makine çevirisi nedir? ( Memento 4 Mart 2011'den itibaren de Internet Archive )
  6. ^ Hermann Helbig : Bilgi Temsili ve Doğal Dilin Semantiği . Springer, Berlin 2006, ISBN 978-3-540-24461-5 .
  7. Thiemo Wambsganss, Christina Niklaus, Matthias Cetto, Matthias Söllner, Siegfried Handschuh: AL: Argümantasyon Becerileri için Uyarlanabilir Öğrenme Destek Sistemi . İçinde: Bilgisayar Sistemlerinde İnsan Faktörleri Üzerine 2020 CHI Konferansı Bildiriler Kitabı . ACM, Honolulu HI ABD 2020, ISBN 978-1-4503-6708-0 , s. 1-14 , doi : 10.1145 / 3313831.3376732 ( acm.org [11 Mart 2021'de erişildi]).
  8. Küçük konular: Kleine Fächer portalında hesaplamalı dilbilim. 23 Nisan 2019'da alındı .
  9. StudiScan: Hesaplamalı Dilbilim alanında yüksek lisans derecesi - 17 yüksek lisans programı. 31 Ocak 2019'da erişildi .
  10. ^ ACL 2018: Hesaplamalı Dilbilim Derneği'nin 56. Yıllık Toplantısı. 30 Ocak 2019'da erişildi .
  11. 27. Uluslararası Hesaplamalı Dilbilim Konferansı (COLING 2018). Erişim tarihi: 30 Ocak 2019 (Amerikan İngilizcesi).
  12. ^ Dil Modelleme ve Bilgi İşleme Bölümü: Etkinlikler. 30 Ocak 2019'da erişildi .
  13. IJCNLP: Giriş ( Memento 15 Temmuz 2013 tarihinden itibaren de Internet Archive )
  14. ^ Doğal Dil İşlemede Deneysel Yöntemler Konferansı & Doğal Dil İşleme Uluslararası Ortak Konferansı 2019. İçinde: emnlp-ijcnlp2019.org. 19 Şubat 2019'da alındı .
  15. ^ Avusturya Yapay Zeka Derneği (ÖGAI). 30 Ocak 2019'da erişildi .
  16. ^ Avusturya Yapay Zeka Derneği (ÖGAI). 30 Ocak 2019'da erişildi .