Derlem Dilbilimi

Korpus dilbilim bir alandır dilbilim . İçinde, genel olarak dil veya belirli bireysel diller hakkında yeni bilgiler elde edilir veya mevcut hipotezler, özel metin külliyatının veya (daha az sıklıkla) konuşulan dilin külliyatının analizinden elde edilen nicel veya nitel verilerle kontrol edilir. temel . Derlem dilbilimi, 1990'ların ikinci yarısından itibaren Almanca konuşulan ülkelerde yaygınlaştı. Bir kaynaktan bilgibilimsel alanına görünümü, bu karşılık gelen generativismzıt. Derlem dilbiliminin bir yöntem mi yoksa dilbilimin ayrı bir dalı mı olduğu hâlâ tartışmalıdır.

Veri materyali ve araştırma konusu

Derlem dilbiliminin konusu, çeşitli tezahürlerinde dildir. Derlem dilbilimi, büyük derlemlerde belgelenen özgün dil verilerinin kullanımı ile karakterize edilir. Bu tür metin külliyatları, belirli kriterlere ve belirli bir araştırma amacına göre derlenen dilsel ifadelerin koleksiyonlarıdır. Derlem dilbiliminin bulguları bu nedenle bir dilin doğal ifadelerine, yani gerçekte kullanıldığı şekliyle dile dayanır. Bu sözler ya yazılı olabilir ya da kendiliğinden ya da konuşma dilini ortaya çıkarabilir. Çoğu derlem artık dijital biçimde mevcuttur ve belirli yazılımlar kullanılarak dil araştırmaları için kullanılabilir.

Derlem dilbiliminin amacı, bu verileri ya var olan dilsel hipotezleri kontrol etmek (doğrulamak ya da çürütmek) için kullanmak ya da keşifsel veri analizi yoluyla konu hakkında yeni hipotezler ve teoriler kazanmaktır. İlk durumda, "derlemi temelli" dilbilimsel analizden ve ikinci durumda "bütünce tabanlı" dilbilimsel analizden söz edilir.

Derlem dilsel meseleler, hem dilsel sistemin kendisini ( Ferdinand de Saussure'e göre “ Langue ” veya Noam Chomsky'ye göre “ Yetkinlik ” ) hem de dilin kullanımını (de Saussure'a göre “Parole” veya Chomsky'ye göre “Performans”) ilgilendirmektedir. Bu nedenle, derlem dilbilimi, dilbilime egemen olan ikili dil görüşünü ortadan kaldırma sürecindedir .

Dil sistemiyle ilgili tipik bir soru, örneğin:

  • Kurşun Can için-up bir Alman cümle birden çok kez doldurulacak? Eğer öyleyse, cümlenin hangi bölümleriyle? Çoklu apron çalıştırma olanaklarını tanımlayabilecek kurallar var mı?

Dilin kullanımına ilişkin tipik sorular şunları içerir:

  • E-posta metinlerinde geleneksel mektuplara göre daha fazla yazım hatası var mı? Ne tür hatalar e-postaların özelliğidir?
  • Almanca öğrenenler (farklı kaynak diller) belirli bir düzeyde özellikle hangi hataları yapıyor, bu öğrenciler belirli kelimelerden veya dilbilgisi yapılarından kaçınıyor mu?

Derlem dilbiliminin yanıtlamaya çalıştığı çok sayıda araştırma sorusu durumunda, aşağıdaki sorular gibi bir olgunun iki alandan hangisine langue ve parole atanacağına açıkça karar vermek mümkün değildir:

  • “Saç” ismi tipik olarak hangi sıfatlarla birlikte geçer?
  • Parçacıklar sözlü dilde yazılı dile göre daha mı sık, daha az veya farklı mı kullanılıyor?

Çünkü “saçlı” sıfatların ve kipli edatların dağılımı bir yanda belli bir dilin fenomeni olarak ya da -diğer dillerle kıyaslandığında- genel olarak dilin bir özelliği olarak kabul edilebilirken, diğer yanda el aynı zamanda belirli bir dilsel kullanımın sonucu olarak da kabul edilebilir.

(Almanca için Lemnitzer / Zinsmeister'in (2010) ve İngilizce için McEnery / Xiao / Tono'nun (2006) çalışması, derlem dilbilim araştırmasının yönleri hakkında bir fikir vermektedir.)

metodolojik sorunlar

Derlem dilbiliminde önemli bir metodolojik sorun, veri tabanı yani derlem ile incelenen nesne arasındaki ilişkidir. Teorik olarak, veritabanı bugün hala kullanılan bir dil olsaydı konuyu tamamen kapsayabilirdi. Bununla birlikte, örneğin ilgili olduğu nesne pratikte bir bütün olarak - yani belirli bir dil veya belirli bir dilsel kullanım - kaydedilemeyeceğinden, bir derlem çıkarımsal istatistik anlamında geçerli bir örnek olarak kabul edilemez. Bugün, incelenen nesne için bir derlemi (başlangıçta gerektiği gibi) istatistiksel anlamda "temsilci" olarak adlandırmaktan ve yalnızca külliyat temelinde elde edilen bulguları geçici olarak makul olarak değerlendirmekten kaçınılmaktadır. Büyük derlemlerin derlenmesi bu nedenle "dengeli" olmalıdır, yani belirli bir oranda farklı metin türlerinden oluşmalıdır.

Derlem dilbiliminin, dil hakkındaki bilginin gerçek dilsel ifadeler temelinde elde edilebileceği veya kontrol edilebileceği şeklindeki temel varsayımı, beraberinde iki metodolojik sorun veya itiraz daha getirir:

  1. Yanıltıcı olumlu kanıtlar: Spontane konuşmalarda ve dikkatli bir şekilde formüle edilmiş yazılı ifadelerde bile, dilsel normdan bir dereceye kadar sapmalar meydana gelebilir. Bir bütünceyi incelerken, belirli bir dilsel fenomenin (çoğunlukla küçük) bir miktarının, dilin fiilen var olan sistematik kullanımının bir ifadesi olup olmadığına ve dolayısıyla bir dilbilim tezini destekleyip desteklemediğine veya bu kanıtın bu kanıtın bir dilbilimsel tezi destekleyip desteklemediğine karar vermek bireysel durumlarda zor olabilir. normdan sapma veya yanlış olarak kabul edilir Dil kullanımını görmelisiniz.
  2. Olumsuz kanıt: Bazı dil yapılarının kullanımı çok nadir ise, dilsel fenomenlerle ilgili birçok ifade, çok büyük derlemlerde bile doğrulanamaz. Bununla birlikte, külliyatta böyle bir rağbet gören yapının olmaması, onun var olmadığı ya da dilbilgisel olmadığı anlamına gelmez.

İlk durumda, derlem analizi yoluyla elde edilen sonuçlar paralel bir konuşmacı anketi ile desteklenmeye çalışılabilir. İkinci durumda, yalnızca daha fazla verinin araştırılması veya son çare olarak bir konuşmacı anketi de yardımcı olur.

Derlem Dilbilim ve Üretken Dilbilgisi

Derlem dilbilimi, doğal dillerin kullanımına dayanır. Bir olan indüktif kazanmak için / deneysel yöntemi bilgi gözlem nesnesi ile ilgili genel bir ifade formülasyonu mümkün potansiyel olarak çok sayıda somut tek tek örnek olarak: dil hakkında. Bu prosedür (" özelden genele "), tüm bilgilerin deneyime dayandığını varsayan ampirizme atanabilir . Bunun aksine , felsefi rasyonalizm geleneğinden türetilen tümdengelim yöntemidir : belirli bir dilsel fenomenin neye benzediğinin değerlendirilmesinden başlayarak, dillerde onu doğrulamak için kanıt bulmaya çalışılır ("dan genelden özele").

Derlem dilbilimini temel olarak Noam Chomsky ve onun ardılları tarafından kurulan ve belirtilen amacı aynı zamanda yetkin konuşmacının dil becerilerini bilişsel bir başarı olarak incelemek olan üretici dönüşüm dilbilgisinden ayıran şey budur . Chomsky'nin kendisi, dilbilimsel bilgi kazanımı için özgün dil kanıtlarının değerini birkaç kez açıkça reddetmiştir. Otantik dil verilerinin, metin külliyatında mevcut olduğu gibi, dilin üretiminde hatalar her zaman meydana geldiğinden, performansı araştırmak için uygun olmadığını buldu. Bu nedenle, bu şekilde elde edilen verilere dayanarak dil sistemi hakkında geçerli bir açıklama yapılamaz. Bu nedenle Chomsky, sistematik olarak iç gözleme ve ana dili yetkin kişiler tarafından laboratuvar koşullarında ortaya çıkarılan konuşmacı yargılarına odaklandı. Derlem dilbilim ise Chomsky'nin temel olarak gördüğü dil yeterliliği ile dil performansı arasındaki farkı dikkate almaz.

Ancak son zamanlarda, bu iki konum arasında bir yakınsama gözlemlendi. Her iki kampta da insanlar artık kendi veri tabanlarına daha eleştirel bakıyorlar ve karşı tarafın tercih ettiği verileri en azından kendi bulgularını kontrol etmek için bir araç olarak kullanmaya hazırlar.

Tarihçe ve uygulama alanları

İngiliz dilinin yaygın kullanımı ve büyük önemi ile dilbilimde ampirik araştırmalar için genel olarak yüksek bir yakınlık, korpus dilbilim gibi bilgisayar destekli veri analizinin ilk olarak Anglo-Amerikan bölgesinde gelişmesinin iki nedenidir.

Oradaki modern korpus dilbilimi 1967'de Henry Kucera (1925-2010) ve Nelson Francis tarafından "Günümüz Amerikan İngilizcesinin Hesaplamalı Analizi" çalışmalarıyla kuruldu . Sonuçları "Brown Corpus" (tam olarak: "Brown University Standard Corpus of Present-Day American English") kullanılarak elde edildi. Bu başlangıçta yaklaşık 1 milyon kelimeden oluşuyordu. Bunu, 1980'lerde aynı büyüklükteki "Lund-Oslo-Bergen corpus" (LOB) gibi diğer İngilizce derlemler izledi. İngiliz Collins yayınevinde sözlükbilimsel çalışmanın bir parçası olarak bu sayıyı çok aşan bir metin külliyatı oluşturulmasıyla yeni bir dönüm noktasına ulaşıldı. Sonuç, "Collins Cobuild İngilizce Sözlüğü"nün ilk baskısı oldu. Bunu yeni bir ölçekte, bugün hala İngiliz İngilizcesi dil araştırmaları için referans külliyat olarak kullanılan, 100 milyon akan kelimeden oluşan dengeli bir “British National Corpus”un ticari olmayan yaratılması izledi. Bugün Amerikan Ulusal Corpus tarafından desteklenmektedir. Diğer bölgesel İngilizce çeşitleri , International Corpus of English'te (ICE) kayıtlıdır.

Alman korpus dilbiliminin öncüleri, Bonn Üniversitesi'ndeki İletişim Bilimi ve Fonetik Enstitüsü (IKP) ve Mannheim'daki Alman Dili Enstitüsü idi. Bugün, aşağıdaki Almanca konuşan korporalardan özellikle bahsedilmelidir:

  • Mannheim'daki Alman Dili Enstitüsü'ndeki birkaç milyar metin kelimesinden oluşan “Alman Referans Derlemi” (DeReKo)
  • Berlin-Brandenburg Bilimler Akademisi'ndeki "Alman Dilinin Dijital Sözlüğü"nün (DWDS) çekirdeği
  • Leipzig Üniversitesi'ndeki "Almanca kelime bilgisi" projesinin külliyatı (çoğunlukla çevrimiçi medyadan metinler)
  • Basel Üniversitesi'ndeki "İsviçre metin külliyatı" (20 milyon metin kelimesiyle)

Halkın ücretsiz olarak erişebildiği, garantili uzun süreli bakıma sahip bu corporalara ek olarak, birçok dil seviyesi ve Almanca çeşidi için çok sayıda özel corpora vardır. (Lemnitzer / Zinsmeister (2010) buna genel bir bakış sunar.)

Corpora Collins Cobuild projesinin örnek olarak, fakat aynı zamanda American Heritage Dictionary bir lexicography kullandığı göster (1969), kullanıcı sadece bu kuralcı (aynı olmalıdır bir kelime kullanılabilir), ama aynı zamanda tanımlayıcı (aynı olan bir sözcük aslında kullanılmış) açıklamalar sunmak istiyor. Kelime sıklığı istatistiklerinin nicel araştırmaları, birçok sözlük türü için lemma seçimini kontrol edebilir ve nesnelleştirebilir. Günümüzde corpora kullanımı Almanca sözlük yayıncılarında da yer almaktadır. Bazı sözcük bilgisi türleri, yalnızca büyük metin külliyatlarının analizi temelinde elde edilebilir (örneğin, zaman içinde kademeli sıklık profilleri), diğerleri, bireysel sözlükbilimcilerin dil yeterliliğinden ziyade derlemler tarafından daha iyi güvence altına alınabilir.

Corpora artık dil didaktiğinde araştırma temeli olarak giderek daha fazla kullanılmaktadır. Bir dilin gerçekte nasıl kullanıldığına ilişkin sonuçlara dayalı olarak, öğretim materyalleri de tasarlanır ve sözde öğrenen derlemleri , dil üretiminde hangi hataların hangi öğrenme aşamalarında geçerli olduğunu gösterir.

Özel dilbilimsel sorular için, bir dili bir bütün olarak kapsamayı amaçlayan referans külliyatlardan elbette çok daha küçük olan diğer özel derlemler artan ölçüde geliştirilmektedir. Örneğin, siyasette ve medyada dil kullanımına ilişkin çalışmalar var.

Derlem Dilbilim - Yöntem mi Disiplin mi?

Derlem dilbiliminin genel mi yoksa uygulamalı bir dilbilim yöntemi mi olduğu yoksa kendi başına bir dilbilim disiplinini mi temsil ettiği sorusu henüz kesin olarak yanıtlanmamıştır.

Teorik dilbilimden adli dilbilime kadar dilbilimin birçok dalının, çoğunlukla münhasıran olmasa da, yöntemsel olarak yansıtılmış bir şekilde ampirik, derlemle ilgili bir analiz tekniği kullanması, bir yöntem olarak değerlendirmenin lehinde konuşur. Bununla birlikte, korpus dilbiliminin gerçek bir nesnesi tanınamaz. Bununla birlikte, ona bağımsız bir bilimsel disiplin statüsü vermek isteniyorsa bu gerekli olacaktır.

Derlem dilbiliminin bağımsız bir disiplin olduğu değerlendirmesi, özellikle dilin kullanımını bilgi nesnesi olarak tanımlaması ve bu nedenle kendisini insan dil becerisine veya dilin genel yapılarına odaklanan dilbilim okullarından ayrı tutması gerçeğiyle desteklenir. semiyotik sisteme sahip olmak.

Bu temel düşünceden bağımsız olarak derlem dilbilim, akademik hayatta bir bilim dalı olarak kendini kabul ettirmiştir. Bu, birkaç tematik derginin, iki ciltlik bir kılavuzun (Lüdeling / Kytö 2008, 2009) ve Birmingham Üniversitesi ile Berlin Humboldt Üniversitesi'nde iki özel kürsünün varlığı ile gösterilir.

Edebiyat

Baskı ünitesi
  • Andrea Abel, Renata Zanin: Öğretim ve araştırmadaki kurumlar. Bozen-Bolzano University Press, Bozen 2011, ISBN 978-88-6046-040-0 .
  • Noah Bubenhofer: Kullanım şekli . Bir söylem ve kültürel analiz yöntemi olarak derlem dilbilimi. de Gruyter, Berlin / New York 2009, ISBN 978-3-11-021584-7 .
  • Noam Chomsky : Dil Bilgisi. Praeger, New York 1986.
  • Reinhard Fiehler , Peter Wagener: Sözlü Almanca Veritabanı (DGD). In: Konuşma Araştırması - Sözlü Etkileşim için Çevrimiçi Dergi. Cilt 6, 2005, sayfa 136-147.
  • Hagen Hirschmann: Derlem Dilbilimi. Bir giriş . Metzler Verlag, Stuttgart 2019, ISBN 978-3-476-05493-7 .
  • Werner Kallmeyer, Gisela Zifonun (Hrsg.): Dil külliyatı - veri miktarı ve bilgideki ilerleme. (= IDS yıllığı. 2006). de Gruyter, Berlin / New York 2007.
  • András Kertész, Csilla Rákosi: Dil Kuramlarında Veri ve Kanıt: Bir Araştırma İncelemesi. İçinde: A. Kertesz, Cs. Rákosi (Ed.): Dilsel Kanıtlara Yeni Yaklaşımlar. Pilot Çalışmalar / Dilsel Kanıtlara Yeni Yaklaşımlar. Pilot çalışmalar. Lang, Frankfurt am Main ve diğerleri 2008, s. 21–60.
  • Reinhard Köhler: Derlem Dilbilimi. Teorik ilkeler ve metodolojik bakış açıları hakkında. İçinde: LDV Forumu 20/2. (PDF; 5.4 MB). 2005, s. 1-16.
  • Snježana Kordić : Sırp-Hırvatçadaki ilgili yan tümce (=  Slav Dilbiliminde Lincom Studies . Volume 10 ). Lincom Europa, Münih 1999, ISBN 3-89586-573-7 , LCCN  2005-530314 , OCLC 47905097 , DNB 963264087 , s. 330 .
  • Lothar Lemnitzer, Heike Zinsmeister: Corpus dilbilimi. 2., gözden geçirilmiş baskı. Günter Narr Verlag, Tübingen 2010.
  • Winfried Borç Verenler: Yaklaşık 1970/1980'e kadar hesaplamalı sözlükbilim ve derlem dilbilimi. İçinde: RH Gouws, U. Heid, W. Schweickard, HE Wiegand (Ed.): Sözlükler - Uluslararası Sözlükbilim Ansiklopedisi. Ek Cilt: Elektronik ve Hesaplamalı Sözlükbilime Odaklanan Son Gelişmeler. de Gruyter Mouton, Berlin 2013, ISBN 978-3-11-214665-1 , s. 982-1000.
  • Anke Lüdeling, Merja Kytö: Corpus Linguistics. Uluslararası Bir El Kitabı. Cilt 1, de Gruyter, Berlin / New York 2008; Cilt 2, 2009.
  • Tony McEnery, Andrew Wilson: Derlem dilbilimi: bir giriş. 2. Baskı. Edinburg Üniversitesi Yayınları, 2001.
  • Tony McEnery, Richard Xiao, Yukio Toni: Derlem Tabanlı Dil Çalışmaları: Gelişmiş bir kaynak kitap. Routledge, New York 2006, ISBN 0-415-28622-0 .
  • Rainer Perkuhn, Holger Keibel, Marc Kupietz: Corpus Linguistics . Fink / UTB, Paderborn 2012, ISBN 978-3-8252-3433-1 .
  • Carmen Scherer: Derlem Dilbilimi. (= Alman dilbilimine kısa girişler. Cilt 2). Kış, Heidelberg 2006.
  • P. Wagener, K.-H. Bausch (Ed.): Konuşulan Almancanın ses kayıtları. Dilbilimsel araştırma projeleri ve arşivlerinin varlıklarının belgelenmesi. (= Phonai. Cilt 40). Niemeyer, Tübingen 1997.
Çevrimiçi sürümler

İnternet linkleri

Vikisözlük: Derlem dilbilimi  - anlamların açıklamaları , kelime kökenleri, eş anlamlılar, çeviriler
Kurslar ve bağlantı listeleri
şirket
yazılım
  • CorpusExplorer - kolay hazırlık (100'den fazla dosya formatı), otomatik açıklama (60'tan fazla dilde) ve değerlendirme (40'tan fazla farklı analiz) için açık kaynaklı yazılım. Ayrıca CorpusExplorer için 5,5 milyardan fazla jeton içeren açıklamalı referans külliyatları (genel toplantı tutanakları, tarihi dil seviyeleri, yazılı/sözlü derlemler vb.) mevcuttur.

Bireysel kanıt

  1. ^ Snježana Kordić : Sırp-Hırvatça sözlük ve dilbilgisinin sınır alanındaki kelimeler (=  Slav Dilbiliminde Lincom Çalışmaları . Cilt 18 ). Lincom Europa, Münih 2001, ISBN 3-89586-954-6 , OCLC 42422661 , DNB 956417647 , s. 280 .
  2. ^ Burghard Rieger : Temsiliyet: bir terimin dilbilimsel korpus oluşumu sorununu karakterize etmek için uygunsuzluğundan. İçinde: H. Bergenholtz, B. Schaeder (Hrsg.): Empirische Textwissenschaft. Metin külliyatının yapısı ve değerlendirilmesi. (= Dilbilim ve iletişim çalışmaları üzerine monografiler. 39). Senaryo Yazarı, Königstein / Taunus 1979, s. 52-70.
  3. Bkz. Chomsky 1986.
  4. Kertész / Rákosi 2008 ve Lenderers 2013, tarihsel bir taslak sunar.