DNA dizisi analizi

Bir DNA dizi analizi de moleküler biyoloji ve biyoinformatik olduğu ve otomatik, bilgisayar destekli tespiti karakteristik bölümlerinin bilinen, özellikle de gen ve şüpheli gen bir ile, bir DNA dizisi . Bilgi elde gelen DNA dizilimi sekansı ve pozisyonu ile ilgili baz çifti incelenir . Bu aktivitenin sonuçlarına ek açıklamalar da denir , bu nedenle dizi analizi açıklama yöntemleriyle sınırlı değildir.

DNA dizilerinin analizi, büyük miktarda genomik verinin mevcudiyeti ve bunları yorumlama ihtiyacı ile koşullandırılmıştır . Nükleotid sekanslar için geliştirilmiş yöntemlerin bir çoğu, aynı zamanda, aynı şekilde ya da amino asit dizileri ile ilgili küçük modifikasyonlar, yani kullanılabilir primer yapısının bir protein . Çoğu sözde dizi algoritmalarına atanabilen yöntemler - biyolojiye özgü kısıtlamalar ihmal edilirse - herhangi bir simge dizisine bile aktarılabilir.

Sıra analizleri aşağıdaki problemlerle motive edilebilir:

  • Ne zaman sıralanması nispeten kısa dizilerin binlerce formunda elde edilmiş bir genom veri: Bu nasıl buluşmanızı koymak?
  • Analog genler , yani protein ürünleri benzer işlevlere sahip olan genler , farklı türlerde benzer modellere sahip olabilir; Homolog genler evrim sürecinde farklılaşabilir : Farelerdeki homolog genleri bilerek insanlarda bilinmeyen genler bulunabilir mi? Organizmalar genetik olarak birbirinden ne kadar uzakta? Ayrılmalarından bu yana soy ağacında ne kadar zaman geçti ?
  • İntronlar ve eksonların farklı kalıpları ve istatistikleri vardır ve gen kontrol bölgeleri genellikle yüksek oranda korunur: Bu alanlar otomatik olarak sadece model karşılaştırmaları ve n- tuple frekanslarının istatistiksel analizi yoluyla farklılaştırılabilir mi?
  • Büyük bir kısmı genomik DNA içermekte ve kodlamayan DNA , nispeten kısa ile karakterize edilir, çok sık tekrarlanan birimler ( tekrarlar ) ve böylece ne bu filtre yok arama algoritmaları olmayan yanlış veya yanıltıcı sonuçlar ile yanlış pozitif sonuç ?

Algoritmalar

Dize algoritmaları

En yaygın sorunlardan biri, bir veritabanında belirli kısmi dizilerin aranmasıdır. Tam eşleşmeleri ( dizi eşleştirme algoritmaları ) veya arama dizesinden belirli bir Levenshtein mesafesi içindeki tüm yaklaşık eşleşmeleri arayabilirsiniz. İngilizce konuşulan dünyada, iki dizenin bu uyarlamalarına dizi hizalamaları denir ve bu da tüm hizalama algoritmaları ailesine adlarını verir. Bu terim, çevrilmemiş biçimde Almanca'da giderek daha popüler hale geliyor. Şimdiye kadar en iyi bilinen hizalamalar, Needleman-Wunsch algoritması (global hizalama), Smith-Waterman algoritması (yerel hizalama) ve BLAST algoritmasıdır (sezgisel çift yönlü hizalama).

İnternet linkleri