DNA’dan Protein’lere Proteinler, çok sayıda amino asit (50-3000 tane) biriminden oluşmaktadır. Amino asitlerde, amino grubu (- NH 2 ), asit grubu (- COOH karboksil grubu) ve zincir rezidüsü (kalan) denen bir kimyasal grup (R) bulunmaktadır. Bu gruplar merkezde bulunan ve α karbonu denen bir karbon atomuna ( Cα ) bağlıdır. Amino grubu Karboksil grubu H O H N C C OH H R Cα Atomu Doğadaki canlılarda, R zincir rezidüsüne göre 20 çeşit amino asit bulunmaktadır (1986 da 21. ve 2002 de 22. amino asit tespit edilmiştir). Aşağıdaki tabloda, proteinlerde bulunan 20 amino asitin kodları ( 1 harfli ve 3 harfli), hidrofobiklik değeri (polar requirement)ve hidrofob (H) ya da hidrofil, yani polar (P) olup olmadıkları yer almaktadır. Amino Asit Alanine Arginine Asparagine Aspartic acid Asparagine Cysteine Glutamine Glutamic acid Glutamine Glycine Histidine Isoleucine Leucine Lysine Methionine Phenylalanine Proline Serine Threonine Trytophan Tyrosine Valine Kod (1 karakterli) A R N D B C Q E Z G H I L K M F P S T W Y Z Kod (3 karakterli) Ala Arg Asn Asp Asx Cys Gln Glu Glx Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val Polar req. 7.0 9.1 10.0 13.0 4.8 8.6 12.5 7.9 8.4 4.9 4.9 10.1 5.3 5.0 6.6 7.5 6.6 5.2 5.4 5.6 H/P H P P P P P P P P P P H H P H H H P P H P H Genetik kod: Canlı hücrelerde, DNA ve karşılığı RNA molekülündeki nükleotid dizilişi ile sentezlenecek proteinler arasındaki bağı sağlayan kurallar topluluğudur. Genetik kod; kodon → amino asit paradigması üzerine kuruludur. Genetik kod, üç nükleotidlik bir dizi parçasından amino asitler kümesine tanımlı bir fonksiyondur. Bu fonksiyon DNA için, c : { A, C , G, T } × { A, C , G, T } × { A, C , G, T } → AminoAsitler ve RNA için, c : { A, C , G,U } × { A, C , G, U } × { A, C , G,U } → AminoAsitler dır. James Watson, Francis Crick, Maurice Wilkins ve Rosalind Franklin tarafından DNA ‘nın yapısı keşfedildikten sonra proteinlerin kodlanması üzerine başlayan çalışmalar sırasında George Gamov, 20 farklı amino asitin kodlanması için üç harflik bir kod’un kullanılması gerektiğini ifade etmiştir. A,C,G,T harflerinden oluşan 4 harflik bir alfabe ile 20 farklı kelime yazabilmek için kelimeler en az üç harfli olmalıdır. Kodonların üç DNA nükleotidinden oluştuğunu deneysel olarak ilk Crick, Brenner ve arkadaşları göstermiştir. Genetik kod, aralarında ayırma işareti bulunmayan ve örtüşmeyen, üç harfli kelimelerden (kodonlardan) oluşan bir kod’dur. DNA veya RNA molekülündeki birimlerin diziliş biçiminde hücrenin hangi proteini üreteceğini bildiren bir şifre gizlidir. Bazı istisnalar dışında tüm canlılar Standart Genetik Kod denen aynı genetik kodu kullanmaktadır. DNA için bu kodu I.Y.Yonemoto tablosunda (http://en.wikipedia.org/wiki/Image:GeneticCode21.svg)ve RNA için aşağıda görebilirsiniz. U C A G U Phe (UUU) Phe (UUC) Leu (UUA) Leu (UUG) Leu (CUU) Leu (CUC) Leu (CUA) Leu (CUG) Ile ( AUU) Ile (AUC) Ile (AUA) Met (AUG) Val (GAU) Val (GAC) Val (GAA) Val (GAG) C Ser (UCU) Ser (UCC) Ser (UCA) Ser (UCG) Pro (CCU) Pro (CCC) Pro (CCA) Pro (CCG) Thr (ACU) Thr (ACC) Thr (ACA) Thr (ACG) Ala (GCU) Ala (GCC) Ala (GCA) Ala (GCG) A Tyr (UAU) Tyr (UAC) Stop(UAA) Stop(UAG) His (CAU) His (CAC) Gln (CAA) Gln (CAG) Asn (AAU) Asn (AAC) Lys (AAA) Lys (AAG) Asp (GAU) Asp (GAC) Glu (GAA) Glu (GAG) G Cys (UGU) Cys (UGC) Stop(UGA) Trp (AGG) Arg (CGU) Arg (CGC) Arg (CGA) Arg (CGG) Ser (AGU) Ser (AGC) Arg (AGA) Arg (AGG) Gly (GGU) Gly (GGC) Gly (GGA) Gly (GGG) U C A G U C A G U C A G U C A G Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG Asn/N AAU, AAC Met/M AUG Asp/D GAU, GAC Phe/F UUU, UUC Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG Gly/G GGU, GGC, GGA, GGG Trp/W UGG His/H CAU, CAC Tyr/Y UAU, UAC Val/V GUU, GUC, GUA, GUG STOP UAG, UGA, UAA Ile/I AUU, AUC, AUA START AUG Bir amino asit için birden çok kod bulunmaktadır. Aynı aminoasiti belirleyen kodların ilk iki harfi aynıdır. RNA boyunca üçlü gruplar halinde bulunan ve protein sentezleme sırasında üretilen aminoasit dizilerinin düzenini belirleyen nükleotid dizileri, kalıtsal olarak DNA molekülü tarafından belirlenmektedir. Vücudumuz genlerden aldığı bilgiye göre gerekli olan proteinleri ne zaman ve ne şekilde üreteceğine karar verir. Hangi genin hangi proteini kodlayacağı belirlidir. Protein sentezi, bir biyokimyasal süreç olup, transkripsiyon ile başlayıp translasyonla biten çok aşamalı bir süreçtir. Bir protein için DNA molekülü üzerindeki okuma çerçevesi sürekli değildir. Bu çerçeve aşağıda görüldüğü gibi intron bölgeleri tarafından kesilmektedir. Đntronlar arasında bilgiyi taşıyan ekzonlar (exons) yer almaktadır. Đntronlar 1977 yılında P.A. Sharp ile R.J. Roberts tarafından keşfedilmiştir ve daha sonra kendilerine Nobel ödülü kazandırmıştır. Đnsan genomunun, yani DNA ‘nın yaklaşık %1.5 ‘lik kısmı (yaklaşık 25,000 gen) protein kodlamaktadır. Protein kodlamayan DNA dizisindeki bölgeler intronlardaki DNA, bazı tekrarlanan DNA (repetitif DNA) ve Alu elemetleridir. Đnsan genomunun kodlayıcı olmayan büyük kısmı intronlardadır. Repetitif DNA genomun yaklaşık %15 dir. Bunun 1/3 genellikle 1. kromozomdan kopyalanmış büyük parça tekrarlarıdır. Alu elementleri genomun yaklaşık %10 kadardır. Birbiri ardına eklenen genlerinin %5 ‘i Alu parçalarına sahiptir. Alu genoma rastgele girmiş bir genomik parazit gibidir. Her 100-200 doğumda yeni bir Alu giriş olabilmektedir. Đntronlar, kendiliğinden veya enzimler tarafından katalize olarak transkripsiyon esnasında düşüp ayrılmaktadırlar (splicing). Đntron-ekzon bağlanma yerlerini belirlemek biyoinformatikte önemli problemlerden biridir. Đntronların ayrılmasını takiben noktasal olarak diziye nükleotid girebilir veya diziden kopabilir. Bu olay kılavuz (guide) RNA tarafından (gRNA tarafından) gözden geçirilmektedir (RNA editing). Prokaryotlarda çekirdek zarının olmaması, transkripsiyon ve taranslasyonun aynı anda olmasını sağlar. Ökaryot Hücre Çekirdek Prokaryot Hücre DNA Kromozom Transkripsiyon (Transcription) DNA Transkripsiyon mRNA Translasyon Splicing mRNA Translasyon (Translation) Protein Protein Transkripsiyon için DNA çift sarmalının sadece bir ipliği gereklidir. Bu ipliğe kalıp iplik denir. Transkripsiyon başlatma (initiation) ile başlar. Transkripsiyonun başlangıç noktasını tayin eden RNA polimeraz enzimi DNA üzerinde belirli bir bölgeye bağlanır. Bu bağlanma bölgesine promotor denir. RNA polimeraz promotora bağlandığında, DNA iplikleri açılmaya başlar. Đkinci aşama uzamadır (elongation). RNA polimeraz, kodlamayan kalıp iplik üzerinde dolaşırken bir ribonükleotid polimeri sentezler. RNA polimeraz kodlayıcı ipliği kullanmaz çünkü herhangi bir ipliğin kopyası, kopyalanan ipliğin komplementer (tümleyen) baz dizisini üretir. Polimeraz sonlanma (termination) aşamasına geldiğinde yeni sentezlenen mRNA'nın sitoplazma ve endoplazmik retikulum dahil birçok hücre bölgesine ulaşması için değişikliğe uğraması gerekmektedir. Yıkılmasını önlemek için mRNA'ya 5' cap eklenir. Kalıp olmak ve daha sonra işlenmesini sağlamak için 3' ucuna bir poly-A kuyruğu eklenir. Ökaryotlardaki hayati önem taşıyan splicing olayı bu aşamada gerçekleşmektedir. Ökaryot hücrelerde, çekirdek zarından geçerek sitoplazmaya ulaşan mRNA translasyona uğramaktadır. mRNA da yer alan kodonların taşıdığı genetik mesaj ribozomlarda adım adım deşifre edilerek uygun amino asitler tRNA vasıtasıyla ribosoma getirilir. Ribosomlar, aşağı yukarı 20nm (200 Ångström) çapında olup, %65 ribosomal RNA ve 35% ribosomal proteinlerden oluşmaktadırlar. Ribozomlar birbirine uyan ve birlikte çalışan iki altbirimden oluşmaktadır. Büyük (1) ve küçük (2) altbirimler. Atomic structure of the 30S Subunit from Thermus thermophilus. Proteins are shown in blue and the single RNA strand in orange.[5] Ribozomlar protein sentezlerinin yapıldığı merkezlerdir. Transfer RNA (kısaca tRNA), translasyon sırasında protein sentezindeki ribozomal bölgedeki büyüyen polipeptid zincirine özel amino asitleri ekleyen küçük, yaklaşık 80 nükleptidlik bir RNA zinciridir. Hücre sitoplazmasında 20 çeşit aminoasit tRNA ların bağlanabilecekleri çeşitli bölgeler bulunur ve amino asitlerini bırakan tRNA’lar ribozomlardan ayrılırken polipeptid zinciri de sentezlenmiş olurlar. tRNA’lar üzerinde yer alan nükleotitlere antikodon adı verilir. Örneğin, UUU şeklinde olan bir mRNA zincirine uyan tRNA antikodonunun nükleotid sırası AAA şeklindedir. mRNA’nın (1) ribozom tarafından (2) polypeptide zincirine (3) translasyonu. mRNA start kodonu (AUG) ile başlamakta ve stop kodonu (UAG) ile bitmekte Proteinler har zaman N-ucundan C-ucuna doğru biyosentezlenir. Yeni sentezlenen proteinler, etkinleştirme moleküllerine bağlanıp, değişikliğe uğradıktan sonra aktif hale gelmektedirler. Proteinler tam olarak rijid (kaskatı) moleküller değillerdir. Proteinler biyolojik işlevlerini yerine getirirken belli üçüncül ve dördüncül yapılanmalar arasında gelip gidebilirler. Bu yapılanmalara konformasyonlar ve geçişlere konformasyon değişimleri denir. Cytochrome c proteininin sürekli oynayan dinamik NMR yapıları (Büyük boy görüntü). Proteinlerin yapı taşları olan amino asitler molekül ölçüleri, elektrik yükleri ve başka özellikleri bakımından çok değişik kimyasal özelliklere sahiptir. Bir hücrede bulunan proteinlerin tamamına onun proteomu adı verilir. Proteinler vücuttaki pek çok işlevi yerine getiren moleküllerdir. Haberleri taşırlar, reaksiyonları katalizlerler, hücrelerin içinde yer alırlar. Proteinler olmadan yaşam olmaz. Proteinlerdeki amino asitlerin ne şekilde dizilip protein oluşturacaklarının şifresi DNA’da bulunmaktadır. DNA’da bulunan ve hangi proteinin ne şekilde üretileceğini söyleyenler ise genlerdir. Ancak tüm enformasyon sadece genetik koddan ibaret değildir. Tüm organizmaların DNA’larında düzenleyici dizi parçaları ve genler arası segmanlar bulunmaktadır. Bunların ve kromozomal yapılanmaların da fenotiplerin oluşmasında önemli katkılar olmaktadır. Ayrıca bu kodon → amino asit paradigması kadar tekdüze değildir. katkının işleyişi, iyi bilinen Biyolojik sistemlerde informasyon akışı (Wikipedia)