Biyoenformatik: Klinik Laborant Ne bilmeli ve Neye Hazırlıklı Olmalı

advertisement
Biyoenformatik:
Klinik Laborant Ne bilmeli ve Neye Hazırlıklı Olmalı
Moderatör: Gregory J. Tsongalis Uzmanlar: Elizabeth Chao, Jill M. Hagenkord, Tina Hambuch ve Jason
H. Moore
Geniş çaplı uygulamaları kapsayan yeni gelişen moleküler tanı teknolojilerinin klinik laboratuvarına
giriş rekor bir kızla gelişmiş ve bu alanda devrimsel değişikliklere yol açmıştır. Örneğin mikro dizilimler,
gelişme geriliği ve otizm ile ilişkili yapısal abnormalitelerin test edilmesinde ilk basamak testi olarak
düzenli kullanılmaktadır. Buna ek olarak her analiz için milyonlarca prob çalıştıran mikro dizilimler
spesifik klinik algoritmalarla birlikte geniş çaplı genotipleme ve gen ekspresyonu profillemesinde
kullanılmaktadır. Ayrıca yeni jenerasyon ya da çok büyük ölçekte paralel sekanslama (YNS)1 da
hedeflenmiş tam gen, ekzon ve genom sekanslama için klinik laboratuvarlarda düzenli kullanılmaya
başlanmıştır. Bu analizler tarafından üretilen veri miktarı eşsizdir ve bu veri setlerinin madenciliği,
analizi ve uygun şekilde depolanması tecrübeli biyoenformatik bilgisi gerektirmektedir. Klinik
laboratuvarların enformatik ve yüksek miktarda sonuç ile ilgili tecrübeleri olmasına rağmen bu
görevler için kullanılan sistemler omics2 çalışmalarından gelen verilerle ilgilenmede yetersizdir. Bu
S&C’ta omics çalışmaları için düzenli olarak biyoenformatikten yararlanan, akademi ve sektörden
birkaç lider araştırmacı biyoenformatiğin önemi ve klinik laboratuvarların bu çalışmaları yürütürken
ürettikleri verilerin artan miktarı ve kompleksitesi ile baş etmek için nasıl hazırlanabilecekleri
konularını tartışmaya davet edilmişlerdir.
Biyoenformatik ve biyoistatistik, azımsanmayacak farklarına rağmen sık sık birbirlerinin alternatifi
olarak kullanılmaktadır. Bu terimleri tanımlayıp biyoenformatiğin klinik laboratuvarı nasıl
etkileyebileceğini belirtir misiniz?
Elizabeth Chao: Biyoistatistik biyolojik konulara istatistik uygular.
Buradaki vurgu büyük popülasyonları kapsayan deneyleri
tasarlamak için istatistik kullanılmasındadır. Biyoistatistik
istatistiksel çıkarımlar yoluyla önemli sonuçları vurgular, yani
gürültüden sinyali ayırır. Diğer taraftan biyoenformatik, biyoloji,
bilgisayar bilimleri, uygulamalı matematik ve istatistiği tek bir
disiplinde birleştiren disiplinler arası modern bir bilimdir.
Biyoenformatiğin temel amacı biyolojik prosesleri çalışmak için
bilgisayar programları geliştirmek ve kullanmaktır. Farklılıklarına
rağmen hem biyoistatistik hem de biyoenformatik büyük veri
setlerinin analizinde bütünün ayrılmaz parçalarıdır. Klinik
laboratuvarlarda
biyoenformatik,
yüksek
girdi/çıktılı
enstrümanların ve genomik veri setlerinin girişlerini sağlamak
için vazgeçilmezdir.
1
2
YNS: Yeni Nesil Sekanslama (NGS: New Generation Sequencing)
omics: Biyolojide, İngilizcede –omics ile biten çalışmalara verilen informal isim (Ör. genomics,
proteomics veya metabolomics).
Jill M. Hagenkord: Bence biyoenformatik bilgisayar araçlarının
büyük, karmaşık veri setlerini çalışmada kullanılmasıdır.
Biyoenformatik oldukça disiplinler arasıdır ve biyoloji, kimya,
matematik, bilgisayar bilimleri istatistiğin bileşenlerini içerir.
Milyonlarca üst üste binen parçalı okumadan ekzonun DNA
sekanslamasını veya DNA sekanslama çeşidinin protein
fonksiyonu üzerine etkisini belirlemeyen algoritmalar, örnekler
arasındadır. Be biyoistatistiği, istatistiğin klinik deneylere
uygulanması olarak görüyorum – örneğin, bir çalışma nasıl yeteri
kadar güçlendirilebilir veya sonuçların istatistiksel anlamlılığı
nasıl ifade edilir.
Daha da fazla “çok büyük ölçüde paralel” test etme
yöntemlerinin
araştırma
laboratuvarlarından
klinik
laboratuvarlara geçiş yaptığını görmekteyiz. Temel olarak bilgisayarın içerisindeki kromozomları
bozulmuş DNA’dan bir mikro dizilime melezleştirilerek yeniden yapılandıran sitogenomik dizilimler,
hâlihazırda birçok yapısal genetik bozukluklar için ilk basamak testidir ve kanser uygulamalarında
kullanılmaya başlanmışlardır. YNS, genomların tamamı veya parçalarını sekanslamada
kullanılmaktadır – germlinelar, kanser ve mikroplar. Aslında patolojinin yakın zamanda YNS
analizlerinden etkilenmeyecek hiçbir alanı yoktur. Klinik genomik analizlerin tasarımları,
onaylanmaları, uygulanmaları ve yorumlanmaları patolojinin kapsamına girecektir ve her basamak
büyük ölçüde biyoenformatik gerektirmektedir. YNS’den alınan tüm veriler dijitaldir – temel olarak
düzlemleri bitlere çeviriyoruz ve sonrasında bunları bilgisayarda tekrar düzlem olarak görüntülüyoruz.
Statik veri ile karşılaştırıldığında, bu dijital bilgiler klinik laborantın veriyi klinik soru çerçevesinde her
hasta için yorumlamasına yardım eden ek algoritmalar ve veri tabanları ile ortak yüzeyde buluşmaya
hazırdır. Sorumlu patolojist veya laboratuvar bilim insanının her algoritmanın arkasındaki varsayımları
ve harici veri tabanlarının göreli güçlü yanları ile sınırlamalarını anlaması kritiktir. Her laboratuvarın
bir ya da daha fazla klinik biyoenformatikçi istihdam etmeye ihtiyaç duyması.
Tina Hambuch:Biyoenformatik, biyolojik veri setlerinin
işlenmesidir ve analitik prosesler gibi mantıksal prosesleri de
kapsar. Biyoistatistik, spesifik olarak modellerin/trendlerin özel
çeşitlerinin istatistiksel araçlar yoluyla tanımlanmasına
odaklanmış analitik proseslerin alt kümesidir. Veri yelpazesi
genişledikçe biyoenformatik daha da kritik hale gelir. Ayrıca
klinik laboratuvar biliminin, operatörler arası ve laboratuvarlar
arası performanslar yönünden daha standart ve nicel hale
gelmesine olanak sağlar. Ancak çok az klinik laboratuvar güçlü
biyoenformatik bağlara sahip olduğundan dolayı bu onlar için
kısa dönemde önemli bir mücadele olacaktır ve biyoenformatiğin
yanlış uygulamalarının tehlikeleri göz ardı edilemeyecek
derecededir. Örneğin genetik değişkenlerin farklı tiplerini
saptamak için farklı programlar optimize edilmiştir ve bunların
performansları büyük ölçüde değişebilir, bu yüzden verinin nasıl analiz edildiğini ve analizler için
kullanılan çeşitli araçların varsayımları ile optimizasyonlarını anlamak, bunların uygun uygulamaları
için kritiktir.
1
2
YNS: Yeni Nesil Sekanslama (NGS: New Generation Sequencing)
omics: Biyolojide, İngilizcede –omics ile biten çalışmalara verilen informal isim (Ör. genomics,
proteomics veya metabolomics).
Jason H. Moore: Biyoistatistik biyolojik ve biyomedikal
problemlere çözüm bulma amacıyla nokta tahmini ve hipotez
testi yaparken matematiği kullanan formal bir disiplindir. Nokta
tahmini, ortalama ve varyans ya da regresyon doğrusunun eğimi
gibi diğer ölçümler gibi popülasyon parametrelerinin doğru
tahminine odaklanır. Hipotez testi, sıfır hipotezinin testinden bir
ya da daha fazla parametre üzerinden çıkarım yapılması formal
prosesine odaklanır. Biyoistatistiğin temel kavram ve
yöntemlerini anlamak klinik laborantlar ve biyomedikal
bilimindeki diğer herkes için kritiktir. Biyoenformatik kompleks
biyomedikal problemlerle baş etmek için biyoistatistiği bilgisayar
bilimleri ile birleştiren görece yeni bir disiplindir.
Biyoenformatiğin geçmişi, DNA sekans verilerinin depolanma,
yönetilme ve analiz edilme ihtiyaçlarının doğduğu 1970’lere
dayanır. Sonrasında internetin ve ekonomik bilgisayarların yayılmasıyla 1990’larda ilerlemiştir.
Biyoenformatiğin büyük kısmıDNA sekanslama ve kütle spektrometresi gibi teknolojilerden alınan
yüksek-boyutlu verilerin analizi için yeni veri tabanları ile bilgisayımsal algoritmaların geliştirilmesi,
değerlendirilmesi ve uygulanmasına odaklanmıştır. Bu bilgisayar bilimleri ile bunun otomatik
öğrenme ve görüntüleme gibi alt disiplinlerine odaklanması biyoenformatiği biyoistatistikten ayıran
noktadır. Ancak iyi biyoenformatikçiler elverişli biyoistatistiksel yöntemleri analitik stratejilerine
entegre edebilirler. Hem biyoistatistik hem de biyoenformatik klinik laboratuvar kurulumu için
kritiktir. Örneğin, araştırma ya da klinik veri tabanları ile entegrasyon tarafından takip edilen
işlenmemiş verilerin depolanması için biyoenformatiğe ihtiyaç duyulurken klinik DNA örneklerinin
sekanslanması kalite kontrolü için formal biyoistatistiksel yöntemler gerekebilir.
Klinik laboratuvarlarda mikro dizilim ve YNS teknolojileri, büyük miktarda veri ürettiği bilinen tanı
araçlarını temsil etmekte. Veri analizi, depolaması ve madenciliği için seçenekler neler?
Elizabeth Chao: Klinik laboratuvarlar, büyük miktardaki verilerin yorumlanması ve iletimi için dâhili BT
programlama altyapıları barındırıyorlar. Satıcılar eşsiz laboratuvar ihtiyaçlarına hizmet etmesi için
çeşitli yüksek performanslı programlama ve depolama çözümleri sunan çözümler sağlıyorlar.
Jill M. Hagenkord: Sitogenomik mikro dizilimler yaklaşık bir gigabayt veri üretir ve tüm genom
sekanslama yaklaşık bir terabayt veri üretir. Ancak, işlenmemiş verilere çok nadir geri döneriz ve
bence yalnızca işlenmiş verilerin depolanması yeterlidir. Tüm insan genomu için işlenmiş veri yalnızca
birkaç gigabayttır ki bu miktarın depolanması ekonomik olarak oldukça mantıklıdır. Buna ek olarak
Doğa Ana genomların depolanmasının en ucuz yolunu zaten bulmuştur – buna DNA denir. Yani klinik
numuneler için işlenmiş veri dosyalarının depolanması ve sonrasında gerekli olabilecek nadir
durumlarda DNA’nın yeniden işlenmesi, işlenmemiş veriye kıyasla oldukça daha ucuzdur. Bu klinik
laboratuvarda alıştığımız yöntemden farklıdır fakat klinik numunelerden veri depolama gerekliliğinin
mantığını sürdürmektedir.
Başka bir düşünce ise genomik verinin “Bulut” uygulamalarında depolanması – işlenmiş ya da
işlenmemiş – ve gerektiğinde uzaktan erişim sağlanarak raporların yazılmasıdır. Final rapor hastanın
tıbbi kaydına geçer fakat genomik veri, 1996 yılı Sağlık Sigortası Taşınabilirliği ve Sorumluluğu Kanunu
(HIPAA) uyumlu bir veri tabanına koyulur. Eğer masrafları en aza indirilmek isterseniz DNA’yı klinik
dondurucunuzda saklayın ve işlenmiş veriyi Bulut’taki soğuk depoya koyun.
1
2
YNS: Yeni Nesil Sekanslama (NGS: New Generation Sequencing)
omics: Biyolojide, İngilizcede –omics ile biten çalışmalara verilen informal isim (Ör. genomics,
proteomics veya metabolomics).
Tina Hambuch: Birçok seçenek mevcuttur ve asıl zorluk bunlardan hangilerinin en uygun olanlar
olduğunu belirlemektir. Bu, o laboratuvarın veriyi nasıl kullanmaya çalıştığı ve hangi soruların
sorulduğuna bağlıdır. Bunu söylemişken ekleyelim, BAM (İkili dizilim/haritalama) ve VCF (değişken
çağrı formatı) gibi formatlar çevresinde standardizasyon her şeyi büyük ölçüde iyileştirecektir. Biz,
veri depolama için Isilon’u (EMC) ve veri analizi için bir Sun grid motorunu (hesaplama kümesi)
kullanıyoruz. Bazı ticari yazılım paketleri ulaşılabilir olsa da biz özel bir program ve komut dizisi setini
kullanıyoruz.
Jason M. Moore: DNA sekanslama analizi için en yaygın şekilde kullanılan iki araç Galaxy ve CLC
Genomics Workbench’tir. Galaxy, DNA sekans manipülasyonu, QC, dizilim, değişken saptama,
istatistiksel analiz, vb. için düzinelerce analiz aracı içeren ücretsiz web temelli bir yazılım paketidir.
DNA sekanslama analizi için hızlıca gelişmiş birincil kaynaklardan biridir. CLC Genomics Workbench,
neredeyse aynı işlevselliğe sahip daha sezgisel grafik kullanıcı ara yüzlü ticari bir yazılım paketidir.
Pahalı olmasına rağmen CLC Genomics Workbench biyoenformatikçi olmayanlara daha uygundur.
“Bulut” nedir? Bu veri depolama seçeneği, ekonomik endişeler, HIPAA ve diğer yasal konular
tarafından yönetilen laboratuvarlar için uygun mudur?
Elizabeth Chao:Bulut veri ve işleme imkânlarının daha kolay erişimini ve dağıtımını sağlar.
Hizmetlerine her zaman ulaşılabilir ve coğrafik olarak sınırsızdır. Dahası depolama ve işleme
imkânlarını şirket ihtiyaçlarına göre ayarlamayı amaçlayan ekonomik bir iş çözümüdür. Bu fikir özel ve
kamusal bulut ağı imkânlarını karşılaştırıldığında daha iyi keşfedilebilir. Birincil fark verilerin iletimi ve
işlenmesini önceden saptayan ana bilgisayar altyapıdır. Açık altyapı iletişim için World Wide Web
kullanır ve bilgi teknolojileri perspektifinden bakılınca doğal olarak bir risktir. Öte yandan verinin
korunmasından sorumlu dâhili bir bilgi teknolojileri destek ekibi özel alt yapıyı destekler. İkincisi, katı
bilgi güvenliği programlarının yerleştirilmesini gerektirir.
Jill M. Hagenkord:Bulut’u kavramsallaştırmanın kolay yolu Yahoo Mail ya da Gmail’i düşünmektir.
Bunlar uzaktan yazılımlar kullanarak uzaktan serverlar üzerinde çalışan web temelli email
hizmetleridir. Son kullanıcı olarak siz, ne yazılımı ne de donanımı kurmaya ya da sürdürmeye ihtiyaç
duyarsınız. Bulut son kullanıcıların yalnızca ihtiyaçları olan bant aralığını “paylaşılan-kullanıcı” modeli
tarafından sağlanan sürümden kazanmanın tadını çıkarırken kullanmalarını (ve ödemelerini) sağlar.
Yazılım, BT, güvenlik ve veri merkezi uzmanları Bulut’taki teknoloji ile ilgilenirken hastane
laboratuvarları gibi son kullanıcılar hasta bakımı için genomik bilgi kullanımına odaklanabilirler. HIPAA
düzenlemeleri Bulut programlamasına bazı enteresan engeller getirmişlerdir fakat bunlar çözümsüz
değildir. Örneğin, verinin BD’yi terk etmemesi HIPAA uyumunu sürdürmek için, Bulut’un herhangi bir
zamanda nerede olduğu son kullanıcıya gösterilmemektedir. Bu yalnızca omics tabanlı test etme
setlerinin dünün uyum prensiplerini birçok alt etme yönteminden biridir. CLIA ‘88’i uyumlu bir klinik
genom fabrikası çalıştırma bağlamında yorumlamayı deneyin! Ancak, Bulut çözümleri uygulanırken
teminat gösterilebilecek birçok seçenek bulunmaktadır. Sanal Özel Bulutlar, şifreleme ve erişim
kontrolü gibi hizmetler HIPAA ve diğer yasal uyumlu çözümlerin yapılandırılması için teminat
gösterilebilir. Bu gereklilikleri sağlayabilecek Bulut’un üretiminde çalışan birçok hizmet bulunmaktadır.
Genomik ve Bulut bilişimi ilerlemeye ve kabul görmeye devam edecek ve genomik tıbbın gelecekteki
resminin bir parçası olacaklardır. Laboratuvar profesyonelleri olarak biz güncel yasal politikalardan
haberdar olmalı ve politika yapıcıları genomik test etme için neyin daha uygun olacağı üzerine
eğitirken bile omics çözümlerimizin bu kılavuzlara bağlı kaldıklarından emin olmalıyız.
1
2
YNS: Yeni Nesil Sekanslama (NGS: New Generation Sequencing)
omics: Biyolojide, İngilizcede –omics ile biten çalışmalara verilen informal isim (Ör. genomics,
proteomics veya metabolomics).
Tina Hambuch:Bunu araştırıyoruz fakat HIPAA hakkında önemli endişeler mevcut. Eninde sonunda
üretilen bilginin araştırılmasına ve optimize edilmiş uygulamasına izin vereceğini düşünüyorum ancak
kısa dönemde veri güvenliği ve bunun uygun şekilde paylaşılabilmesi hakkında önemli zorluklar
mevcut.
Jason H. Moore: Bulut programlama internet üzerinden sağlanan veri depolama ve analiz hizmetidir.
Açık veya özel kurumlar internet üzerinde coğrafik olarak dağılmış kullanıcılara yüksek performanslı
programlarını ve veri depolama donanımlarını satmaktalar. Bu modelin avantajı hiçbir programlama
kaynağını barındırmak zorunda olmamanız ve yalnızca kullandığınız hizmetler için ödeme yapmanız.
Bir klinik laboratuvar için bu tüm veri depolama ihtiyaçları için Bulut’u kullanmaları anlamına gelebilir.
Gigabayt ve verinin depolanmasını istediğiniz süre başına ödeme yaparsınız. Aldığınız ise ucuz veri
depolama servisi ve donanım bozulmaları sebebiyle veri kaybına karşı yedeklemedir. Tabi ki
dezavantaj tesisinizi terk eden verinin sizin gizlilik ve güvenlik standartlarına uymama ihtimalidir.
Veriler başka birinin serverında barınınca korunmaları da sizin kontrolünüzde olamıyor. Klinik
laboratuvarlardakilerin çoğu şimdilik bu riski alma niyetinde değiller.
Mart 2012’de Tıp Enstitüsü (IOM) yüksek kompleksiteli test etme tarafından üretilen veri setlerinin
onaylanması ve devamındaki analiz (Dönüşümsel Omiclerin Evrimi) üzerine bir rapor yayınladı.
Biyoenformatik analizlerin yeniden üretilebilmeleri ve klinik laboratuvarların raporda belirtilen
problematik konuları nasıl önleyebilecekleri üzerine düşünceleriniz nelerdir?
Elizabeth Chao:biyoenformatik analizlerin yeniden üretilebiliteleri genomiğin klinik işlere hızlı girişi ile
gözde büyüyen bir konu haline gelmiştir. Hem IOM hem de Amerikan Tıbbi Genetik Koleji’nin (ACMG)
bu uzmanlıklara bu kadar hızlı yönelmeleri güven vericidir. ACMG politik beyanlar yayınlamış ve tüm
ekzon ve tüm genom sekanslama için özel kılavuzlar üzerinde aktif olarak çalışmaktadır.
Lider ve erken benimseyenler olarak bizim şirketimiz, güvenilirlik ve yeniden üretilebilirlik için güncel
IOM raporundakilerden daha katı olan dâhili ölçütlere güvenmiştir. Bunu söylerken bu minimum
standartların gelecekte daha çok standardizasyonu garanti edecek durumda olmasından hoşnutuz. Bu
duruma gelmek için gereken yatırım hafife alınmamalıdır ve değeri olduğundan fazladır.
Jill M. Hagenkord:Bazıları diğerlerinden daha saydam olan değişik çeşitli omic analizleri mevcuttur.
İfade modelleri özellikle son kullanıcıya opak olabilir ve tutarlı sonuçlar alınması için değişkenler sıkıca
kontrol edilmelidir. Buna ek olarak bu tip analizler teknik onayın yanı sıra dikkatli klinik onay ve
kullanım çalışmaları gerektirmektedir. Diğer omic analiz çeşitleri daha aşina çıktılara sahiptir. Örneğin,
kronik lenfosittik lösemili bir hastanın tümör hücrelerinden alınan DNA’daki kromozom 13q14’ün
silinmesini gösteren bir karyogram üreten bir sitogenomik dizilim. Bozulmuş DNA’yı
insilikokaryograma çeviren kompleks algoritmalar bulunsa da verinin sunuşu tanıdıktır (kromozom)
ve bir parça tutarlılık kontrolü sağlayan bizim kronik lenfosittik lösemi algımızla eşleşmektedir. Bu
şekilde kullanılan sitogenomik dizilimler belirlenmiş klinik önem ile değişimi saptamak için alternatif
yöntemler oldukları için teknik onay ve/veya tanısal çıkarım çalışmaları yeterli olmaktadır.
Klinik patolojistler ve laboratuvar bilim insanları testleri klinik kullanım için onaylayabilmek için yıllar
süren eğitimlere tabi tutulmaktalar. Bu konuda standartlarımızı yüksek tutmaktayız. Biyoenformatik
laboratuvarda oluşturulan testlerin ilerlemeleri için tasarımlarının, onaylanmalarının,
uygulanmalarının ve yorumlanmalarının bir parçası olacaktır. Genomik testleri sağlaya klinik
laboratuvarların klinik bitoenformatisyenleri prosesin oldukça içerisinde ve laboratuvar test personeli
1
2
YNS: Yeni Nesil Sekanslama (NGS: New Generation Sequencing)
omics: Biyolojide, İngilizcede –omics ile biten çalışmalara verilen informal isim (Ör. genomics,
proteomics veya metabolomics).
ile tıbbi yöneticilerle sürekli iletişim halinde tutmaları gerekmektedir. Laboratuvarda geliştirilmiş
testlerin bir parçası olarak algoritmalar ve çıktılar onaylanmalı ve sürüm denetimleri yapılmalıdır.
Tina Hambuch:Yeniden üretilebilirlik verinin doğruluğu için kritiktir ve biz kesinlikle biyoenformatik
yazılımımızın teknik doğrulamasında yeniden üretilebilirliği değerlendiririz. Bunu başarmak
mümkündür fakat varsayılamaz.
Jason H. Moore: Klinik laboratuvarlar tasarım olarak ölçümlerinde hataları önlemede oldukça
dikkatlidirler. Hasta bakımı buna dayandığı için birçok güvenlik önlemleri, kontroller ve dengeler klinik
verinin güvenilir ve doğru olduğunu garantilemek için konulmuştur. Omics verileri, DNA sekanslama
gibi yüksek girdi-çıktılı teknolojilerin doğası gereği daha az güvenilirdir. Dahası yüksek miktarda omics
verisi kullanışlı bilgiler üretebilmek için sık sık birçok işlem turu gerektirir. Kullanışlı bilgiler sonrasında
çeşitli biyoenformatik ve biyoistatistik analiz yöntemleri yoluyla bilgiye çevrilir. QC’den final analizi ve
yorumlamaya kadar analiz hattındaki her basamak istemsiz hatalar üretebilir. Örneğin birçok
otomatik öğrenme yöntemi her biri sonuçlarda büyük etkilere sahip olabilecek sayısız ayara sahiptir.
Bir ayarı sonuçların geçersiz ve/veya devamında yinelenemez şekilde yanlış belirtmek veya yanlış
rapor etmek kolaydır.
Biyoenformatikte, daha genel olarak bilgisayar bilimlerinde, yayınlanan sonuçları üretmek için belirli
bir veri seti ile kullanılmış yazılım ve tam olarak aynı ayarları sağlamak için bir akım mevcuttur. Herkes
hem verileri hem de yazılımı karşıdan yükleyebilmeli ve bir bulguyu kolayca yineleyebilmelidir. Veri ve
yöntem paylaşma kültürü yavaş değişir fakat yayınlanan sonuçlara inanacaksak bu gereklidir. Bu klinik
laborantların hem biyoenformatik hem de biyoistatistikte gerekli bilgilere sahip olmalarının ne kadar
kritik olduğunun diğer iyi bir sebebidir.
Biyoenformatik hakkında bilgi edinmek için yalnızca bir kaynağınız olsaydı bu hangisi olurdu ve
neden?
Elizabeth Chao:Biyoenformatik alanı güncel eğitim kaynaklarından daha hızlı gelişmekte. Bu yüzden
veri analizi için yeni yöntemlere atıfta bulunan alandaki araştırmacı ve liderlerden gelen küresel
girdiler birincil eğitim kaynağı olmaya devam etmekte. Bunun direk anlamı, alanda uzman kişilerle
kişisel görüşmeler yapmanın yanı sıra yerel ve ulusal konferanslara katılmak ve çeşitli
üniversitelerden konuşmacıları bir araya getirmektir.
Jill M. Hagenkord:Bu zor bir soru. Ben kimsenin klinik genomik hakkında bilmesi gerekenleri tek bir
kaynaktan öğrenebileceğine inanmıyorum. Fakat bunu söylemişken ekleyeyim, öğrenmenin en iyi
yolu yapmaktır. Profesyonel topluluklar, ilgilenen üyeleri için pratik atölye çalışmaları düzenlemeli ve
eğitim alanlar düzenli olarak vaka konferanslarında genomik vakaları halka açık şekilde sunmalılar.
Birçok genomik şirketi ve yazılım satıcısı, eğer kurumunuz henüz genomik test sunmuyorsa, eğitim
amaçlı ücretsiz halka açık veri setleri sunmaktadır. Ben kendimi oldukça akıllı biyoenformatisyenlere
algoritmalar hakkındaki sorularımda ve veri sunumundaki görünür uyumsuzluklarda yardımcı olmaları
için yakın tutmakta şanslıydım. Klinik laborantlar kendilerini eğitmek ve biyoenformatisyenler ile
iletişim kurmak için çaba sarf etmelidirler – ve sabırlı olmalı, tıbbi profesyoneller ve
biyoenformatisyenler birbirleriyle iletişim kurmayı öğrenirken espri anlayışlarını kaybetmemeliler. Bir
doktor ve biyoenformatisyenin iletişim kurmasının ne kadar zor olabileceğine dair sayısız komik
hikâyem var.
1
2
YNS: Yeni Nesil Sekanslama (NGS: New Generation Sequencing)
omics: Biyolojide, İngilizcede –omics ile biten çalışmalara verilen informal isim (Ör. genomics,
proteomics veya metabolomics).
Tina Hambuch:Tek bir iyi kaynak yok – muhtemelen alan çok geniş ve aynı zamanda oldukça yeni
oluşmakta. Bu aynı zamanda insanların tek bir kitap ya da web sitesinin ötesinde anlaşılır bir eğitime
ihtiyaç duymalarına yetecek kadar kompleks.
Jason H. Moore:R istatistiksel programlama yazılım paketi biyoenformatik öğrenmek için ideal bir
odak noktası. R, açık kaynaktır, ücretsizdir ve Linux, Mac ve Windows işletim sistemlerinde çalışır.
R’nin avantajı, hızlıca biyoenformatiğin birincil analiz yazılım paketi haline gelmesidir. Bu kısmen
ücretsiz olması ama bir yandan da genişletilebilir olması sebebiyledir. Birçok biyoenformatikçi yeni
yöntemlerini herkesin karşıdan yükleyebildiği ve hızlıca kullanabildiği R dâhilinde yayınlamaktadır.
Geniş çaplı çevrimiçi dokümantasyon ve biyokondüktör diye adlandırılan bir pakette biyoenformatik
araçlarının koleksiyonu bulunmaktadır. R’nin başlangıç öğrenim eğrisi biraz diktir. Ancak harcanan
zaman R bilmenin açacağı kapılara değmektedir. R şimdi biyoenformatik ve biyoistatistikten
isteyebileceğiniz neredeyse her şey için paketler içermektedir.
1
2
YNS: Yeni Nesil Sekanslama (NGS: New Generation Sequencing)
omics: Biyolojide, İngilizcede –omics ile biten çalışmalara verilen informal isim (Ör. genomics,
proteomics veya metabolomics).
Download