Bioinformatika merupakan ilmu terapan yang lahir dari perkembangan teknologi informasi dibidang molekular. Pembahasan dibidang bioinformatik ini tidak terlepas dari perkembangan biologi molekular modern, salah satunya peningkatan pemahaman manusia dalam bidang genomic yang terdapat dalam molekul DNA.
Kemampuan untuk memahami dan memanipulasi kode genetik DNA
ini sangat didukung oleh teknologi informasi melalui perkembangan hardware dan
soffware. Baik pihak pabrikan sofware dan harware maupun pihak ketiga dalam
produksi perangkat lunak. Salah satu contohnya dapat dilihat pada upaya Celera
Genomics, perusahaan bioteknologi Amerika Serikat yang melakukan pembacaan
sekuen genom manusia yang secara maksimal memanfaatkan teknologi informasi
sehingga bisa melakukan pekerjaannya dalam waktu yang singkat (hanya beberapa
tahun).
Perkembangan teknologi DNA rekombinan memainkan peranan
penting dalam lahirnya bioinformatika. Teknologi DNA rekombinan memunculkan
suatu pengetahuan baru dalam rekayasa genetika organisme yang dikenala
bioteknologi. Perkembangan bioteknologi dari bioteknologi tradisional ke
bioteknologi modren salah satunya ditandainya dengan kemampuan manusia dalam
melakukan analisis DNA organisme, sekuensing DNA dan manipulasi DNA.
Sekuensing DNA satu organisme, misalnya suatu virus memiliki
kurang lebih 5.000 nukleotida atau molekul DNA atau sekitar 11 gen, yang telah
berhasil dibaca secara menyeluruh pada tahun 1977. Kemudia Sekuen seluruh DNA
manusia terdiri dari 3 milyar nukleotida yang menyusun 100.000 gen dapat
dipetakan dalam waktu 3 tahun, walaupun semua ini belum terlalu lengkap. Saat
ini terdapat milyaran data nukleotida yang tersimpan dalam database DNA,
GenBank di AS yang didirikan tahun 1982.
Bioinformatika ialah ilmu yang mempelajari penerapan teknik komputasi untuk mengelola
dan menganalisis informasi hayati. Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk
memecahkan masalah-masalah biologi, terutama yang terkait dengan penggunaan
sekuens DNA dan asam amino. Contoh topik
utama bidang ini meliputi pangkalan data
untuk mengelola informasi hayati, penyejajaran sekuens (sequence alignment),
prediksi struktur untuk meramalkan struktur protein atau pun struktur
sekunder RNA, analisis filogenetik,
dan analisis ekspresi gen.
Bioinformatika pertamakali dikemukakan pada pertengahan 1980an untuk mengacu
kepada penerapan ilmu komputer
dalam bidang biologi. Meskipun demikian, penerapan bidang-bidang dalam
bioinformatika seperti pembuatan pangkalan data dan pengembangan algoritma untuk analisis sekuens biologi
telah dilakukan sejak tahun 1960an.
Kemajuan teknik biologi molekuler dalam
mengungkap sekuens biologi protein (sejak awal 1950an) dan asam nukleat (sejak
1960an) mengawali perkembangan pangkalan data dan teknik analisis sekuens
biologi. Pangkalan data sekuens protein mulai dikembangkan pada tahun 1960an di
Amerika Serikat, sementara
pangkalan data sekuens DNA dikembangkan pada akhir 1970an di Amerika Serikat
dan Jerman pada Laboratorium
Biologi Molekuler Eropa (European
Molecular Biology Laboratory).
Penemuan teknik sekuensing DNA yang lebih
cepat pada pertengahan 1970an menjadi landasan terjadinya ledakan jumlah
sekuens DNA yang dapat diungkapkan pada 1980an dan 1990an. Hal ini menjadi
salah satu pembuka jalan bagi proyek-proyek pengungkapan genom, yang meningkatkan kebutuhan akan
pengelolaan dan analisis sekuens, dan pada akhirnya menyebabkan lahirnya
bioinformatika.
Perkembangan jaringan internet juga mendukung
berkembangnya bioinformatika. Pangkalan data bioinformatika yang terhubungkan
melalui internet memudahkan ilmuwan dalam mengumpulkan hasil sekuensing ke
dalam pangkalan data tersebut serta memperoleh sekuens biologi sebagai bahan
analisis. Selain itu, penyebaran program-program
aplikasi bioinformatika melalui internet memudahkan ilmuwan dalam mengakses
program-program tersebut dan kemudian memudahkan pengembangannya.
Pangkalan Data
sekuens biologi dapat berupa pangkalan data primer untuk menyimpan sekuens
primer asam nukleat
dan protein, pangkalan data
sekunder untuk menyimpan motif sekuens protein, dan pangkalan data struktur
untuk menyimpan data struktur protein dan asam nukleat.
Pangkalan data utama untuk sekuens asam nukleat saat ini
adalah GenBank
(Amerika Serikat), EMBL (the European
Molecular Biology Laboratory, Eropa), dan DDBJ
(DNA Data Bank of Japan, Jepang).
Ketiga pangkalan data tersebut bekerja sama dan bertukar data secara harian
untuk menjaga keluasan cakupan masing-masing pangkalan data. Sumber utama data
sekuens asam nukleat adalah submisi (pengumpulan) langsung dari peneliti
individual, proyek sekuensing genom,
dan pendaftaran paten.
Selain berisi sekuens asam nukleat, entri dalam pangkalan data sekuens asam
nukleat pada umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam
nukleat tersebut, dan segala sesuatu yang berkaitan dengan sekuens asam nukleat
tersebut.
Selain asam nukleat, beberapa contoh pangkalan data penting
yang menyimpan sekuens primer protein adalah PIR (Protein Information
Resource, Amerika Serikat), Swiss-Prot
(Eropa), dan TrEMBL (Eropa). Ketiga
pangkalan data tersebut telah digabungkan dalam UniProt, yang didanai
terutama oleh Amerika Serikat. Entri dalam UniProt mengandung informasi tentang
sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan
komentar yang pada umumnya berisi penjelasan mengenai fungsi protein tersebut.
Perangkat bioinformatika yang berkaitan erat dengan
penggunaan pangkalan data sekuens Biologi ialah BLAST (Basic Local Alignment Search
Tool). Penelusuran BLAST (BLAST search) pada pangkalan data sekuens
memungkinkan ilmuwan untuk mencari sekuens baik asam nukleat maupun protein
yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berguna misalnya
untuk menemukan gen
sejenis pada beberapa organisme
atau untuk memeriksa keabsahan hasil sekuensing atau untuk
memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari
kerja BLAST adalah penyejajaran sekuens
.
PDB (Protein Data Bank,
Bank Data Protein) ialah pangkalan data tunggal yang menyimpan model struktur
tiga dimensi protein
dan asam nukleat hasil
penentuan eksperimental (dengan kristalografi
sinar-X, spektroskopi NMR,
dan mikroskopi
elektron). PDB menyimpan data struktur sebagai koordinat tiga
dimensi yang menggambarkan posisi atom-atom dalam protein atau pun asam
nukleat.
Tidak ada komentar:
Posting Komentar