ஐ.எஸ்.எஸ்.என்: 2165- 7866
அசுதோஷ் குப்தா
டிஆக்ஸிரைபோநியூக்ளிக் அமிலம் (டிஎன்ஏ) என்பது உயிரினங்களின் அனைத்து பண்புகளும் குறியாக்கம் செய்யப்பட்ட இயற்பியல் ஊடகமாகும். அதன் வரிசையைப் புரிந்துகொள்வது மூலக்கூறு உயிரியலில் முதன்மையான அக்கறையாகும். சில முக்கியமான மூலக்கூறு உயிரியல் தரவுத்தளங்கள் (ERIBL, GenBank, DDJB) நியூக்ளியோடைடு வரிசைகள் (டிஎன்ஏ, ஆர்என்ஏ) மற்றும் புரதங்களின் அமினோ-அமில வரிசைகளைக் குவிப்பதற்காக உலகம் முழுவதும் உருவாக்கப்பட்டுள்ளன. இன்றைய காலத்தில் அவற்றின் அளவு அதிவேகமாக அதிகரித்து வருகிறது என்பது நன்கு ஒப்புக்கொள்ளப்பட்டது. வேறு சில அறிவியல் தரவுத்தளங்களைப் போல இன்னும் பெரியதாக இல்லை, அவற்றின் அளவு நூற்றுக்கணக்கான ஜிபி [1]. முழுமையான மரபணுக்களுக்கு, இந்த நூல்கள் மிகவும் நீளமாக இருக்கும். உதாரணமாக மனித மரபணுவில் இருபத்தி மூன்று ஜோடி குரோமோசோம்களில் மூன்று பில்லியன் எழுத்துக்கள் உள்ளன. இது மனிதனின் அனைத்து மரபணு பொருட்களையும் கொண்டுள்ளது. மரபணு வரிசைகளின் எண்ணிக்கை அதிகரித்து வருவதால், தரவுத்தளங்களைச் சேமிப்பதிலும் பயன்படுத்துவதிலும் உள்ள சிரமம் தீர்க்கப்பட வேண்டும். இதன் விளைவாக மரபணு தகவலை சுருக்குவது ஒரு மிக முக்கியமான பணியாகும். சுருக்கப்பட்ட களத்தில் தேடும் முறையைப் பயன்படுத்துவதன் மூலம் சில வகையான நோய்களைக் கணிப்பதும் கருத்தில் கொள்ள வேண்டிய மற்றொரு காரணியாகும்.