ISSN: 2165- 7866
అశుతోష్ గుప్తా
డియోక్సిరిబోన్యూక్లిక్ యాసిడ్ (DNA) అనేది జీవుల యొక్క అన్ని లక్షణాలు ఎన్కోడ్ చేయబడిన భౌతిక మాధ్యమాన్ని ఏర్పరుస్తుంది. పరమాణు జీవశాస్త్రంలో దాని క్రమం యొక్క అవగాహన ప్రాథమిక ఆందోళన. న్యూక్లియోటైడ్ సీక్వెన్సులు (DNA, RNA) మరియు ప్రోటీన్ల యొక్క అమైనో-యాసిడ్ సీక్వెన్స్లను సేకరించేందుకు ప్రపంచవ్యాప్తంగా కొన్ని ముఖ్యమైన మాలిక్యులర్ బయాలజీ డేటాబేస్లు (ERIBL, GenBank, DDJB) అభివృద్ధి చేయబడ్డాయి. ఈ రోజుల్లో వాటి పరిమాణం విపరీతంగా వేగంగా పెరుగుతోందని బాగా అంగీకరించబడింది. ఇంకా కొన్ని ఇతర శాస్త్రీయ డేటాబేస్ల వలె పెద్దది కాదు, వాటి పరిమాణం వందల GB [1]లో ఉంది. పూర్తి జన్యువుల కోసం, ఈ గ్రంథాలు చాలా పొడుగుగా ఉంటాయి. ఉదాహరణకు మానవ జన్యువు ఇరవై మూడు జతల క్రోమోజోమ్లపై మూడు బిలియన్ల అక్షరాలను కలిగి ఉంటుంది. ఇది మానవుల యొక్క అన్ని జన్యు పదార్ధాలను కలిగి ఉంటుంది. పెరుగుతున్న జన్యు శ్రేణుల సంఖ్య అందుబాటులోకి రావడంతో, డేటాబేస్లను నిల్వ చేయడం మరియు ఉపయోగించడంలో ఉన్న ఇబ్బందులను పరిష్కరించాలి. ఫలితంగా జన్యు సమాచారం యొక్క కుదింపు చాలా ముఖ్యమైన పనిని ఏర్పరుస్తుంది. కంప్రెస్డ్ డొమైన్లో శోధించడం ద్వారా నిర్దిష్ట రకమైన వ్యాధిని అంచనా వేయడం కూడా పరిగణించవలసిన మరో అంశం.