ISSN: 2161-0398
David Horn*, Uri Weingart
ఎంజైమ్ల సందర్భంలో నిర్దిష్ట పెప్టైడ్స్ (SP) యొక్క పద్దతి పరిచయం చేయబడింది. ఇది మోటిఫ్ వెలికితీత కోసం పర్యవేక్షించబడని మెషిన్ లెర్నింగ్ (ML) సాధనంపై ఆధారపడి ఉంటుంది, ఆ తర్వాత మూలాంశాల యొక్క పర్యవేక్షించబడే ఉల్లేఖనం. ఎంజైమ్ల విషయంలో, వర్గీకరణ ఎంజైమ్ వర్గీకరణ (EC) సంఖ్య. ఇక్కడ మేము ఈ సమస్యను పునఃప్రారంభిస్తాము మరియు ప్రస్తుతం అందుబాటులో ఉన్న ప్రోటీన్ సీక్వెన్స్లలో 0.965 యొక్క ఖచ్చితత్వాన్ని మరియు 0.891ని రీకాల్ చేస్తున్నామని నిరూపిస్తాము. అంతేకాకుండా, ప్రోటీన్లను ప్రశ్నించడానికి మా పద్దతిని వర్తింపజేయడం అదే ప్రయోజనం కోసం ఉపయోగించే లోతైన అభ్యాస పద్ధతుల కంటే చాలా వేగంగా ఉంటుంది.
మేము ఈ పద్ధతిని G ప్రోటీన్ కప్లింగ్ రిసెప్టర్లు (GPCR) మరియు జింక్ ఫింగర్ ప్రొటీన్లు అనే రెండు ఇతర ప్రోటీన్ సమూహాలకు కూడా వర్తింపజేస్తాము, వాటి సంబంధిత SPలను కనుగొని, అటువంటి కుటుంబంలో వర్గీకరణ కోసం ఏదైనా ప్రోటీన్ క్రమాన్ని శోధించడానికి కోడ్ను అందిస్తాము. మూడు సిస్టమ్లలో రెండింటికి చెందిన ఉల్లేఖనాలను కలిగి ఉన్న కొన్ని ప్రోటీన్లు చర్చించబడుతున్నాయి. మా పద్దతి ఏదైనా ప్రోటీన్ సమూహానికి వారి సంబంధిత SPలను కనుగొనడానికి మరియు అటువంటి కుటుంబంలో వర్గీకరణ కోసం ఏదైనా ప్రోటీన్ క్రమాన్ని శోధించడానికి కోడ్ను అందించడానికి అన్వయించవచ్చు.