ஐ.எஸ்.எஸ்.என்: 0974-276X
லோயி அப்துல்லா, வலீத் கலீஃபா, லூயிஸ் சி ஷோ மற்றும் மாலிக் யூசப்
பின்னணி: தொழில்நுட்பத்தின் முன்னேற்றங்கள், அதிக எண்ணிக்கையிலான மாதிரிகளிலிருந்து மரபணு வெளிப்பாடு தரவை உருவாக்குவதற்கும், அடிப்படை மற்றும் உயிரியல் மருத்துவ அமைப்புகளில் மரபணு வெளிப்பாட்டை பகுப்பாய்வு செய்வதற்கான "பிக் டேட்டா" அணுகுமுறைகளை உருவாக்குவதற்கும் உதவுகின்றன. கூறப்பட்டால், தரவு இன்னும் ஒப்பீட்டளவில் சிறிய எண்ணிக்கையிலான மாதிரிகள் மற்றும் பல்லாயிரக்கணக்கான மாறிகள்/மரபணு வெளிப்பாடுகளை உள்ளடக்கியது. ஒரு வகுப்பின் பாடங்கள்/ மாதிரிகளை மற்றொன்றிலிருந்து துல்லியமாக வேறுபடுத்தக்கூடிய மிகவும் தகவல் தரும் மாறிகளைத் தேர்ந்தெடுப்பதற்காக, இந்த மரபணு இடைவெளிகளைத் தேடுவதற்கு பல்வேறு அணுகுமுறைகள் உருவாக்கப்பட்டுள்ளன. இருப்பினும், ஒரே மாதிரியான மரபணு வெளிப்பாடு சுயவிவரங்களைக் கொண்ட உயிரியல் ரீதியாக வெவ்வேறு வகுப்பு பாடங்களை துல்லியமாக வேறுபடுத்தக்கூடிய புதிய அணுகுமுறைகளின் தேவை இன்னும் உள்ளது. இந்தச் சிக்கலைத் தீர்க்கும் மிகவும் தகவலறிந்த வேறுபட்ட வெளிப்படுத்தப்பட்ட மரபணுக்களைத் தேர்ந்தெடுப்பதற்கான புதிய மற்றும் நம்பிக்கைக்குரிய அணுகுமுறையை நாங்கள் விவரிக்கிறோம். குழும கிளஸ்டரிங் அணுகுமுறையை அடிப்படையாகக் கொண்ட ரிகர்சிவ் கிளஸ்டர் எலிமினேஷன் (ஆர்சிஇ) செயல்முறையைப் பயன்படுத்தி குறிப்பிடத்தக்க வேறுபட்ட வெளிப்படுத்தப்பட்ட மரபணுக் குழுக்களை அடையாளம் காணும் முறையை நாங்கள் விவரிக்கிறோம். இந்த அணுகுமுறையை SVM-RCE-EC (Ensemble Clustering) என்று குறிப்பிடுகிறோம். பாரம்பரிய SVM-RCE அணுகுமுறை உள்ளிட்ட பிற முறைகளுடன் ஒப்பிடும்போது SVM-RCE-EC மரபணுத் தேர்வு, வகைப்படுத்தல் துல்லியம் ஆகியவற்றை மேம்படுத்துகிறது என்பதைக் காட்டுகிறோம், மேலும் இது மற்ற அணுகுமுறைகளால் மோசமாகத் தீர்க்கப்படும் கடினமான தரவுத் தொகுப்புகளுக்குப் பயன்படுத்தப்படும்போது குறிப்பாகத் தெரிகிறது.
முறைகள்: SVM-RCE-ECஐச் செயல்படுத்த, வலுவான மரபணுக் கூட்டங்களை அடையாளம் காண, குழும-கிளஸ்டரிங் முறையை முதலில் பயன்படுத்தினோம். வகைப்படுத்தல் துல்லியத்திற்கான அவர்களின் பங்களிப்புகளின் அடிப்படையில் மரபணுக்களின் தொகுப்பை மதிப்பெண் (ரேங்க்) செய்ய குறுக்கு சரிபார்ப்புடன், ஆதரவு திசையன் இயந்திரங்களை (SVMs) பயன்படுத்தினோம். குறைந்த முக்கியத்துவம் வாய்ந்த மரபணுக்களின் கொத்துகள் RCE இன் செயல்முறையின் மூலம் படிப்படியாக அகற்றப்பட்டு, இரண்டு வகுப்புகளுக்கு இடையே மிகவும் வலுவான, குறிப்பிடத்தக்க வகையில் வித்தியாசமாக வெளிப்படுத்தப்பட்ட மரபணுக்களை அடையாளம் காணும் வரை மிக முக்கியமான கிளஸ்டர்கள் தக்கவைக்கப்படுகின்றன. SVM-RCE-EC இன் வகைப்படுத்தல் செயல்திறனை பல்வேறு வெளியிடப்பட்ட வகைப்பாடு அல்காரிதம்களுடன் ஒப்பிடுகிறோம்.
முடிவுகள் மற்றும் முடிவு: குழும முறையைப் பயன்படுத்தி தேர்ந்தெடுக்கப்பட்ட மரபணுக் குழுக்களின் பயன்பாடு மற்ற முறைகளுடன் ஒப்பிடும்போது வகைப்படுத்தல் செயல்திறனை மேம்படுத்துகிறது மற்றும் பகுப்பாய்வு செய்யப்படும் அமைப்புக்கு உயிரியல் ரீதியாக மிகவும் அர்த்தமுள்ளதாகத் தோன்றும் குறிப்பிடத்தக்க மரபணுக்களின் தொகுப்புகளை அடையாளம் காட்டுகிறது. SVM-RCE-EC தரவில் பல முறைகளை விஞ்சி, மிகவும் ஒத்த மாதிரி வகுப்புகளைப் பிரதிநிதித்துவப்படுத்துகிறது, அவை வேறுபடுத்துவது கடினம் மற்றும் வகுப்புகள் எளிதாகப் பிரிக்கப்படும் தரவைப் பயன்படுத்தும்போது மற்ற முறைகளுடன் ஒப்பிடலாம். கடினமான தரவுத் தொகுப்புகளில் SVM-RCE-EC இன் மேம்படுத்தப்பட்ட செயல்திறன், குழும அணுகுமுறையால் தீர்மானிக்கப்படும் குறிப்பிடத்தக்க க்ளஸ்டர்கள், தரவின் பூர்வீகக் கட்டமைப்பைப் பிடிக்கும் அதே வேளையில் SVM-RCE அந்தத் தீர்மானத்தை பயனருக்கு விட்டுச் செல்கிறது. இந்த கருதுகோள் SVM-RCE-EC ஆல் உருவாக்கப்பட்ட கிளஸ்டர்களின் செயல்திறன் மிகவும் வலுவானது என்ற அவதானிப்புகளால் ஆதரிக்கப்படுகிறது.
கிடைக்கும் நிலை: SVM-RCE-EC இன் Matlab பதிப்பு முதல் ஆசிரியரின் கோரிக்கையின் பேரில் மற்றும் GitHub இல் (https://github.com/malikyousef/svm-rce-ec) கிடைக்கும்.