தகவல் தொழில்நுட்பம் மற்றும் மென்பொருள் பொறியியல் இதழ்

தகவல் தொழில்நுட்பம் மற்றும் மென்பொருள் பொறியியல் இதழ்
திறந்த அணுகல்

ஐ.எஸ்.எஸ்.என்: 2165- 7866

சுருக்கம்

சமூக ஊடகங்களில் இடுகையிடப்பட்ட செய்திகளுக்கான அம்ஹாரிக் உரை சுருக்கம்

அபய்ன்யூ குவாடி*, டெபெலா டெஸ்ஃபே, டெஃபெரி கெபெப்யூ

இந்த கட்டுரை சமூக ஊடகங்களில் வெளியிடப்பட்ட செய்தி உருப்படிகளுக்கான அம்ஹாரிக் உரை சுருக்கத்தை அறிமுகப்படுத்துகிறது, அம்ஹாரிக் உரைகள் இடுகையிடப்பட்ட செய்திகளை சுருக்கமாக ட்விட்டர் மற்றும் ஃபேஸ்புக்கில் சமூக ஊடகங்களில் இருந்து பதிவுசெய்யப்பட்ட ஆவணங்கள்; சமூக ஊடகங்களில் இடுகையிடப்பட்ட உரைகளின் முக்கிய சிக்கல் என்னவென்றால், பெரும்பாலான மக்கள் அவை அம்ஹாரிக் உரைகளில் நகல் இடுகையிடப்பட்ட ஆவணங்களுடன் இடுகையிடப்பட்டிருப்பதை வாசிப்பார்கள். இருப்பினும், பயனர் தேடும் தகவலைக் கண்டறிய, சுருக்கமாக இடுகையிடப்பட்ட உரைகளைக் கண்டறியவும் மற்றும் சமூக ஊடகங்களில் விரும்பிய தகவலைப் பிரித்தெடுக்க இடுகைகளின் முக்கிய பகுதிகளை அம்ஹாரிக் ஆவணங்களாகப் படிக்கவும். சுருக்கமாக்கல் என்பது, இடுகையிடப்பட்ட ஆவணங்களின் தற்போதைய நேரப் பிரதிநிதித்துவத்திற்கான உரை ஆவணத்துடன் தகவல் சுமைகளை வழங்குதல் மற்றும் இடுகையிடுதல் ஆகியவற்றைக் கையாள்வதாகும். எங்கள் முன்மொழியப்பட்ட அணுகுமுறை மூன்று முக்கிய கூறுகளைக் கொண்டுள்ளது: முதலில், இரண்டு ஜோடி வாக்கியங்களுக்குள் இடுகையிடப்பட்ட ஒவ்வொரு ஆவணத்திற்கும் இடையிலான ஒற்றுமையைக் கணக்கிடுங்கள். இரண்டாவதாக, Kmeans அல்காரிதத்தைப் பயன்படுத்தி ஆவணங்களின் ஒற்றுமை முடிவுகளின் அடிப்படையில் அவற்றைக் குழுவாக்குதல். மூன்றாவதாக, TF-IDF அல்காரிதம்களைப் பயன்படுத்தி தனித்தனியாக தொகுக்கப்பட்ட இடுகையிடப்பட்ட ஆவணத்தை சுருக்கி, ஆவணங்களை வரிசைப்படுத்துவதற்கான அடிக்கடி விதிமுறைகளுக்கான புள்ளிவிவர வழிகளைக் கண்டறிதல். சுருக்கமாக்கல் நுட்பத்தை நாங்கள் பயன்படுத்தியுள்ளோம், இது ஒரு பிரித்தெடுத்தல் சுருக்க அணுகுமுறையாகும், இது இடுகையிடப்பட்ட ஆவணங்களில் உள்ள மிக உயர்ந்த வாக்கியங்களைக் கொண்ட வாக்கியங்களை சுருக்கங்களை உருவாக்குவதற்கு ஒதுக்கப்படும் மற்றும் சுருக்கத்தின் அளவை பயனர் அடையாளம் காண முடியும். சோதனை ஒன்றில், அதிக எஃப்-அளவீடு மதிப்பெண் 87.07% பிரித்தெடுக்கும் விகிதத்தில் 30% ஆகும், கிளஸ்டர்டு குழும எதிர்ப்பு இடுகைகளில். இரண்டாவது பரிசோதனையில், வறட்சிக்குப் பிந்தைய குழுக்களில், பிரித்தெடுக்கும் விகிதத்திற்கு 30% ஆக உயர்ந்த எஃப்-அளவீடு மதிப்பெண் 84% ஆகும். மூன்றாவது பரிசோதனையில், ஸ்போர்ட்ஸ் பிந்தைய குழுக்களில் பிரித்தெடுக்கும் விகிதத்திற்கு 91.37% அதிகபட்ச எஃப்-அளவீடு மதிப்பெண், மேலும் நான்காவது சோதனைகள் சுருக்கத்தை உருவாக்க 30% பிரித்தெடுத்தல் விகிதத்திற்கு 93.52% ஆகும். இடுகை உரைகள். சுருக்கத்தின் அளவை உருவாக்கும் அமைப்பு அதிகரிக்கப்பட்டால், இடுகையிடப்பட்ட உரைகளில் பிரித்தெடுக்கும் வீதமும் அதிகரிக்கிறது. இதற்காக, சமூக ஊடகங்களில் இடுகையிடப்பட்ட உரைகளை சுருக்கமாகக் கூறுவது மிகவும் நல்ல முடிவு என்று மதிப்பீட்டு முறை காட்டுகிறது.

மறுப்பு: இந்த சுருக்கமானது செயற்கை நுண்ணறிவு கருவிகளைப் பயன்படுத்தி மொழிபெயர்க்கப்பட்டது மற்றும் இன்னும் மதிப்பாய்வு செய்யப்படவில்லை அல்லது சரிபார்க்கப்படவில்லை.
Top