राष्ट्रीय
नई दिल्ली, 6 जून | बेहतर अनुवाद प्रणाली के लिए, फेसबुक ने फ्लोर्स-101 को ओपन सोर्स किया है। ये कई मूल्यांकन डेटा सेट है, जिसमें दुनिया की 101 भाषाओं को शामिल किया गया है।
पहली बार, शोधकर्ता 10,100 अलग-अलग अनुवाद दिशाओं के माध्यम से अनुवाद की गुणवत्ता को मजबूती से मापने में सक्षम होंगे - उदाहरण के लिए, सीधे हिंदी से थाई या स्वाहिली में अनुवाद हो सकेगा।
संदर्भ के लिए, ये अंग्रेजी में और बाहर के मूल्यांकन में केवल 200 अनुवाद निर्देश देगा।
'फ्लोरेस-101' टूल शोधकतार्ओं को 'एम2एम-100' जैसे पहले के बहुभाषी अनुवाद मॉडल पर तेजी से परीक्षण और सुधार करने में सक्षम बनाएगा।
फेसबुक ने एक बयान में कहा, "हम फ्लोरेस-101 को सार्वजनिक रूप से उपलब्ध करा रहे हैं क्योंकि हम भाषा की बाधाओं को तोड़ने में विश्वास करते हैं। इसका मतलब है कि शोधकतार्ओं को अधिक विविध (और स्थानीय रूप से प्रासंगिक) अनुवाद उपकरण बनाने में मदद करना है ।"
'फ्लोरेस-101' कम संसाधन वाली भाषाओं पर केंद्रित है, जैसे मंगोलियाई और उर्दू, जिनके पास वर्तमान में प्राकृतिक भाषा प्रसंस्करण अनुसंधान के लिए व्यापक डेटा सेट नहीं हैं।
डेटा सेट में सभी भाषाओं में वाक्यों का एक ही सेट होता है, जो शोधकतार्ओं को किसी भी और सभी अनुवाद दिशाओं के प्रदर्शन का मूल्यांकन करने में सक्षम बनाता है।
कंप्यूटर साइंस स्कूल में कानेर्गी मेलॉन यूनिवर्सिटी लैंग्वेज टेक्नोलॉजी इंस्टीट्यूट के प्रोफेसर ग्राहम न्यूबिग ने कहा, "मुझे लगता है कि (फ्लोरेस) मशीन अनुवाद समुदाय के भीतर कई भाषाओं के प्रतिनिधित्व को बेहतर बनाने में मदद करने के लिए वास्तव में एक जोरदार संसाधन है।"
"यह निश्चित रूप से सबसे व्यापक संसाधनों में से एक है जिसके बारे में मुझे पता है कि विकिपीडिया पाठ के रूप में सूचना पहुंच के लिए प्रासंगिकता के क्षेत्र में दुनिया भर से इतनी सारी भाषाएं शामिल हैं।"(आईएएनएस)