अरिमर्दन कुमार त्रिपाठी

मशीनी अनुवाद के विकास की भूमिका द्वितीय विश्वयुद्ध के दौरान ही बनी थी, ताकि अंतरभाषिक देशों के समूहीकृत सैनिकों में तात्कालिक तौर पर संवाद स्थापित हो सके और युद्ध के लिए जरूरी स्वाभाविक स्तर का रणनीतिक तालमेल बन सके। उस विध्वंस के मध्य सृजन की आकांक्षा ने मशीनी अनुवाद की जो जरूरत महसूस कराई, उस पर बाद में भूमंडलीकरण ने मुहर लगाई थी।

मशीनी अनुवाद न तो विश्व-युद्ध की जरूरतों को पूरा करने लायक विकसित हो पाया और न ही भूमंडलीकरण की आवश्यकताओं को उस स्तर पर संबोधित कर पाया, जैसी अपेक्षा थी। कई वजहों से पिछले कुछ सालों के दौरान इंटरनेट की खपत की बढ़ी है, जो भूमंडलीकरण का एक बड़ा वाहक है।

भारत में मशीनी अनुवाद का सांस्थानिक इतिहास कुल मिलाकर तीस-पैंतीस वर्षों का है। इस क्रम में परियोजना की खानापूर्ति देश की दर्जनों संस्थाओं ने की, लेकिन आगे चलकर सी-डैक, पुणे ने इस क्षेत्र में महत्त्वपूर्ण कार्य किए थे। इनमें से एक ‘मंत्रा-राजभाषा’ नामक साफ्टवेयर अपनी प्रक्रिया के अनुरूप संसद की कार्रवाइयों का अनुवाद भी किया था, लेकिन बड़े स्तर पर सामाजिक स्वीकृति के रूप में देश में किसी मशीनी अनुवाद प्रणाली का विकास नहीं हो पाया था। इसमें एक दौर तो ऐसा भी आया था, जिसमें तत्कालीन सरकार ने मशीनी अनुवाद के क्षेत्र में हो रहे शोधों को लगभग बंद कर दिया था, क्योंकि अपेक्षित परिणाम नहीं मिल पा रहे थे।

जाहिर है, मशीनी अनुवाद इतना सरल काम भी नहीं है। मशीनी ही क्यों, मानवकृत अनुवाद भी अभी तक तमाम प्रश्नों और विश्वसनीयताओं के संकट के दौर से गुजरता रहा है। इन सबके बीच मशीनी अनुवाद के समाज तक न पहुंचने का एक बड़ा कारण यह भी था कि तब तक का पूरा शोध नियम-आधारित था। यानी इसमें व्याकरण को आधार बनाकर नियमों का गुच्छ बनाया जाता था और इसी के आधार पर कंप्यूटर की प्रोग्रामिंग की जाती थी।

अनुवाद में जिन दो भाषाओं को लक्ष्य किया जाता है, हो सकता है कि उनकी विपरीत भाषा वैज्ञानिक व्यवस्था हो, विपरीत सांस्कृतिक संदर्भ हों, इसलिए मानव-अनुवाद की चुनौतियों से कई गुना अधिक चुनौती मशीनी अनुवाद में आती थी। दरअसल, मशीन में सोचने की क्षमता फिलहाल नहीं है, बल्कि मानव के द्वारा प्रयुक्त भाषिक संरचना से ही कृत्रिम मेधा के क्षेत्र में काम होता है। यह जरूर है कि मशीन के पास गति और सामर्थ्य मानव से अधिक है।

इन सबके बीच मशीनी अनुवाद के क्षेत्र में गूगल दिन दूनी रात चौगुनी विकास करता रहा और उसकी उच्च गुणवत्ता और वैश्विक क्षमता को सामने देखकर भारत की सरकारों ने यह स्वीकार कर लिया था कि मशीनी अनुवाद में अब जो कुछ होगा वह गूगल ही करेगा। इसके बावजूद कि गूगल इंटरनेट से हमारा ही भाषिक डेटा लेकर अपने मशीन अनुवाद के शोध को समृद्ध करता रहा।

इन सब में अंग्रेजी एक अनिवार्य भाषा के रूप में सामने होती है और उपभोक्ता के तौर पर हमारी स्थिति यही थी कि हम अंग्रेजी को सामने रखकर अपनी भारतीय भाषाओं की तुलना करें और अपनी भाषाओं के पिछड़ेपन का रोना रोते हुए अंग्रेजी के विस्तार को आंख मूंदकर स्वीकारते रहें। मगर इंटरनेट के विस्तार, आम जनता तक इसकी बेहतर पहुंच और सरकार की दृढ़ इच्छाशक्ति ने डिजिटलीकरण की जो प्रक्रिया बढ़ाई, इससे मशीनी अनुवाद का शोध न सिर्फ नए सिरे से शुरू हुआ, बल्कि आज गूगल से आंख मिलाकर खड़ा होने के लिए तैयार हो रहा है।

आज यह वेबसाइट और मोबाइल एप के माध्यम से सभी के लिए उपलब्ध होना शुरू हो गया है, जिसमें फिलहाल अंग्रेजी, असमी, उड़िया, कन्नड़, गुजराती, तमिल, तेलुगु, पंजाबी, बांग्ला, मराठी और मलयालम के मध्य परस्पर अनुवाद की व्यवस्था की जा चुकी है। साथ ही बोडो और मणिपुरी इसमें जुड़ चुकी है, जिनमें गुणवत्तापूर्ण अनुवाद की प्रक्रिया निरंतर जारी है।

जाहिर है कि संविधान की आठवीं अनुसूची की भाषाओं को इस कृत्रिम मेधा आधारित प्रणाली में जोड़ना शोधकर्ताओं की प्राथमिकता है। इस प्रणाली में अपनी जरूरत की भाषा का बोलकर और अपने लक्ष्य की भाषा में इसका अनुवाद पाया जा सकता है। यह भारत में विकसित मशीनी अनुवाद की एकमात्र ऐसी प्रणाली है, जिसकी न सिर्फ गूगल के सामने रखकर तुलना कर सकते हैं, बल्कि यह पहली ऐसी अनुवाद प्रणाली है, जो प्रयोगशालाओं से आगे बढ़कर समाज तक पहुंचना शुरू हो चुकी है। भविष्य में यह द्वयअर्थक शब्दों के अनुवाद में भी यह सुधार कर लेगी, इसका विश्वास इसकी वर्तमान क्षमता और तैयारियों को देखकर सहज हो जाता है।

अब एक उपभोक्ता के तौर पर हमारी यह जिम्मेदारी बनती है कि हम अधिक से अधिक इस प्रणाली का उपयोग करें, जिसका एक लाभ यह भी होगा कि हमारे प्रयोग से प्राप्त डेटा के आधार पर भाषिनी दिनोंदिन विकसित होती जाएगी और तेजी से इस प्रणाली में देश की अधिक से अधिक भाषाएं जुड़ती जाएंगी और भारतीय बहुभाषिकता डिजिटलीकरण के मुहाने पर भी बनी रहेगी।