एलन मस्क ले हाल ही में पॉप्युलर ऑनलाइन एनसाक्लोपीडिया प्लेटफॉर्म विकिपीडिया का AI क्लोन Grokipedia लॉन्च किया था। अब लॉन्च के दो दिन बाद ही विकिपीडिया के को-फाउंडर जिमी वेल्स ने लार्ज लैंग्वेज मॉडलों (LLMs) का इस्तेमाल भरोसेमंद सूचना स्रोत बनाने के लिए किए जाने पर गंभीर चिंता जताई है।
वेल्स ने यह बात 28 अक्टूबर, मंगलवार को न्यूयॉर्क सिटी में आयोजित CNBC टेक्नोलॉजी एग्जीक्यूटिव काउंसिल समिट में कही। वेल्स ने कहा, “जो LLMs, वह [मस्क] इसके लिए इस्तेमाल कर रहे हैं वे बहुत बड़ी गलतियां करने वाले हैं। हम जानते हैं कि ChatGPT और बाकी सभी LLMs विकी एंट्री लिखने के लिए अभी पर्याप्त अच्छे नहीं हैं।”
वेल्स ने आगे कहा, “मुझे नहीं लगता कि वह (मस्क) अभी कुछ बहुत काम का बना पाएंगे।” ग्रोकिपीडिया (Grokipedia) प्लेटफॉर्म मस्क की AI स्टार्टअप xAI द्वारा डिवेलप कन्वर्सेशनल Grok मॉडल पर आधारित है। यह टेक्नोलॉजी अरबपति मस्क का लेटेस्ट कोशिश है, उस चीज़ को चुनौती देने की जिसे वह ‘वोक विकिपीडिया’ (woke Wikipedia) कहते हैं। मस्क ने एक पोस्ट कर लिखा था, “Grokipedia, व्यापकता, गहराई और सटीकता के मामले में Wikipedia से कई गुना आगे होगा।”
Airtel और Jio में किसका प्लान है पैसा वसूल? जानें 100 रुपये के फर्क में कौन दे रहा ज्यादा फायदा
विकिपीडिया पर “woke bias” के आरोपों पर प्रतिक्रिया देते हुए वेल्स ने कहा, “वह इस बारे में गलत हैं। उनकी विकिपीडिया से शिकायत यह है कि हम मुख्यधारा के स्रोतों पर भरोसा करते हैं और मैं इसके लिए बिल्कुल भी माफी नहीं मांगता। हम किसी रैंडम व्यक्ति को The New England Journal of Medicine के बराबर नहीं मानते और इससे हम ‘वोक’ नहीं बन जाते।” वेल्स ने मजाकिया अंदाज में कहा, “यह तो एक विरोधाभास है, हम इतने ‘कट्टरपंथी’ हैं कि The New York Times को कोट करते हैं।”
वेल्स के मुताबिक, विकिपीडिया की टेक्निकल कॉस्ट को पूरा करने के लिए हर साल लगभग 175 मिलियन डॉलर खर्च होते हैं। यह लागत विकिपीडिया को उन बड़ी टेक कंपनियों के मुकाबले फायदा देती है जो अपनी AI महत्वाकांक्षाओं के तहत दसियों अरब डॉलर खर्च कर रही हैं। रिपोर्ट्स के मुताबिक, हाइपरस्केलर कंपनियों का AI खर्च अगले साल बढ़कर 550 अरब डॉलर तक पहुंचने की उम्मीद है।
AI रिसर्च टूल्स के खतरे क्या हैं?
बता दें कि इसी साल की शुरुआत से कई AI कंपनियों जैसे OpenAI, Perplexity, Anthropic और Google ने डीप रिसर्च प्रोवाइड कराने के इरादे से LLM-पावर्ड टूल लॉन्च किए हैं। हालांकि, ये डीप रिसर्च टूल (deep research tools) हैलुसिनेशन और कई दूसरी तरह की गलतियों के प्रति संवेदनशील होते हैं जो कुछ परिस्थितियों में काफी हानिकारक साबित हो सकते हैं।
वेल्स ने बताया कि जब भी किसी LLM से गहराई में जाकर जानकारी खोजने के लिए कहा जाता है तो ‘सबकुछ गड़बड़’ हो जाता है। उन्होंने एक हालिया उदाहरण देते हुए कहा कि जर्मनी की विकी कम्युनिटी के एक सदस्य ने एक रिसर्च पेपर में फर्जी संदर्भ (made-up references) पाए, जिसके बाद लेखक ने स्वीकार किया कि उसने ChatGPT का इस्तेमाल कर हवाला दिया था।
वेल्स ने आगे कहा, “हमारे लिए और पूरी विकी कम्युनिटी के लिए यह बहुत जरूरी है कि ऐसी आलोचनाओं का जवाब पूरी निष्पक्षता और भरोसेमंद स्रोतों पर ध्यान बढ़ाकर दिया जाए। हमें ‘Wokepedia’ नहीं बनना चाहिए, न यही हमारी पहचान है और न ही लोग हमसे यही उम्मीद करते हैं। ऐसा करने से लोगों का हम पर से भरोसा खत्म कर देगा।”
विकीपीडिया AI का इस्तेमाल कैसे कर रहा है?
वेल्स ने कहा कि भले ही LLMs के बारे में यह जाना जाता है कि वे अक्सर मनगढ़ंत बातें बना देते हैं। लेकिन उनकी संस्था AI का सीमित रूप से इस्तेमाल करने के तरीकों की तलाश कर रही है ताकि ऐसी अतिरिक्त जानकारी खोजी जाए जिसे प्लेटफॉर्म पर जोड़ा जा सके। उन्होंने आगे कहा कि शायद यह हमें अपना काम तेजी से करने में मदद करे।
वेल्स के अनुसार, अगर विकिपीडिया अपना खुद का LLM मॉडल विकसित कर उसे ट्रेन करे तो यह साइट के लिए एक काम का फीडबैक लूप साबित हो सकता है। हालांकि, इससे जुड़ी लागत काफी अधिक होने के कारण, फिलहाल विकिपीडिया ने इस दिशा में कोई औपचारिक कदम नहीं उठाया है और टेक्नोलॉजी के टेक्निकल फेज में ही बना हुआ है।
विकिपीडिया के लिए खतरा है AI?
भले ही विकिपीडिया को अब इस हकीकत का सामना करना पड़ रहा है कि AI-generated summaries की वजह से उसके ट्रैफिक का एक बड़ा हिस्सा कम हो रहा है, लेकिन रिपोर्टों के मुताबिक़, उसी कॉन्टेन्ट को बड़े पैमाने पर स्क्रैप करके उन्हीं LLMs को ट्रेन करने में इस्तेमाल किया गया है जो अब विकिपीडिया की जगह लेने की ताकत रखते हैं।
इस महीने की शुरुआत में प्रकाशित एक ब्लॉग पोस्ट में, ऑनलाइन एनसाइक्लोपीडिया चलाने वाली संस्था विकिमीडिया फाउंडेशन ने बताया कि उसके एल्गोरिद्म, जो वेबसाइट ट्रैफिक को इंसान और बॉट्स में बांटता है, उसने मई महीने में ब्राजील से अचानक मानव ट्रैफिक में उछाल दर्ज किया। जांच करने और एल्गोरिद्म अपडेट करने पर यह पाया गया कि मई और जून के महीनों में दिख रहा यह असामान्य रूप से ज्यादा ट्रैफिक दरअसल ऐसे बॉट्स से आ रही थी, जिन्हें पकड़े जाने से बचने के लिए डिजाइन किया गया था।
इससे निपटने के लिए, विकिपीडिया ने कहा कि वह नई नीतियां लागू कर रहा है और एक ऐसा ढांचा (framework) तैयार कर रहा है जिससे यह सुनिश्चित किया जा सके कि थर्ड पार्टीज वेबसाइट के कॉन्टेन्ट का जिम्मेदारी से इस्तेमाल और एक्सेस करें। विकिमीडिया फाउंडेशन ने यह भी कहा कि वह विकिपीडिया के कॉनटेन्ट को युवा यूजर्स तक पहुंचाने के लिए सोशल मीडिया प्लेटफॉर्म्स जैसे YouTube, TikTok, Roblox और Instagram पर भी एक्टिव रूप से काम कर रहा है।
