पिछले कुछ दिनों से बेंगलुरु का Sarvam AI लगातार चर्चा में बना हुआ है। इस एआई मॉडल ने ‘Sarvam Edge’ के साथ Sovereign AI इंफ्रास्ट्रक्चर के कॉन्सेप्ट को आगे बढ़ाया है। इसे एक इनोवेटिव ऑन-डिवाइस एआई प्लेटफॉर्म के तौर पर पेश किया गया है। यह प्लेटफॉर्म स्मार्टफोन्स और लैपटॉप पर एडवांस्ड स्पीच रिकग्निशन, ट्रांसलेशन और टेक्स्ट-टू-स्पीच जैसे कामों को ऑफलाइन चलाने में इनेबल करता है। यह मॉडल ज्यादा इंटिग्रल एआई सर्विसेज ऑफर करने के लिए एडवांस्ड LLMs जैसे Google Gemini और ChatGPT को चुनौती देता है।

भारत की संप्रभु एआई मॉडल विकसित करने की महत्वाकांक्षा के हिसाब से, Sarvam Edge एआई इन्फरेंस को क्लाउड सर्वरों से हटाकर लोकल कंज्यूमर हार्डवेयर पर ले जाता है। जिससे लगातार इंटरनेट कनेक्टिविटी की जरूरत खत्म हो जाती है। भारत के टेक विशेषज्ञ और नीति निर्माता लंबे समय से ऐसे ऑन-डिवाइस एआई मॉडल की मांग कर रहे हैं जो बड़े और ज्यादा संसाधन खपत करने वाले डेटा सेंटर्स पर निर्भरता कम कर सकें।

Sarvam Edge इंटरनेट पर निर्भरता, देरी (लेटेंसी), हर सवाल की लागत और डेटा गोपनीयता जैसी समस्याओं को कम करता है जो आमतौर पर सर्वर-बेस्ड LLMs में देखने को मिलती हैं।

सबसे अच्छी बात यह है कि यह एआई मॉडल उन जगहों पर भी काम करेगा जहां नेटवर्क उपलब्ध नहीं है। इससे दूर-दराज़ या कठिन इलाकों में भी स्मार्ट सेवाएं उपलब्ध हो सकेंगी।

Sarvam Edge: मुख्य फीचर्स और लैंग्वेज सपोर्ट

कॉम्पैक्ट और ऑप्टिमाइज़्ड मॉडल्स के जरिए Sarvam Edge तीन मुख्य फंक्शन ऑफर करता है:

मल्टीलिंगुअल स्पीच रिकग्निशन (Multilingual speech recognition): यह फीचर अपने-आप भाषा पहचानते हुए रियल-टाइम ट्रांसक्रिप्शन करता है और लाइव ऑडियो इनपुट से भी तेज़ गति से स्पीच को प्रोसेस करता है।

टेक्स्ट-टू-स्पीच (Speech synthesis): नैचुरल और इंसानी आवाज़ जैसा ऑडियो आउटपुट देता है।

बहुभाषी अनुवाद (Multilingual translation): तुरंत दो-तरफा (bidirectional) अनुवाद की सुविधा मिलती है।

Sarvam Edge स्पीच रिकग्निशन और टेक्स्ट-टू-स्पीच के लिए कुल 10 प्रमुख भारतीय भाषाओं को सपोर्ट करता है। जबकि ट्रांसलेशन फीचर 11 भाषाओं (अंग्रेज़ी सहित) में 110 लैंग्वेज पेयर्स को कवर करता है।

Sarvam AI का कहना है कि इसके मॉडल यूनिफाइड और कुशल हैं जिन्हें प्रदर्शन से समझौता किए बिना बेहतर तरीके से कंप्रेस करने के लिए डिज़ाइन किया गया है। इससे मेमोरी का इस्तेमाल कम और फास्ट रिस्पॉन्स टाइम सुनिश्चित होता है। इसके साथ ही, मॉडर्न मोबाइल प्रोसेसर और लैपटॉप पर इसे चलाने के लिए किसी खास हार्डवेयर की जरूरत नहीं होती।

परफॉर्मेंस की बात करें तो सबसे बड़ी खासियत रियल-टाइम प्रोसेसिंग स्पीड है। जैसे कि डेमो के दौरान MacBook Pro पर 40 टोकन प्रति सेकंड से अधिक की गति हासिल की गई। कुछ मामलों में पीक मेमोरी इस्तेमाल 10GB से कम रहा जो यह दिखाता है कि यह मॉडल मौजूदा उपभोक्ता डिवाइस पर भी प्रभावी रूप से चल सकता है।

Sarvam Edge के साथ एआई ज्यादा प्राइवेट और फास्ट

सर्वम एआई का कहना है कि Sarvam Edge डिवाइस पर ही इंटेलिजेंस उपलब्ध कराकर एआई को ज्यादा तेज़, प्राइवेट और हर जगह सुलभ बनाएगा। को-फाउंडर Pratyush Kumar ने X पर लॉन्च की घोषणा करते हुए कहा, ”उन्होंने कहा, “ड्रॉप 10/14: हम Sarvam Edge की घोषणा कर रहे हैं जो इंटेलिजेंस को ऑफलाइन और डिवाइस पर चलाने की हमारी समर्पित पहल है। हमारा लक्ष्य ऐसा एआई बनाना है जो कुशल, निजी और हर जगह सुलभ हो।”

यह प्लेटफॉर्म लीडिंग ग्लोबल डिवाइस निर्माताओं के साथ मिलकर डिवेलप किया जा रहा है ताकि मॉडल के डिज़ाइन को हार्डवेयर क्षमताओं के अनुरूप ढाला जा सके और ऑन-डिवाइस एआई को आगे बढ़ाया जा सके।

Sarvam Edge जैसे ऑनबोर्ड एआई मॉडल के संभावित इस्तेमाल की बात करें तो इसमें शिक्षा (ऑफलाइन ट्यूटर), एक्सेसिबिलिटी (रियल-टाइम वॉयस असिस्टेंस), वित्त (सुरक्षित लोकल प्रोसेसिंग), प्रोडक्टिविटी टूल्स और वॉयस-आधारित ऐप्स शामिल हैं। यह खासतौर पर भारत के ग्रामीण या कम कनेक्टिविटी वाले क्षेत्रों में बेहद काम का साबित हो सकता है।