दोस्तों जैसे की आपको ChatGPT देखने को मिलता है, गूगल Gemini देखने को मिलता है वैसे ही इंडिया में अपनी खुद की Ai हमें क्यों नहीं देखने को मिलती है और ये सवाल पिछले कई सालों से आ रहा है, जबसे ChatGPT और गूगल Gemini आया तब से।लेकिन अब आपको एक खास बात बता दूं की इंडिया ने भी अब अपना खुद का Ai लांच कर दिया है, जिसका नाम है सर्वम एआई। सबसे बड़ी बात यह है की इस Ai के बारे में अभी बहुत से लोगों को पता ही नहीं है।इसलिए आज के इस आर्टिकल में हम इसी के बारे में बात करेंगे की यह Ai एकजेक्टली क्या है?कहाँ से शुरू हुआ है और किस तरीके से इम्पैकट करने वाला है। तो चलिए बिना किसी देरी के पोस्ट में आगे बढ़ते हैं।
विजन टू बिल्ड Ai फॉर इंडियन लैंग्वेजेस
सर्वम Ai से पहले जो कंपनी थी उसे एआई फॉर भारत कहा जाता था और यह इनीशियटिव इन्होंने IIT मद्रास में शुरू किया था। इसी के साथ इसके जो फाउंडर थे वो प्रत्युष कुमार और विवेक राघवन थे। 2023 में जब ChatGPT का इंडिया में रिवोल्यूशन आ रहा था तभी इन्होंने इस कंपनी का रिब्रांड सर्वम एआई के रूप में किया था।दोस्तों इन दोनों लोगों का विजन साफ था की हमें अपना खुद का भारत का एआई बनाना है और इन्होंने यह कर दिखाया।
सर्वम विजन मॉडल 3 क्या कर सकता है?
अब सर्वम Ai का जो जो सबसे पॉपुलर मॉडल है वो है सर्वम विजन। यह एक 3 विलियन पैरामीटर वाला विजन लैंग्वेज मॉडल है, इसका काम है की टेस्ट या फिर पीडीएफ या कोई फिर कोई इमेज वगैरह हो उसको डिजिटल डॉक्यूमेंट में कन्वर्ट करना। यह स्कैन किये गए पेपर,डॉक्यूमेंट फॉर्म, हैंडराइटिंग,टेबल चार्ट्स आदि को यह पढ़ सकता है और खासकर जो भारत की 22 भाषाएं हैं उसमें यह ट्रांसफॉर्म उन्हें कर सकता है।
वेबसाइट इंटरफेस और उपलब्ध टूल
दोस्तों आप गूगल में जाकर sarvam.ai साइट में साइन अप कर सकते हैं, जहाँ आपको टेक्स्ट टू स्पीच का मॉडल मिल जाता है।यहां पर आप कई सारे कन्वर्सशेसनल टोन, ऑडियो बुक्स,इंटरटेनमेंट इन सभी फॉर्मेट के लिए आप ऑडियो जेनरेट कर सकते हैं।इसके अलावा यहां पर विजन मॉडल मिल जाता है जिसके बारे में आपको मैंने पहले ही बताया था की यह डॉक्यूमेंट को डिजिटलाइज करने में काफी ज्यादा हेल्प कर सकता है।इसके अलावा यहां स्पीच टू टेक्स्ट का ऑप्शन भी है, जहाँ आप ऑडियो को अपलोड कर सकते हैं या बोलकर भी ट्रांसक्राइब कर सकते हैं।
Bulbul V3 और Saaras V3
दोस्तों अभी इनका Bulbul V3 टेक्स्ट टू स्पीच वाला लेटेस्ट मॉडल लांच हुआ है।इसके अलावा इनके पास सारस V3 स्पीच टू टेक्स्ट वाला मॉडल भी है। अब जो Bulbul V3 है न ये इनका नेचुरल साउंड वाला मॉडल है।इसके अलावा भी इनके कई सारे मॉडल हैं जैसे टेक्स्ट ट्रांसलेशन के लिए मयूरा मॉडल है,उसके बाद सर्वम मॉडल है।इसके साथ ही ये मॉडल कई सारे लैंग्वेजेस को सपोर्ट भी करते हैं।अब अगर हम इसके बेंचमार्क की बात करें तो इसका जो सर्वम मॉडल है उसका बेंचमार्क आपको ठीक - ठाक ही देखने को मिल जाता है।
प्राईसिंग और क्रेडिट
सर्वम Ai जो है भारत की एक बहुत ही महत्वपूर्ण एआई कंपनी है और यह बेंगलुरु में है।अब अगर इनके प्रोडेक्ट की बात करें तो इसमें आपको इनके कन्ववर्सेशनल एजेंट मिल जाते हैं, जिनसे आप बातचीत कर सकते हैं। इसके अलावा इसमें आपको इनका वॉइस डीबगिंग का भी फीचर आपको मिल जाता है।इनका जो प्लान है वो काफी सस्ता है।जैसे ही आप इसमें लॉग इन करते हो तो आपको 1000 क्रेडिट मिल जाते हैं। इसी के साथ आप इसमें कितना खर्च करते हैं उसका टोकन वाइज या रिक्वेस्ट वाइज उसका पूरा हिसाब आपको मिल जाता है।
निष्कर्ष
वास्तव में सर्वम एआई भारत के लिए एक बड़ा कदम साबित हो सकता है, खासकर भारतीय भाषाओं और लोकल जरूरतों को ध्यान में रखते हुए। यह सिर्फ एक एआई टूल नहीं, बल्कि डिजिटल इंडिया की नई दिशा है। आने वाले समय में अगर इसे सही सपोर्ट और पहचान मिली, तो यह ग्लोबल एआई मार्केट में भी अपनी मजबूत जगह बना सकता है। इसलिए अब समय है कि हम इसे जानें, समझें और अपनाएं मिलते हैं अगले आर्टिकल में तब तक के लिए धन्यवाद।


0 टिप्पणियाँ