चीन बना रहा सेल्फ डेवलपिंग एआई टूल, बिना ट्रेनिंग के हो जाएंगे एक्सपर्ट

# ## Technology

अभिषेक राय

(www.arya-tv.com) आर्टिफिशियल इंटिलेंजिस (एआई) को कुछ दिनों पहले तक एक महंगी तकनीक के तौर पर देखा जाता था लेकिन डीपसीक के आने के बाद यह भ्रम खत्म हो गया। आमतौर पर किसी भी एआई टूल को लॉन्च करने से पहले उसकी ट्रेनिंग होती है जो कि लंबे समय तक चलती है और इसमें काफी पैसे भी खर्च होते हैं लेकिन अब चीन की अग्रणी स्टार्टअप DeepSeek और त्सिंगहुआ विश्वविद्यालय साथ मिलकर एक ऐसे एआई मॉडल्स को तैयार कर रहे हैं जिसे नाम मात्र की ट्रेनिंग की जरूरत होगी। इसका उद्देश्य ऑपरेशनल खर्चों में कटौती, जिससे एआई मॉडल्स को कम संसाधनों में भी उच्च गुणवत्ता वाला प्रदर्शन मिल सके।
जनवरी में अपने कम लागत वाले रीजनिंग मॉडल से चर्चा में आए DeepSeek ने बीजिंग स्थित इस प्रतिष्ठित शैक्षणिक संस्थान के शोधकर्ताओं के साथ मिलकर एक शोध-पत्र प्रकाशित किया है। इस शोध में रिइन्फोर्समेंट लर्निंग (Reinforcement Learning) के एक नया नजरिया प्रस्तुत किया है, जिसे टीम ने “सेल्फ-प्रिंसिपल्ड क्रिटिक ट्यूनिंग” नाम दिया है।

क्या है यह नई तकनीक?
यह तकनीक एआई मॉडल्स को मानवीय प्राथमिकताओं के अनुसार बेहतर कार्य करने हेतु प्रशिक्षित करती है। इसमें ऐसे उत्तरों को इनाम दिए जाते हैं जो सटीक हों। पारंपरिक रिइन्फोर्समेंट लर्निंग जहां कुछ विशिष्ट कार्यों में ही असरदार साबित हुई है, वहीं DeepSeek का यह इनोवेशन सामान्य और बहुआयामी उपयोगों में इसे अधिक प्रभावी बनाने का प्रयास है। शोध-पत्र के अनुसार, यह नई रणनीति मौजूदा तरीकों और मॉडलों की तुलना में बेहतर प्रदर्शन करती है और साथ ही कंप्यूटिंग संसाधनों की खपत भी कम करती है।

DeepSeek-GRM: नया अध्याय
DeepSeek ने अपने इन नए मॉडलों को DeepSeek-GRM नाम दिया है, जो “Generalist Reward Modeling” का संक्षिप्त रूप है। कंपनी का कहना है कि ये मॉडल ओपन सोर्स के रूप में जारी किए जाएंगे, जिससे अन्य डेवलपर्स भी इस तकनीक का लाभ ले सकें।