ताज़ा और वास्तविक सामग्री के साथ स्वाभाविक रूप से भाषाएँ सीखें!

लोकप्रिय विषय
क्षेत्र के अनुसार खोजें
चीनी ए. आई. स्टार्टअप दीपसीक ने बड़े मॉडलों को अधिक कुशल बनाने, लागत कम करने और मापनीयता बढ़ाने के लिए नई विधि पेश की है।
चीनी ए. आई. स्टार्टअप दीपसीक ने मैनिफोल्ड-कॉन्स्ट्रेन्ड हाइपर-कनेक्शन नामक एक नई प्रशिक्षण विधि का अनावरण किया है, जिसे कम्प्यूटेशनल और ऊर्जा लागत को कम करते हुए बड़े ए. आई. मॉडल को अधिक कुशल और स्केलेबल बनाने के लिए डिज़ाइन किया गया है।
संस्थापक लियांग वेनफेंग द्वारा सह-लिखित और arXiv पर प्रकाशित एक पेपर में विस्तृत तकनीक, पूर्व मॉडल में प्रशिक्षण अस्थिरता और स्मृति के मुद्दों को संबोधित करती है, जिससे न्यूनतम जोड़ी गई गणना के साथ 3 बिलियन से 27 बिलियन पैरामीटर प्रणालियों में स्थिर प्रशिक्षण को सक्षम किया जाता है।
बाइटडांस के पहले के काम के आधार पर, यह दृष्टिकोण अमेरिकी अर्धचालक प्रतिबंधों के बावजूद एआई नवाचार के लिए चीन के प्रयास को दर्शाता है।
रिलीज दीपसीक के अगले प्रमुख मॉडल, संभवतः आर2 के लिए प्रत्याशा को बढ़ावा देती है, जो फरवरी में स्प्रिंग फेस्टिवल के आसपास होने की उम्मीद है।
Chinese AI startup DeepSeek introduces new method to make large models more efficient, reducing costs and boosting scalability.