ताज़ा और वास्तविक सामग्री के साथ स्वाभाविक रूप से भाषाएँ सीखें!

टैप करके अनुवाद करें - रिकॉर्डिंग

क्षेत्र के अनुसार खोजें

flag चीनी ए. आई. स्टार्टअप दीपसीक ने बड़े मॉडलों को अधिक कुशल बनाने, लागत कम करने और मापनीयता बढ़ाने के लिए नई विधि पेश की है।

flag चीनी ए. आई. स्टार्टअप दीपसीक ने मैनिफोल्ड-कॉन्स्ट्रेन्ड हाइपर-कनेक्शन नामक एक नई प्रशिक्षण विधि का अनावरण किया है, जिसे कम्प्यूटेशनल और ऊर्जा लागत को कम करते हुए बड़े ए. आई. मॉडल को अधिक कुशल और स्केलेबल बनाने के लिए डिज़ाइन किया गया है। flag संस्थापक लियांग वेनफेंग द्वारा सह-लिखित और arXiv पर प्रकाशित एक पेपर में विस्तृत तकनीक, पूर्व मॉडल में प्रशिक्षण अस्थिरता और स्मृति के मुद्दों को संबोधित करती है, जिससे न्यूनतम जोड़ी गई गणना के साथ 3 बिलियन से 27 बिलियन पैरामीटर प्रणालियों में स्थिर प्रशिक्षण को सक्षम किया जाता है। flag बाइटडांस के पहले के काम के आधार पर, यह दृष्टिकोण अमेरिकी अर्धचालक प्रतिबंधों के बावजूद एआई नवाचार के लिए चीन के प्रयास को दर्शाता है। flag रिलीज दीपसीक के अगले प्रमुख मॉडल, संभवतः आर2 के लिए प्रत्याशा को बढ़ावा देती है, जो फरवरी में स्प्रिंग फेस्टिवल के आसपास होने की उम्मीद है।

7 लेख

आगे पढ़ें