Compania chineză de inteligență artificială DeepSeek a întârziat lansarea noului său model, după ce nu a reușit să îl antreneze folosind cipurile Huawei. China face eforturi în a înlocui tehnologia americană, potrivit Financial Times.
Urmărește mai jos producțiile video ale Economedia:
- articolul continuă mai jos -
DeepSeek a fost încurajată de autorități să adopte procesorul Ascend al Huawei în locul sistemelor Nvidia după lansarea modelului R1 în ianuarie, potrivit trei persoane familiarizate cu acest subiect.
Start-up-ul chinez s-a confruntat cu probleme tehnice persistente în timpul procesului de antrenare a modelului R2 folosind cipuri Ascend, ceea ce l-a determinat să utilizeze cipuri Nvidia pentru antrenare și cipuri Huawei pentru inferență, au spus sursele.
Problemele au fost principalul motiv pentru care lansarea modelului a fost amânată din mai, spune o persoană familiarizată cu situația, ceea ce a dus la pierderea terenului în fața rivalilor.
Antrenarea implică învățarea modelului dintr-un set mare de date, în timp ce inferența se referă la etapa de utilizare a unui model antrenat pentru a face predicții sau a genera un răspuns, cum ar fi o interogare chatbot.
Dificultățile DeepSeek arată cum cipurile chinezești sunt încă în urma rivalilor americani în ceea ce privește sarcinile critice, evidențiind provocările cu care se confruntă China în efortul său de a deveni autonomă din punct de vedere tehnologic.
Financial Times a raportat săptămâna aceasta că Beijingul a cerut companiilor chineze de tehnologie să justifice comenzile lor de H20 de la Nvidia, într-o mișcare menită să le încurajeze să promoveze alternative produse de Huawei și Cambricon.
Specialiștii din industrie au afirmat că cipurile chinezești au probleme de stabilitate, conectivitate inter-cip mai lentă și software inferior în comparație cu produsele Nvidia.
Huawei a trimis o echipă de ingineri la sediul DeepSeek pentru a ajuta compania să utilizeze cipul său AI pentru a dezvolta modelul R2, potrivit a două persoane. Cu toate acestea, în ciuda prezenței echipei la fața locului, DeepSeek nu a reușit să efectueze o testare de succes a cipului Ascend, au afirmat sursele.
DeepSeek continua să colaboreze cu Huawei pentru a face modelul compatibil cu Ascend pentru inferență, au spus persoanele respective.
Fondatorul Liang Wenfeng a declarat intern că era nemulțumit de progresul R2 și că a insistat să se aloce mai mult timp pentru a construi un model avansat care să mențină poziția de lider a companiei în domeniul AI, au spus ei.
Lansarea R2 a fost, de asemenea, întârziată din cauza etichetării datelor mai lungi decât se aștepta pentru modelul său actualizat, a adăugat o altă persoană. Presa chineză a sugerat că modelul ar putea fi lansat în următoarele săptămâni.