Compania chineză DeepSeek ar fi cheltuit mult mai mulți bani decât a anunțat oficial pentru a-și antrena modelul de inteligență artificială R1, potrivit unui raport al SemiAnalysis, o firmă de cercetare și analiză specializată în industria semiconductorilor, inteligenței artificiale și infrastructurii tehnologice, transmite Windows Central.
Inițial, a circulat informația că modelul R1 V3 al DeepSeek a fost antrenat pentru doar 6 milioane de dolari și utilizând doar aproximativ 2.040 de acceleratoare grafice Nvidia.
Cu toate acestea, raportul SemiAnalysis arată că start-up-ul chinez AI a cheltuit, de fapt, 1,6 miliarde de dolari pe hardware, inclusiv 50.000 de acceleratoare grafice Nvidia Hopper. Mai mult, ar fi avut costuri operaționale de până la 944 de milioane de dolari. Compania recrutează talente exclusiv din China, în special din instituții de top precum Universitatea Peking și Universitatea Zhejiang, oferind salarii competitive. Unii cercetători AI câștigă până la 1,3 milioane de dolari pe an la DeepSeek.
Impactul companiei asupra industriei AI a fost profund, afectând chiar și acțiunile Nvidia, care au pierdut până la 600 de miliarde de dolari din evaluarea de piață într-o singură zi. Liderii industriei, inclusiv CEO-ul Microsoft, Satya Nadella, au recunoscut importanța descoperirilor start-up-ului. Nadella a descris modelul DeepSeek ca fiind „super impresionant”, subliniind că evoluțiile AI din China trebuie luate „foarte, foarte în serios”. El a evidențiat, de asemenea, potențialul modelului de a reduce costurile.
DeepSeek funcționează independent, evitând finanțarea externă pentru a menține controlul și a preveni preluările ostile. Spre deosebire de rivalii săi, compania acordă prioritate eficienței și îmbunătățirilor algoritmice, în locul scalării agresive a modelelor.
Accesibilitatea DeepSeek a determinat OpenAI să lanseze modelul său o3-mini, cu costuri de operare reduse.