Chatbot-ul chinezesc DeepSeek, care a cutremurat luni giganții americani din domeniul tehnologiei și acțiunile lor pe bursa americană, este nou în peisajul AI. Dar cine se află în spatele său?
Pe 20 ianuarie, DeepSeek a lansat un model cu sursă deschisă (DeepSeek-R1) care bate cele mai importante modele din industrie în ceea ce privește unele criterii de referință matematice și de raționament, inclusiv capacitatea, costul, deschiderea etc. DeepSeek a depășit rivali precum ChatGPT de la OpenAI și a devenit cea mai descărcată aplicație gratuită din SUA.
Chatbotul chinezesc a fost dezvoltat pentru o fracțiune din costul rivalilor săi, ridicând întrebări cu privire la viitorul dominației americane în materie de inteligență artificială și la amploarea investițiilor pe care le planifică întreprinderile americane.
DeepSeek a declarat că a avut nevoie de 2 luni și mai puțin de 6 milioane de dolari pentru a dezvolta modelul – bazându-se pe tehnologia deja existentă și valorificând modelele existente. În comparație, OpenAI cheltuie peste 5 miliarde de dolari pe an. Se pare că DeepSeek a cumpărat 10.000 de cipuri NVIDIA, în timp ce Hyperscalers au cumpărat mai multe ori această cifră.
Cine se află în spatele DeepSeek?
Managerul chinez de fonduri speculative Liang Wenfeng se află în spatele dezvoltării DeepSeek. Afacerea a luat naștere în cadrul unității de cercetare în IA a firmei sale de fonduri speculative de 8 miliarde de dolari, High-Flyer.
Compania a fost înființată în 2023 de Liang Wenfeng în Hangzhou, un oraș din sud-estul Chinei.
Acest bărbat în vârstă de 40 de ani, absolvent de inginerie informatică și electronică, a fondat, de asemenea, fondul speculativ care a sprijinit DeepSeek.
El ar fi constituit un depozit de cipuri Nvidia A100, al căror export în China este acum interzis. Experții cred că această colecție – pe care unele estimări o cifrează la 50.000 – l-a determinat să lanseze DeepSeek, prin asocierea acestor cipuri cu altele mai ieftine, de gamă inferioară, care pot fi încă importate.
Liang a fost văzut recent la o întâlnire între experți din industrie și premierul chinez Li Qiang.
Într-un interviu din iulie 2024 cu The China Academy, Liang a declarat că a fost surprins de reacția la versiunea anterioară a modelului său de inteligență artificială.
„Nu ne așteptam ca stabilirea prețurilor să fie o problemă atât de sensibilă”, a spus el. „Pur și simplu ne urmam propriul ritm, calculam costurile și stabileam prețurile în consecință.”
Cine este Liang Wenfeng
Născut în 1985 în Zhanjiang, Guangdong, China, studiile lui Liang Wenfeng includ o diplomă de licență în ingineria informației electronice și un master în ingineria informației și comunicațiilor de la Universitatea Zhejiang.
Călătoria lui Liang a început în lumea finanțelor. Ca absolvent al programului de inginerie electronică a informației de la Universitatea Zhejiang, el a pătruns în domeniul tranzacțiilor cantitative și de înaltă frecvență.
Fondul și-a început activitatea într-un apartament din Chengdu, unde Liang Wenfeng a experimentat cu tranzacționarea automată a acțiunilor, potrivit presei locale. Profilul său din registrul asociației de gestionare a activelor din China arată că a fost liber profesionist până în 2013.
În 2015-16 a co-fondat firma de hedging Ningbo High-Flyer în 2016. Aceasta a utilizat matematica și inteligența artificială pentru strategiile de investiții.
Până în 2021, toate strategiile High-Flyer foloseau inteligența artificială, potrivit managerului Cai Liyu, folosind strategii similare celor inițiate de fondul de hedging extrem de profitabil Renaissance Technologies.
Compania angajează absolvenți
Într-un interviu acordat la sfârșitul anului trecut, Wenfeng a contestat afirmațiile conform cărora DeepSeek angaja „vrăjitori” ai inteligenței artificiale. El a declarat că startup-ul este format din „majoritatea proaspeților absolvenți ai universităților de top, candidați la doctorat în al patrulea sau al cincilea an și unii tineri care au absolvit cu doar câțiva ani în urmă”.
DeepSeek preferă să angajeze personal de la Universitatea Peking, care ocupă locul 14 la nivel global în clasamentul universităților QS. Printre absolvenții Peking angajați la DeepSeek se numără Xiaokang Chen, un specialist în viziune computerizată, fost stagiar Microsoft și absolvent de doctorat în 2024. Un inginer de sisteme de bază DeepSeek, Yixuan Tan, este un absolvent 2024 care s-a alăturat în decembrie 2023. Shangyan Zhou, dezvoltator de infrastructură DeepSeek, este absolvent al Peking 2020, dar a petrecut trei ani la fondul speculativ High-Flyer al lui Wenfeng înainte de a se alătura.
DeepSeek nu angajează exclusiv de la universități chineze. Cea mai recentă angajare a startup-ului, Wanto Gunawan, are un masterat în robotică mecatronică de la Universitatea din Melbourne și a venit săptămâna trecută de la startup-ul de inteligență artificială Prosa.
Angajarea absolvenților este o opțiune ieftină.