Cele mai importante grupuri de inteligență artificială din lume își concentrează tot mai mult atenția asupra modelelor cu AI care pot înțelege mai bine mediile umane, în căutarea unor noi modalități de a atinge „superinteligența” mașinilor, potrivit Financial Times.
Urmărește mai jos producțiile video ale Economedia:
- articolul continuă mai jos -
Google DeepMind, Meta și Nvidia se numără printre companiile care încearcă să câștige teren în cursa AI prin dezvoltarea de sisteme care urmăresc să navigheze în lumea fizică învățând din videoclipuri și date robotice, nu doar din limbaj.
Această tendință apare pe măsură ce apar întrebări despre modelele mari de limbaj, tehnologia care alimentează chatboți populari, cum ar fi ChatGPT de la OpenAI, ating un plafon în progresul lor. Salturile de performanță între LLM-urile lansate de companiile din sector, cum ar fi OpenAI, Google și xAI a lui Elon Musk, au încetinit, în ciuda sumelor uriașe investite în dezvoltarea lor.
Potrivit lui Rev Lebaredian, vicepreședinte pentru Omniverse și tehnologie de simulare la Nvidia, piața potențială pentru modelele lumii ar putea fi uriașă, aproape de dimensiunea economiei globale, deoarece aduce tehnologia în domeniul fizic, cum ar fi sectoarele de producție și sănătate.
Modelele sunt antrenate folosind fluxuri de date din medii reale sau simulate. Ele sunt considerate un pas important în progresul mașinilor autonome, roboticii și așa-numiților agenți AI, dar necesită o cantitate uriașă de date și putere de calcul pentru antrenare și sunt considerate o provocare tehnică nerezolvată.
Această concentrare pe o abordare alternativă față de LLM-uri a devenit vizibilă pe măsură ce mai multe grupuri AI au prezentat o serie de progrese în modelele lumii în ultimele luni.
Luna trecută, Google DeepMind a prezentat Genie 3, care generează cadre video pas cu pas și ține cont de interacțiunile anterioare. Anterior, modelele de generare video au creat de obicei videoclipul integral dintr-o dată, nu pas cu pas.
Meta încearcă să reproducă modul în care copiii învață pasiv observând lumea din jurul lor, antrenând modelele V-JEPA pe conținut video brut. Laboratorul său Facebook Artificial Intelligence Research (Fair), condus de cercetătorul șef AI al Meta, Yann LeCun, și axat pe proiecte AI pe termen lung, a lansat a doua versiune a modelului în iunie, pe care a testat-o pe roboți.
LeCun, considerat unul dintre „maeștrii” AI-ului modern, a fost unul dintre cei mai vocali susținători ai noii arhitecturi, avertizând că LLM-urile nu vor dobândi niciodată capacitatea de a raționa și de a planifica ca oamenii.
În ciuda acestui fapt, șeful Meta, Mark Zuckerberg, a crescut recent investițiile în talente AI de top, cu o echipă de elită care acum lucrează pentru a obține descoperiri în următoarele modele LLM Llama. Aceasta a inclus angajarea lui Alexandr Wang, fondatorul grupului de etichetare de date Scale AI, pentru a conduce tot lucrul Meta în AI, LeCun raportând acum lui Wang.