În cadrul unei postări pe platforma Reddit de tipul „ask me anything” („întreabă-mă orice”), CEO-ul OpenAI, Sam Altman, a recunoscut că lipsa capacității de calcul este un obstacol major pentru companie, împiedicând livrarea rapidă a produselor.
Modelele AI dezvoltate de OpenAI au devenit din ce în ce mai complexe, iar alocarea adecvată a resurselor de calcul este o provocare. OpenAI a avut dificultăți în obținerea infrastructurii necesare pentru rularea și antrenarea modelelor de inteligența artificială generativă.
Chiar săptămâna aceasta, Reuters, citând surse, a transmis că OpenAI colaborează de luni de zile cu Broadcom pentru a crea un cip AI pentru rularea modelelor, care ar putea fi gata în 2026, relatează Techcrunch.
Din cauza capacității limitate, Altman a spus că funcția de conversație cu sunet realist a OpenAI pentru ChatGPT, Advanced Voice Mode, nu va primi prea curând capacitățile de viziune prezentate pentru prima dată în aprilie.
La evenimentul său de presă din aprilie, OpenAI a prezentat aplicația ChatGPT care rulează pe un smartphone și care răspunde la indicii vizuale, cum ar fi hainele purtate de cineva, în raza de acțiune a camerei telefonului.
„Toate aceste modele au devenit destul de complexe”, a scris el ca răspuns la o întrebare despre motivul pentru care următoarele modele AI ale OpenAI au durat atât de mult. „De asemenea, ne confruntăm cu o mulțime de limitări și decizii dificile cu privire la felul în care am alocat calculul nostru către multe idei minunate”.
Rapoartele Fortune au dezvăluit ulterior că demonstrația a fost făcută în grabă pentru a distrage atenția de la conferința dezvoltatorilor I/O a Google, care a avut loc în aceeași săptămână. Mulți din cadrul OpenAI nu credeau că GPT-4o era pregătit pentru a putea fi lansat. În consecință, versiunea exclusiv vocală a Advanced Voice Mode a fost amânată luni de zile.
În cadrul AMA, Altman a indicat că următoarea versiune majoră a generatorului de imagini OpenAI, DALL-E, nu are încă un termen de lansare.
Între timp, Sora, instrumentul de generare video al OpenAI, a fost încetinit de „necesitatea de a perfecționa modelul, de a obține siguranța/impersonalizarea/alte lucruri corecte și de a scala calculul”, a scris Kevin Weil, directorul de produs al OpenAI, care a participat, de asemenea, la AMA.
Se pare că Sora a suferit neajunsuri tehnice ce l-au dezavantajat în fața sistemelor concurente de pe piață precum Luma, Runway și alții. Sistemul original lansat pe piață în dezvăluit în lina februarie, a necesitat mai mult de 10 minute de timp de procesare pentru a realiza un clip video de 1 minut. În luna octombrie, unul dintre co-liderii Sora, Tim Brooks, a plecat la Google.
Sam Altman a mai declarat că OpenAI ia în considerare posibilitatea de a permite conținutul „not safe for work” în ChatGPT într-o bună zi. Altman consideră că utilizatorii adulți trebuie tratați ca niște adulți și că prioritatea principală a companiei este îmbunătățirea seriei sale o1 de modele de „raționament” și a succesorilor acestora. OpenAI a prezentat în avanpremieră o serie de caracteristici care urmează să apară în o1 la conferința DevDay din Londra în această săptămână, inclusiv înțelegerea imaginilor. Vor apărea versiuni mai bune ale ChatCPT-ului, dar nu ceva pe care îl vor putea numi GPT-5.