Într-o companie experimentală, angajații au fost înlocuiți cu agenți AI în roluri precum analist financiar și inginer software. A urmat un haos total / Cercetători: Performanța unor modele precum Claude 3.5 sau Gemini 2.0, „ridicol de haotică”

roboti la un targ d etehnologie din china Sursa foto: IMAGO / imago stock&people / Profimedia

Un experiment recent al Universității Carnegie Mellon, denumit TheAgentCompany, a avut ca scop simularea unei firme de software alcătuită în întregime din agenți AI proveniți de la mari companii de tehnologie precum Google, OpenAI, Anthropic, Amazon și Meta, transmite Futurism. Rezultatele indică faptul că temerile privind preluarea iminentă a locurilor de muncă de către AI sunt premature.

Urmărește mai jos producțiile video ale Economedia:

- articolul continuă mai jos -

Agenții AI, cărora li s-au atribuit roluri precum analist financiar și inginer software și cărora li s-au dat sarcini din lumea reală, precum navigarea în directoare de fișiere și redactarea de evaluări de performanță, au demonstrat o performanță „ridicol de haotică”, potrivit cercetătorilor.

Cel mai de succes model, Claude 3.5 Sonnet de la Anthropic, a finalizat doar 24% din sarcinile sale, cu un cost mediu prohibitiv de peste 6 dolari per sarcină. Gemini 2.0 Flash de la Google a atins o rată de succes de 11,4%, în timp ce Nova Pro v1 de la Amazon a finalizat doar 1,7% din sarcinile sale.

Analize Economedia

Piața de curierat, România, Cargus, Sameday, Fan Courier, Profit net, Cifră de afaceri, Pachet
Fermier cu legume
Linie asamblare uzina Dacia Mioveni (4)
Imagine apa piscină
Job, căutare de job, șomeri, tineri șomeri
Knauf Insulation, fabrica vata minerala sticla
George-Simion-Nicusor-Dan (1)
Steaguri Romania si UE
bani, lei, finante, bancnote, euro, 5 lei
bec iluminat, becuri
piata auto, uniunea europeana, romania
recesiune
sua dolari drapel ajutor steag flag us bani karolina-grabowska-4386425
Piata 9 restaurant
recesiune
tineri programatori foto
Corinthia
criza de ouă din SUA
2265634-800x534
retea electrica - Transelectrica
digitalizare, calculator, cod, programare
statele unite, sua, washington, china, beijing, putere, geopolitica, razboi economic comercial, sanctiuni economice
antreprenoare, femeie, business, tech
tineri joburi IUF- The International University Fair
parc nufarul
economie razboi bani
romania germania
Concedieri scaderi economie
industrie forta de munca somaj industrial uzina fabrica manufactura muncitor muncitor necalificat
blindate, armata, militar

Cercetătorii au concluzionat că agenții sufereau de „lipsa bunului simț, abilități sociale slabe și o înțelegere deficitară a modului de navigare pe internet”.

În plus, angajații AI au creat scurtături defectuoase pentru a finaliza sarcinile. De exemplu, un agent, incapabil să găsească persoana potrivită căreia să îi pună o întrebare, a recurs la „redenumirea unui alt utilizator cu numele utilizatorului dorit”.

Studiul sugerează că, deși AI poate gestiona sarcini mai mici, este departe de a poseda capacitățile de rezolvare a problemelor și adaptabilitatea inteligenței umane.