Un experiment recent al Universității Carnegie Mellon, denumit TheAgentCompany, a avut ca scop simularea unei firme de software alcătuită în întregime din agenți AI proveniți de la mari companii de tehnologie precum Google, OpenAI, Anthropic, Amazon și Meta, transmite Futurism. Rezultatele indică faptul că temerile privind preluarea iminentă a locurilor de muncă de către AI sunt premature.
Agenții AI, cărora li s-au atribuit roluri precum analist financiar și inginer software și cărora li s-au dat sarcini din lumea reală, precum navigarea în directoare de fișiere și redactarea de evaluări de performanță, au demonstrat o performanță „ridicol de haotică”, potrivit cercetătorilor.
Cel mai de succes model, Claude 3.5 Sonnet de la Anthropic, a finalizat doar 24% din sarcinile sale, cu un cost mediu prohibitiv de peste 6 dolari per sarcină. Gemini 2.0 Flash de la Google a atins o rată de succes de 11,4%, în timp ce Nova Pro v1 de la Amazon a finalizat doar 1,7% din sarcinile sale.
Urmărește mai jos producțiile video ale Economedia:
- articolul continuă mai jos -
Cercetătorii au concluzionat că agenții sufereau de „lipsa bunului simț, abilități sociale slabe și o înțelegere deficitară a modului de navigare pe internet”.
În plus, angajații AI au creat scurtături defectuoase pentru a finaliza sarcinile. De exemplu, un agent, incapabil să găsească persoana potrivită căreia să îi pună o întrebare, a recurs la „redenumirea unui alt utilizator cu numele utilizatorului dorit”.
Studiul sugerează că, deși AI poate gestiona sarcini mai mici, este departe de a poseda capacitățile de rezolvare a problemelor și adaptabilitatea inteligenței umane.