Într-o companie experimentală, angajații au fost înlocuiți cu agenți AI în roluri precum analist financiar și inginer software. A urmat un haos total / Cercetători: Performanța unor modele precum Claude 3.5 sau Gemini 2.0, „ridicol de haotică”

roboti la un targ d etehnologie din china Sursa foto: IMAGO / imago stock&people / Profimedia

Un experiment recent al Universității Carnegie Mellon, denumit TheAgentCompany, a avut ca scop simularea unei firme de software alcătuită în întregime din agenți AI proveniți de la mari companii de tehnologie precum Google, OpenAI, Anthropic, Amazon și Meta, transmite Futurism. Rezultatele indică faptul că temerile privind preluarea iminentă a locurilor de muncă de către AI sunt premature.

Agenții AI, cărora li s-au atribuit roluri precum analist financiar și inginer software și cărora li s-au dat sarcini din lumea reală, precum navigarea în directoare de fișiere și redactarea de evaluări de performanță, au demonstrat o performanță „ridicol de haotică”, potrivit cercetătorilor.

Cel mai de succes model, Claude 3.5 Sonnet de la Anthropic, a finalizat doar 24% din sarcinile sale, cu un cost mediu prohibitiv de peste 6 dolari per sarcină. Gemini 2.0 Flash de la Google a atins o rată de succes de 11,4%, în timp ce Nova Pro v1 de la Amazon a finalizat doar 1,7% din sarcinile sale.

Analize Economedia

sua dolari drapel ajutor steag flag us bani karolina-grabowska-4386425
recesiune
tineri programatori foto
Corinthia
criza de ouă din SUA
2265634-800x534
retea electrica - Transelectrica
digitalizare, calculator, cod, programare
statele unite, sua, washington, china, beijing, putere, geopolitica, razboi economic comercial, sanctiuni economice
antreprenoare, femeie, business, tech
tineri joburi IUF- The International University Fair
parc nufarul
economie razboi bani
romania germania
Concedieri scaderi economie
industrie forta de munca somaj industrial uzina fabrica manufactura muncitor muncitor necalificat
blindate, armata, militar
Bugetul familiei, bani
dambovita arena aci
afacere semnare contract pexels
șantier aeroport craiova
costuri, cladiri, birouri, angajati
software, calculator, IT
CV locuri de munca job
MixCollage-21-Dec-2024-07-15-PM-1798
economie 2024
grafic crestere dreamstime
tranzactii calcula fuziuni
locuinta constructii bricolaj
salariu, bani, lei

Urmărește mai jos producțiile video ale Economedia:

- articolul continuă mai jos -

Cercetătorii au concluzionat că agenții sufereau de „lipsa bunului simț, abilități sociale slabe și o înțelegere deficitară a modului de navigare pe internet”.

În plus, angajații AI au creat scurtături defectuoase pentru a finaliza sarcinile. De exemplu, un agent, incapabil să găsească persoana potrivită căreia să îi pună o întrebare, a recurs la „redenumirea unui alt utilizator cu numele utilizatorului dorit”.

Studiul sugerează că, deși AI poate gestiona sarcini mai mici, este departe de a poseda capacitățile de rezolvare a problemelor și adaptabilitatea inteligenței umane.

Comentarii

Pentru a posta un comentariu, trebuie să te Înregistrezi sau să te Autentifici.