OpenAI lansează o „previzualizare de cercetare” a unui agent AI numit Operator care poate „naviga pe web pentru a efectua sarcini pentru dvs.”, conform unei postări pe blog, notează The Verge.
„Utilizând propriul său browser, acesta se poate uita la o pagină web și poate interacționa cu aceasta prin tastare, clic și derulare”, spune OpenAI. Acesta se lansează mai întâi în SUA pentru abonații la nivelul ChatGPT Pro de 200 de dolari pe lună al OpenAI.
Operator se bazează pe un model „Computer-Using Agent” care combină capacitățile de vedere ale GPT-4o cu „raționamentul avansat prin învățarea prin consolidare” pentru a putea interacționa cu interfețele grafice, spune OpenAI. „Operator poate „vedea” (prin capturi de ecran) și „interacționa” (folosind toate acțiunile pe care le permit un mouse și o tastatură) cu un browser, permițându-i să acționeze pe web fără a necesita integrări API personalizate”, potrivit OpenAI.
A research preview of Operator, an agent that can use its own browser to perform tasks for you. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) January 23, 2025
Operator poate folosi raționamentul pentru a se „autocorecta”, iar dacă se blochează, îi va oferi utilizatorului controlul. De asemenea, va solicita utilizatorului să preia controlul atunci când un site web solicită informații sensibile, cum ar fi date de conectare, și „ar trebui” să solicite aprobarea unui utilizator pentru acțiuni precum trimiterea unui e-mail. OpenAI mai spune că operatorul a fost conceput pentru „a refuza solicitările dăunătoare și a bloca conținutul interzis”.
OpenAI spune că colaborează cu companii precum DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber, astfel încât Operator „să răspundă nevoilor din lumea reală, respectând în același timp normele stabilite”. Dar compania avertizează că nu totul ar putea funcționa încă așa cum vă așteptați; instrumentul are în prezent probleme cu „interfețele complexe, cum ar fi crearea de prezentări sau gestionarea calendarelor”.
Pe parcurs, OpenAI spune că intenționează să aducă Operator pentru utilizatorii Plus, Team și Enterprise și „să integreze aceste capacități în ChatGPT”.