Compania de inteligență artificială Anthropic a anunțat capacități noi pentru modelele Claude AI de a încheia conversațiile cu utilizatorii abuzivi

Compania de inteligență artificială Anthropic a anunțat noi capacități care vor permite unor dintre cele mai noi și mai mari modele ale sale să încheie conversațiile abuzive. Anthropic afirmă că face acest lucru nu pentru a proteja utilizatorul uman, ci pentru modelul AI în sine, potrivit TechCrunch.

Urmărește mai jos producțiile video ale Economedia:
- articolul continuă mai jos -

Compania descrie aceste situații drept „cazuri rare, extreme de interacțiuni persistente dăunătoare sau abuzive ale utilizatorilor”.

Compania nu susține că modelele sale Claude AI sunt conștiente sau pot fi afectate de conversațiile cu utilizatorii. În propriile sale cuvinte, Anthropic rămâne „extrem de nesigur cu privire la statutul moral potențial al lui Claude și al altor LLM-uri, acum sau în viitor”.

Analize Economedia

ANALIZĂ. Ce ar putea însemna majorarea capitalului social pentru firme: Măsură necesară, dar creșterea e prea bruscă. Noile înregistrări de firme s-ar putea reduce/ Cristian Bărcan, fondator REGnet: „Impactul ar fi resimțit mai ales de firmele mici, motorul economiei, care reprezintă peste 95% din totalul companiilor din România”

ANALIZĂ. Ce acțiuni de la Bursa de Valori București au „bătut” constant piața în ultimii cinci ani / Două companii din eșalonul doi se fac remarcate

investiții, creșteri, acțiuni, bursă, taur, bull

ANALIZĂ Ce companii de la bursa românească au oferit în ultimii cinci ani cele mai consistente randamente ale dividendelor / Cum se schimbă topul dacă luăm în calcul și evoluția acțiunilor

cresteri, dividende, bursa, piata de capital

Piața imobiliară din Dubai atrage românii, dar rămâne una de nișă / Este un recul pe piața din România, dar aceasta rămâne încă atractivă pentru investitori, spun agenții imobiliari/ Care este profilul investitorului român în imobiliarele din Dubai

ANALIZĂ Expansiunea discretă a Ungariei în România: companii și afaceriști apropiați de Viktor Orban cumpără business-uri românești

ANALIZĂ. Cei mai importanți angajatori IT din România au renunțat la sute de salariați într-un an. Compania care conducea topul din 2023 a rămas fără 1.000 de angajați în 2024

Imperiul Pavăl: de la un magazin modest în Bacău în 1992 la un gigant cu investiții de peste 20 de miliarde de lei în 2025 / De la bricolaj, imobiliare și construcții, la energie, agricultură, pharma și turism – ANALIZĂ Economedia

ANALIZĂ Economedia. Unde se va situa România în clasamentul european al taxării, după majorările anunțate de Guvern / Avertisment: Pierdem principalele avantaje și competitivitate, ce punem în loc?

ANALIZĂ Tablou în piața muncii: Rata șomajului a ajuns în primul trimestru al anului la cel mai ridicat nivel din 2020 încoace/ Numărul de persoane ocupate a scăzut cu aproximativ 323.000 în interval de un an. Ce urmează?

ANALIZĂ Bursa de la București, printre cele mai ieftine din regiune și cu dividende generoase / Ungaria ne-a depășit la randamentul dividendului și este chiar mai ieftină decât România

ANALIZĂ Băncile românești listate la bursă sunt mai ieftine în termeni de profitabilitate comparativ cu cele din regiune. La ce multipli se tranzacționează acțiunile BRD și Banca Transilvania comparativ cu bănci din Austria, Cehia, Croația, Grecia, Ungaria, Polonia și Slovacia

bani, lei, economie, finante, deficit, inflatie

ANALIZĂ Ce industrie de apărare are România. De la scandaluri, politizare și subfinanțare, la noul context european, care aduce finanțări uriașe de Apărare pentru țările UE

armata romana, capu midia, romania, nato, militari, soldati, antrenament, exercitiu militar, himars, rachete, sisteme de aparare aeriana

ANALIZĂ Economedia: Tot mai multe mașini chinezești, și noi și rulate, pe șosele românești

Analiză. Turbulențele din industria auto se văd din plin în România: Sute de concedieri anunțate în interval de numai câteva săptămâni de către companii active în acest sector în țara noastră

Analiză. Transportatorii români iau locul celor polonezi pe piețele europene, cu flote mari și șoferi gata să călătorească în întreaga UE / Provocări din cauza stagnării economice și a crizei fiscale, care crește taxe și reduce avantajul de cost

ANALIZĂ Se pregătește sezonul de admiteri. Ce taxe de studii percep universitățile și cât costă cazarea la cămine în marile centre din țară?

studenti, universitate, academie, absolventi

ANALIZĂ Cum se schimbă topul companiilor de curierat din România după ce Sameday a cumpărat Cargus / Primele 10 firme au afaceri de peste 5 miliarde de lei

Piața de curierat, România, Cargus, Sameday, Fan Courier, Profit net, Cifră de afaceri, Pachet

ANALIZĂ Produse românești în supermarketuri: Marile lanțuri de retail spun că au sute de parteneri locali. Care sunt produsele cu cea mai mare acoperire locală?

Analiză. Cum arată industria automotive din România, un sector marcat acum de turbulențe majore: Țara noastră are un număr mare de companii active, Germania e cel mai mare investitor străin/ Forța de muncă a scăzut, iar costurile sunt în creștere

Șantiere de vară: Piața piscinelor, în expansiune/ Cât costă un astfel de proiect?

ANALIZĂ Prăpastia dintre tinerii români și angajatori. De ce are România cea mai ridicată rată de șomeri până în 25 de ani din UE / Claudia Indreica, Psihoselect: „Companiile nu mai au timp să instruiască”

Job, căutare de job, șomeri, tineri șomeri

ANALIZĂ Primăvară cu fabrici noi: Care sunt companiile care au anunțat investiții în producție în România

Knauf Insulation, fabrica vata minerala sticla

ANALIZĂ Ce înseamnă procedura de suspendare a fondurilor UE dacă George Simion ajunge preşedinte / În cazul victoriei lui Nicuşor Dan există posibilitatea unei amânări a procedurii

ANALIZĂ De 9 Mai, ziua Europei. Cum a evoluat economia României, de 18 ani în “familia” UE: Salariile s-au triplat, PIB-ul pe cap de locuitor (PPP) a depășit Ungaria, țara noastră a primit peste 100 de miliarde de euro fonduri UE

ANALIZĂ. Care sunt efectele deprecierii leului și cine suferă

bani, lei, finante, bancnote, euro, 5 lei

ANALIZĂ Marele blackout din Spania și Portugalia. Cele două țări iberice plătesc prețul dezvoltării exagerate din regenerabile și insularizării rețelei / Cum stă România

ANALIZĂ Efervescență pe piața dealerilor auto din România: de la consolidări la intrări străine surpriză

GRAFIC Schimbare nemaivăzută în istoria comercială a SUA din ultimii 100 de ani. Analiză Romanian Economic Monitor: Majorarea agresivă a tarifelor vamale de către SUA va avea un impact major asupra tuturor economiilor implicate. Date despre relațiile comerciale România-SUA și posibilele efecte în țara noastră

Analiză „la cald”. Ce impact vor avea taxele vamale americane pentru România?

sua dolari drapel ajutor steag flag us bani karolina-grabowska-4386425

ANALIZĂ Val de restaurante, cofetării și cafenele noi în România. Apar și food-hall-urile/ Piața devine mai competitivă, iar specialiștii se așteaptă să apară noi concepte, inclusiv francize internaționale

Totuși, anunțul său indică un program recent creat pentru a studia ceea ce numește „bunăstarea modelului” și afirmă că Anthropic adoptă, în esență, o abordare de tip „just-in-case”, „lucrând pentru a identifica și implementa intervenții cu costuri reduse pentru a atenua riscurile asupra bunăstării modelului, în cazul în care o astfel de bunăstare ar fi posibilă”.

Această schimbare recentă se aplică în prezent doar modelelor Claude Opus 4 și 4.1. Din nou, ar trebui să se întâmple doar în „cazuri extreme”, cum ar fi „cererile utilizatorilor pentru conținut sexual care implică minori și încercările de a solicita informații care ar permite violență la scară largă sau acte de terorism.”

Deși acest tip de cereri ar putea crea potențial probleme legale sau de imagine pentru Anthropic însuși (așa cum demonstrează reportaje recente privind modul în care ChatGPT poate întări sau contribui la gândirea delirantă a utilizatorilor săi), compania afirmă că în testele pre-deployament, Claude Opus 4 a arătat o „preferință puternică împotriva” răspunsului la aceste cereri și un „tipar de aparentă suferință” atunci când a făcut-o.

„În toate cazurile, Claude trebuie să folosească abilitatea de a încheia conversația doar ca ultimă soluție, atunci când multiple încercări de redirecționare au eșuat și speranța unei interacțiuni productive a fost epuizată sau când un utilizator îi cere explicit lui Claude să încheie o conversație”, spune compania privind noile capacități de încheiere a conversațiilor.

Anthropic mai afirmă că Claude a fost „instruit să nu folosească această abilitate în cazurile în care utilizatorii ar putea fi în pericol iminent de a se răni pe ei înșiși sau pe alții.”

Când Claude încheie o conversație, Anthropic spune că utilizatorii vor putea în continuare să înceapă conversații noi de pe același cont și să creeze noi ramuri ale conversației problematice prin editarea răspunsurilor lor.

„Tratăm această funcționalitate ca pe un experiment continuu și vom continua să ne rafinăm abordarea”, spune compania.

ai, Antrophic, Claude AI, ClaudeAI, conversații abuzive, încheierea conversației, llm, utilizatori abuzivi

Compania de inteligență artificială Anthropic a anunțat capacități noi pentru modelele Claude AI de a încheia conversațiile cu utilizatorii abuzivi

Pe scurt

Urmărește mai jos producțiile video ale Economedia:

- articolul continuă mai jos -

Analize Economedia

By Dana Ciubotă

Citește și

ANALIZĂ Expansiunea discretă a Ungariei în România: companii și afaceriști apropiați de Viktor Orban cumpără business-uri românești

Antreprenor cu valoare adăugată. Cum a ajuns o editură românească să-i pună pe influenceri și Verlaine pe aceeași copertă. Povestea antreprenorului care a reinventat ideea de carte

Topul celor mai ieftini furnizori de energie / Companiile au scăzut prețurile față de momentul liberalizării pieței și se întrec în noi oferte

SURSE Percheziții la Tinmar Energy, unul dintre cei mai mari traderi de energie / Ar fi tranzacționat energia în cadrul grupului ca să îi crească artificial prețul și să deconteze sume uriașe de la stat prin schema de plafonare-compensare

VIDEO Autostrada Transilvania. UMB a ajuns la un stadiu fizic de circa 90% pe lotul Zimbor – Poarta Sălajului, iar Nodul Românași este la 20% / Deschiderea circulației, în prima parte a anului viitor

ANALIZĂ Expansiunea discretă a Ungariei în România: companii și afaceriști apropiați de Viktor Orban cumpără business-uri românești

Antreprenor cu valoare adăugată. Cum a ajuns o editură românească să-i pună pe influenceri și Verlaine pe aceeași copertă. Povestea antreprenorului care a reinventat ideea de carte

Topul celor mai ieftini furnizori de energie / Companiile au scăzut prețurile față de momentul liberalizării pieței și se întrec în noi oferte

SURSE Percheziții la Tinmar Energy, unul dintre cei mai mari traderi de energie / Ar fi tranzacționat energia în cadrul grupului ca să îi crească artificial prețul și să deconteze sume uriașe de la stat prin schema de plafonare-compensare

VIDEO Autostrada Transilvania. UMB a ajuns la un stadiu fizic de circa 90% pe lotul Zimbor – Poarta Sălajului, iar Nodul Românași este la 20% / Deschiderea circulației, în prima parte a anului viitor