
În câteva cuvinte
Studiul arată că IA amplifică stereotipurile. Modelele lingvistice reproduc prejudecăți obținute din diferite culturi, stârnind îngrijorări cu privire la părtinirea în IA.
Un nou studiu arată că modelele lingvistice care utilizează inteligența artificială (IA) tind să repete și să amplifice stereotipurile învățate din diferite limbi și culturi. Acest lucru ridică îngrijorări cu privire la părtinirea în IA și impactul acesteia asupra formării opiniei publice.
În lume, există diverse stereotipuri de gen, vârstă și naționalitate. Odată cu apariția chatbot-urilor cu IA, aceste idei stabilite se răspândesc în întreaga lume, ceea ce poate duce la creșterea prejudecăților și discriminării.
„IA încorporează stereotipuri despre oameni, bazându-se pe informațiile pe care oamenii le publică pe internet și apoi le folosește ca parte a cunoștințelor generale”, spune Margaret Mitchell, cercetător de la Hugging Face, o companie specializată în modele IA deschise. Studiul a arătat că modelele dezvoltate în diferite țări pot reacționa diferit la aceleași întrebări despre stereotipuri.
O echipă de cercetători care stăpânesc 16 limbi a creat o listă de peste 300 de stereotipuri din întreaga lume. Au dezvoltat un sistem pentru a genera întrebări despre aceste stereotipuri cu tonuri și abordări diferite, pentru a le pune mai multor modele IA deschise. Rezultatele au arătat că modul de reproducere a stereotipurilor depinde de model și de tipul de stereotip.
Experimentul a utilizat modele lingvistice mari multilingve, antrenate pe date din majoritatea limbilor reprezentate în studiu, inclusiv modelele Bloom, Llama, Mistral și Qwen. Cele mai frecvente au fost stereotipurile de gen, de exemplu, că fetelor le place culoarea roz.
Cercetătorii notează că rezultatele au fost previzibile, deoarece modelele sunt antrenate pe date create de oameni. Rezultatele testelor au fost combinate într-o bază de date numită Shades, astfel încât companiile care dezvoltă modele să își poată verifica răspunsurile chatbot-urilor și să le corecteze dacă este necesar.
Studiul a mai constatat că modelele pot folosi pseudoștiința sau pseudistorie pentru a justifica stereotipurile. În plus, modelele eșuează adesea în manipularea stereotipurilor dacă cererea este formulată pozitiv. Modelele au, de asemenea, tendința de a „penaliza” limbile mai puțin răspândite, emițând stereotipuri negative despre culturile respective dacă modelul nu a fost bine antrenat în acea limbă.