
În câteva cuvinte
Arthur Mensch, CEO-ul Mistral AI, subliniază importanța suveranității tehnologice europene și necesitatea de a regla aplicațiile IA, nu tehnologia în sine. El evidențiază provocările legate de adoptarea IA în Europa și avantajele modelelor lingvistice specializate, dar și beneficiile codului deschis în dezvoltarea IA. Totodată, recunoaște importanța apărării ca afacere substanțială pentru Mistral.
Când se vorbește despre invazia IA din Statele Unite și chiar din China, există un sat galic care rezistă.
Startup-ul francez Mistral AI a luat naștere în aprilie 2023, când ChatGPT, lansat cu cinci luni în urmă, deja făcea furori. A fost fondat de doi foști cercetători Meta AI, Guillaume Lample și Timothée Lacroix, împreună cu un alt fost cercetător de la DeepMind, divizia de inteligență artificială a Google, Arthur Mensch. Cei trei s-au cunoscut în timpul studiilor de inginerie la École Polytechnique din Paris. Au început proiectul cu alți 12 ingineri, iar acum Mistral AI este o companie cu 170 de angajați, cu birouri în Paris, Londra, Statele Unite și Singapore. A strâns aproximativ 1 miliard de euro, ceea ce îi conferă o valoare teoretică de 6 miliarde. A obținut sprijinul magnatului tehnologic francez Xavier Niel, precum și de la Nvidia sau Microsoft. Datorită tuturor acestor lucruri, este una dintre marile speranțe ale IA europene.
Arthur Mensch (Paris, 1992) este CEO-ul Mistral și figura vizibilă a startup-ului. El a primit Джерело новини într-o sală cu pereți de sticlă la Mobile World Congress din Barcelona. Îmbrăcat într-un costum închis la culoare și după o lungă zi de întâlniri, șeful startup-ului vorbește despre rolul Mistral în contextul căutării europene de independență tehnologică și, de asemenea, își prezintă perspectivele de afaceri – având clienți din sectorul financiar, al apărării și din sectorul public – pe lângă faptul că discută despre rivalitatea cu DeepSeek și cu companiile din Statele Unite.
Întrebare. De ce este importantă suveranitatea tehnologică pentru Europa în contextul geopolitic actual?
Răspuns. Ceea ce am observat în ultimele luni este că multe companii europene, dar și din afara Europei, și-au dat seama că au nevoie de o strategie care să nu depindă în totalitate de tehnologia americană pentru sistemele lor de IA.
Î. Este o chestiune economică?
R. Dacă ai companii cu o supraconsumare de furnizori americani pentru a acoperi o nevoie care va avea o importanță semnificativă în afacerea ta, cum ar fi IA, asta înseamnă că o mare parte din PIB se duce în Statele Unite. Dar mai este un alt aspect, care este suveranitatea culturală. Aceasta constă în a se asigura că modelele cunosc literatura spaniolă, literatura franceză, modul diferit în care gândim istoria de-a lungul Europei sau diferitele moduri în care gândim democrația, care diferă de modul în care se gândește în Statele Unite.
Î. Acum că Statele Unite au devenit un partener capricios, Europa are nevoie și de suveranitate tehnologică în domeniul apărării?
R. Există un al treilea factor care este suveranitatea strategică. Aceasta înseamnă că IA, care este noua modalitate prin care construim interfața om-mașină, va fi în toate sistemele de armament în următorii 10 ani. Din păcate, acesta este un aspect important în lumea de astăzi. Și este esențial pentru statele europene și industria [de apărare] să aibă capacitatea de a construi sisteme cu o IA care nu provine de la un furnizor din afara statelor membre.
Î. În ce măsură apărarea va fi o afacere substanțială pentru Mistral?
R. Este deja o afacere importantă pentru noi.
Î. Cum intenționează Mistral să valorifice nevoile europene de tehnologie suverană?
R. Acest scenariu este o sursă de oportunități pentru noi. Nu numai pentru că suntem o companie europeană, ci și pentru că tehnologia pe care o dezvoltăm este concepută pentru cazuri de utilizare cu nevoi mari de guvernanță a datelor.
Î. La ce se referă?
R. Tehnologia noastră poate fi implementată local. Dacă clientul are suficientă capacitate de GPU-uri (procesoare grafice), poate rula IA noastră în cloud-ul său privat. Când vine vorba de rularea sarcinilor de lucru critice, care necesită o suveranitate ridicată a datelor, avem tehnologia pentru asta. De fapt, suntem singura companie sau una dintre puținele care pot face asta.
Î. Aveți și modele, cum ar fi Mistral Small 3, care funcționează pe un laptop…
R. Aceasta ar fi implementarea pe dispozitiv, care constă în implementarea unor modele mai mici pe hardware mai ieftin. Poate fi un laptop, chiar și un smartphone. Astăzi, cel mai bun model care poate fi rulat pe un laptop este de la Mistral.
Î. Care sunt avantajele rulării unui LLM [model lingvistic de mari dimensiuni] local?
R. Primul este că este un sistem privat implicit. De asemenea, poate funcționa într-un mediu fără conexiune la internet. Și este important pentru eficiență. Dacă suntem capabili să procesăm 80% din cererile unui utilizator pe propriul său computer și le executăm local, aceasta este energie pe care o economisim și nu o irosim în centre de date.
Tehnologia pe care o dezvoltăm este concepută pentru cazuri de utilizare cu nevoi mari de guvernanță a datelor”
Î. Insistați că Europa are nevoie de mai puține reglementări…
R. Trebuie să ne concentrăm pe reglementarea aplicațiilor și nu a tehnologiei. Credem cu adevărat că am ajuns prea devreme [cu Regulamentul european privind IA]. Dar este fezabil să abordăm problema. Nu aș spune că reglementarea este cea mai mare provocare cu care se confruntă Europa în domeniul inteligenței artificiale. Deși nu ajută, desigur.
Î. Ce ați dori să schimbați din reglementare?
R. Am apărat întotdeauna necesitatea de a avea secrete comerciale. Acest lucru este foarte important pentru companii precum a noastră, pentru a fi competitive, mai ales în aspectele legate de datele de antrenament. Regulamentul European privind IA ajută mai mult companiile americane decât pe cele din UE, deoarece fiind foarte mari pot face față mai bine oricărei sarcini care le este impusă. Și acesta este scenariul pe care aș dori să-l evit.
Î. Ați spus mai devreme că reglementarea nu este principala provocare a IA. Care este?
R. Cred că cea mai mare provocare pe care o avem în Europa, și ne bucurăm să vedem că acest lucru se schimbă, este că rata de adoptare a IA în rândul companiilor a fost un pic lentă. Sunt în urma Statelor Unite. Dar acum și-au dat seama că acest lucru este critic pentru ele. Că dacă vor să concureze pe scena globală, trebuie să fie mai eficiente cu ajutorul IA.
Î. Cum abordează Mistral o piață fragmentată precum cea europeană, care în realitate sunt 27+1 piețe?
R. Ne obligă să avem echipe în diferite țări. Acum avem o echipă în Regatul Unit, alta în Germania și în curând vom avea una în Spania. Fiecare companie europeană are cerințe specifice în ceea ce privește limba sau modul în care dorește să interacționeze cu clienții. Și acest lucru necesită o personalizare profundă a sistemelor de IA, lucru pe care știm să-l facem.
Î. ChatGPT sau Google NotebookLM funcționează deja bine în spaniolă. Cum intenționează Mistral să concureze cu ei?
R. Se pot dezvolta modele care să fie excelente în mai multe limbi. Dar dacă decideți să vă concentrați pe o anumită limbă, puteți crea un model mai mic care să fie mai bun în acea limbă precisă. Singura modalitate de a construi un model care să fie foarte satisfăcător într-o anumită limbă este de a introduce mai multe date în acea limbă și de a-l antrena cu ele. Astfel, putem crea un model mai mic, dar dedicat acestei limbi.
Am fost primii care au lansat un model în cod deschis. Și asta a pus în mișcare un întreg bulgăre de zăpadă care a crescut”
Î. După șocul provocat de DeepSeek în industrie, ați spus că Mistral a implementat deja tehnici de eficiență. Puteți dezvolta asta?
R. DeepSeek utilizează, de fapt, un fragment de cod pe care l-am publicat anul trecut ca cod deschis. Este vorba despre tehnica mixture of experts (MoE sau amestec de experți). Ei au escaladat-o și au adăugat o anumită capacitate matematică de raționament asupra ei.
Î. Atunci, tehnologia a fost inițial de la Mistral?
R. Inițial, da. Am fost primii care au lansat un model în cod deschis cu ea. Și asta a pus în mișcare un întreg bulgăre de zăpadă care a crescut. Cedezi ceva comunității de cod deschis și cineva îl ia și creează ceva mai bun.
Î. Este o modalitate de a externaliza inovația…
R. Istoric, în inteligența artificială a fost întotdeauna așa. Dacă te uiți la ceea ce s-a întâmplat între 2010 și 2020, am folosit această formulă pentru a construi învățarea profundă (deep learning). Așa am dezvoltat și învățarea prin întărire profundă (deep reinforcement learning). Și așa am început să lucrăm la modele lingvistice de mari dimensiuni (LLM). Și, dintr-o dată, OpenAI a văzut o afacere în asta și a decis să-și închidă tehnologia și să înceapă o cursă în care vor încerca să devină un monopol.
Î. Cum poate Mistral cu DeepSeek, care este, de asemenea, o companie de cod deschis?
R. Acum lucrăm la modele mai bune decât cele ale DeepSeek. Și în ceea ce privește eficiența în timpul antrenamentului pe care au afirmat-o, noi am atins-o deja și chiar o îmbunătățim.