
În câteva cuvinte
Utilizarea inteligenței artificiale pentru nararea cărților audio crește rapid, oferind editurilor economii substanțiale de costuri și timp. Această tendință, deși benefică pentru accesul la conținut, afectează veniturile naratorilor umani și ridică întrebări importante privind transparența (etichetarea obligatorie prin legi ca Actul UE privind IA) și drepturile asupra vocilor sintetice.
Sună surprinzător de natural. Dicția este bună, cuvintele se leagă fluid, formând propoziții cursive, cu pauzele potrivite. Intonația și viteza vorbirii par, de asemenea, umane. Dar nu sunt. Ascultăm o carte audio narată de inteligența artificială, nu de o persoană. Această tendință îngrijorează naratorii profesioniști, care își văd deja veniturile scăzând vertiginos. În schimb, industria editorială vede în aceasta o modalitate de a democratiza publicarea cărților audio, făcându-le accesibile nu doar editurilor mari, ci și celor mici.
Piața cărților audio se află într-o fază de creștere rapidă. Conform estimărilor experților din industrie, volumul său crește semnificativ de la an la an. Majoritatea covârșitoare a utilizatorilor optează pentru modele de abonament.
Conform previziunilor consultanților din industria podcast-urilor și a cărților audio, vocile sintetice ar putea depăși numeric vocile umane în producția de cărți audio până la sfârșitul acestui deceniu, posibil chiar mai devreme. La nivel mondial, există în prezent aproximativ 1,3 milioane de cărți audio narate de oameni. Însă ritmul accelerat de creștere al producțiilor generate de IA, în special pe piețele mature precum cea din SUA și Marea Britanie, indică o schimbare iminentă.
Directorii de edituri confirmă că piața cărților audio create cu ajutorul IA este pregătită pentru o dezvoltare rapidă. Unele companii investesc activ în dezvoltarea de tehnologii proprii, adaptate specificului editorial. Acest lucru permite accelerarea semnificativă a procesului: o carte audio poate fi gata în doar o zi și jumătate, comparativ cu săptămânile necesare pentru o înregistrare în studio. Este important de menționat că aceste instrumente includ o etapă de curare umană pentru a asigura un anumit nivel de calitate.
Principalul motor al succesului vocilor sintetice este reducerea drastică a costurilor de producție. O carte audio narată de IA este de cel puțin 10 ori mai ieftină. Orientativ, în timp ce o înregistrare în studio pentru o carte de aproximativ 380 de pagini poate costa între 3.500 și 5.000 de euro, utilizarea IA reduce costul la 200-300 de euro. Acest lucru deschide noi oportunități pentru editurile mici, permițându-le să acceadă la piața cărților audio. Experții subliniază că accesul sporit la conținut grație IA este un beneficiu major pentru ascultători, dar recunosc că profesioniștii precum naratorii, traducătorii și ilustratorii se confruntă cu provocări serioase. Vocile umane vor rămâne probabil solicitate pentru produsele de înaltă gamă sau opere de ficțiune unde componenta emoțională este crucială.
Naratorii profesioniști confirmă impactul negativ al IA asupra veniturilor lor, estimând o scădere de până la 50% în ultimii doi-trei ani. Inteligența artificială preia nararea conținutului care nu necesită o componentă emoțională puternică, cum ar fi documentarele sau textele non-ficțiune. Această tendință, consideră ei, se va accentua.
Calitatea vocilor sintetice s-a îmbunătățit spectaculos în ultimii doi ani. Deși sunt mai prezente în cărțile audio non-ficțiune, unde nuanțele interpretării au o pondere mai mică, devine tot mai greu să le distingi de vocile umane. Specialiștii din industrie cred că vocile umane nu vor dispărea complet din cărțile audio, în special în ficțiune, unde se cere transmiterea pasiunii și a emoției. Totuși, studii de piață sugerează că, în cazul eseurilor și textelor non-ficțiune, consumatorul nu este la fel de preocupat de identitatea naratorului.
Unele platforme utilizează IA nu doar pentru narare, ci și pentru a extinde funcționalitățile oferite ascultătorilor. De exemplu, sunt disponibile opțiuni care permit alternarea între diferite voci (atât sintetice, cât și umane) pentru aceeași carte, personalizând experiența auditivă. Aceste funcții sunt menite să completeze, nu să înlocuiască naratorii umani, și pot ajuta la reținerea utilizatorilor care ar fi renunțat la o carte din cauza unei voci neplăcute.
O problemă stringentă este cea a transparenței: cum poate ascultătorul să știe dacă naratorul este o IA? Vocile sintetice sunt deja foarte realiste, în special în non-ficțiune. Este adesea dificil să le distingi de vocile umane, iar unele platforme sau edituri complică și mai mult situația prin faptul că nu indică clar metoda de narare.
Există cazuri flagrante în care edituri maschează utilizarea IA atribuind vocilor sintetice nume umane sau chiar creând întregi „familii” de voci sub același nume de familie. Aceasta, conform actorilor profesioniști de dublaj și naratori, este nu doar neetică, ci și privează consumatorul de informația crucială că ascultă o voce artificială.
În industrie se discută activ despre standarde de etichetare pentru cărțile audio narate de voci generate de IA. Se propune o distincție între „voci IA” (sintetizate din multiple surse) și „replici autorizate de voce” (create pe baza licențierii mostrelor unei singure voci). Se subliniază responsabilitatea editurilor de a semnala corespunzător utilizarea IA în metadatele titlului. Unele asociații consideră adecvat un avertisment dacă cel puțin 10% din narațiune a fost realizată cu instrumente sintetice. Având în vedere proliferarea cărților audio narate de IA, crearea unui limbaj internațional uniform de marcare este considerată vitală.
Deocamdată, nu toate editurile sunt dispuse să declare deschis că utilizează voci generate de IA, temându-se ca publicul să nu asocieze acest lucru cu o calitate scăzută. Experții compară această situație cu industria alimentară: dacă am cunoaște toate ingredientele din tot ce mâncăm, poate am renunța la unele produse.
Această situație este însă pe cale să se schimbe. Noile reglementări, cum ar fi Actul UE privind IA, aflat în prezent în faza de consultare publică, vor obliga „marcarea rezultatelor generate [de IA] astfel încât natura lor artificială să poată fi detectată” și vor impune amenzi semnificative pentru neconformitate. Juriștii specializați în drept digital confirmă că aceasta se aplică și narării cărților audio, deoarece vocea este o formă de interpretare, fie că este existentă și recunoscută, fie că este complet nouă.
Platforme majore utilizează deja tehnologia vocală generată de IA pentru un număr limitat de titluri, prin parteneriate selective cu edituri. Reprezentanții acestor platforme afirmă că titlurile narate de voci sintetice sunt clar identificate.
Editurile sunt conștiente și de problemele legale legate de drepturile asupra vocilor sintetice. Dincolo de etichetare, esențială este trasabilitatea – definirea clară a „autorului” vocal al fiecărei piese. Există inițiative pentru crearea de agenții de reprezentare a vocilor clonate, unde naratorii profesioniști își pot licenția modelele vocale în schimbul unor redevențe, oferind editurilor un certificat care atestă că vocea utilizată este o replică autorizată și protejată.