La IA generativa proposa un joc estadístic, una imitació de l’estil del conjunt de dades amb què s’ha entrenat. Qüestionar com es duu a terme aquest procés ens porta a reflexionar sobre les capacitats i les limitacions de l’eina, així com sobre el valor dels seus resultats. Aquestes són les reflexions que ens proposa el col·lectiu Estampa a partir de dues instal·lacions que experimenten amb l’Arxiu CCCB a través de la IA.
El camp de la intel·ligència artificial (IA) s’ha desenvolupat progressivament en diferents àrees. Un dels darrers espais on s’ha expandit és el de la generació, amb serveis que ofereixen una aparent creació automatitzada de continguts. Aquestes eines de la IA generativa són instruments d’imitació. Estan pensades per, davant d’un conjunt de dades (text, imatge o àudio), buscar solucions estadístiques òptimes de píxels, lletres o sons que també poguessin formar-ne part. És a dir, intenten reproduir un estil en una operació de camuflatge. En català, una bona paraula per referir-s’hi és estrafer.
Com qualsevol disfressa, aquestes eines porten implícita una proposta d’anàlisi: ¿quines són les característiques més comunes d’allò que es vol mimetitzar? ¿Quins motius es repeteixen? ¿Com combinen els elements? La IA generativa és un mirall, més o menys realista, més o menys deformat, del que li demanem que imiti; una anàlisi del conjunt de dades (dataset) amb què s’ha entrenat.
Qualsevol fons d’arxiu és, avui, no només un lloc de conservació, recerca i difusió, sinó també un possible dataset. Un d’aquests conjunts de dades dels quals es pot extreure l’estil. Així és com, per a la instal·lació La conferència infinita, l’arxiu de xerrades del CCCB s’ha convertit en el material de base d’una xarxa de generació de text. La xarxa estrafà el gènere de la conferència i la parla del centre; combina les paraules per crear possibles discursos que s’haguessin dit aquí, textos susceptibles de semblar també material de l’arxiu. En la imitació apareix l’anàlisi, la mirada reflexiva del mirall i també, de vegades, la sorpresa de les combinacions inesperades, potser plausibles, potser incongruents.
Si es parla molts cops de la IA com una reproducció o imitació de característiques humanes –i aquesta imitació hauria d’utilitzar-se, a parer nostre, com a anàlisi reflexiva i no com a camuflatge–, també és important entendre en què és clarament diferent. Un element central d’aquesta diferència és l’escala. L’escriptura de la xarxa és una escriptura infinita i ràpida; podria no aturar-se, sempre se li pot demanar una altra generació quasi instantània. En aquest sentit, no és analítica de manera assertiva sinó de manera propositiva; sempre hi ha una altra possibilitat, una nova variació, una muda diferent que també s’assembla… No hi ha una solució –com si fos la conclusió d’allò llegit o el text suposadament ideal–, sinó un aparent broll de formes possibles, una cantarella que raja quan obrim l’aixeta.
Un segon element rellevant és el caràcter automàtic de les eines d’IA, i ho és d’acord amb dos sinònims d’aquesta paraula: compulsiu i reflex. Una xarxa només pot fer el que fa i fer-ho de manera compulsiva; no pot callar, per exemple, ni deixar d’estrafer la base amb què s’ha configurat. En aquest sentit, la IA es podria entendre com la construcció d’actes reflexos socials, com una automatització de processos a gran escala basada a imitar decisions particulars anteriors. Com un múscul social que es contreu segons abans s’haurien tensat i destensat músculs individuals; la IA és una reïficació del que ha succeït. Quan ens la descriuen com el futur, potser no està de més prendre consciència de fins a quin punt és passat solidificat.
Que la IA és com obrir l’aixeta, com escrivíem abans, ho podem dir també en un altre sentit; igual que la gestió de l’aigua corrent, la IA és una infraestructura. No és al nostre dispositiu, sinó que depèn d’una computació que es fa en servidors llunyans amb maquinari industrial, mentre les dades viatgen d’anada i tornada. També és una infraestructura perquè necessita entrenaments que només es poden assolir amb grans eines de computació, en data centers de capacitat i consum molt elevats. Aquest és el caràcter de la IA industrial, de les eines generatives que tots coneixem i que han estat entrenades amb conjunts de dades molt amplis, una tècnica extensiva que permet augmentar la quantitat d’estils que s’imiten (el que es coneix, en el camp de la generació de text, com large language models). Tot això augmenta el problema de la materialitat i la despesa energètica del món digital. (Es calcula que l’entrenament de ChatGPT va consumir tant com la despesa elèctrica anual de 1.000 cases dels Estats Units i que el seu ús actual consumeix l’equivalent a 33.000 cases; una xifra que, al ritme d’implantació d’aquestes tecnologies en tota mena de tasques, es multiplicaria ràpidament.) Aquesta concepció de la IA també se sustenta en l’aplicació de la dubtosa lògica extractiva de l’internet comercial, que considera tot el que passa i fem a la xarxa com a material susceptible de ser utilitzat i monetitzat.
Enfront d’aquest caràcter d’infraestructura, l’entrenament de la xarxa generativa de La conferència infinita s’ha dut a terme de manera local, amb un ordinador d’altes prestacions però disponible a escala d’usuari, i centrant-se en un conjunt de dades concret: la transcripció de les conferències impartides al CCCB i conservades a l’arxiu.[1] No utilitzar serveis de corporacions permet evitar la petjada ecològica més notòria i també el caràcter genèric, i en gran part tòpic, dels resultats d’aquestes eines generatives industrials. I si bé en la comparació aquesta xarxa perdria en coherència lingüística i textual enfront de l’última versió de GPT, potser guanyaria en idees inusitades o sortides inesperades.
A la base d’aquest projecte hi ha un conjunt de preguntes sobre la IA i les seves potències i limitacions. ¿Qui parla en la generació de text? ¿Quin valor donem als resultats? ¿Com els volem entendre? ¿Com es conjuga la variació estadística, i la seva escala potencial, amb la veracitat? ¿Què fa la IA amb el que fagocita?
Treballar amb un model petit, a més de les motivacions ecològica i estilística mencionades, permet plantejar aquestes preguntes a una escala relativament manejable. Davant dels resultats d’aquesta xarxa és més probable que ens qüestionem què és el que fa i fins a on arriba. Veiem no només un resultat, sinó també el joc estadístic sobre el qual se sustenta, i, d’aquesta manera, ens demanem per les tensions entre les variacions plausibles segons l’estadística o segons nosaltres. Les costures de la imitació es fan presents sense desfer el vestit. Aquesta mirada ens sembla important tenir-la present i endur-nos-la cap a models grans i cap a tots els usos de la IA. Tot resultat d’una eina d’IA ha de ser una interrogació a la xarxa que l’ha generat.
[1] La xarxa que s’ha utilitzat té un primer entrenament genèric amb un corpus ampli, que funciona com una mena d’aprenentatge de l’idioma. Nosaltres hem fet un segon entrenament, també anomenat refinatge, només amb les transcripcions de l’arxiu del CCCB. Tot i que aquest entrenament previ és genèric i ve predeterminat, és d’una escala diferent de la dels models industrials. En el cas de la instal·lació Torn de preguntes s’empren xarxes ja entrenades. En una s’ha convertit l’arxiu de conferències en un conjunt de preguntes i respostes (la instrucció a la xarxa és que resumeixi en forma de pregunta cada paràgraf) i se n’utilitza una altra per escriure la resposta final, condicionada per fragments de text de l’arxiu. L’entrenament d’aquestes xarxes s’escapa de les nostres mans, però totes dues s’han utilitzat de manera local a l’ordinador del projecte, evitant el treball en línia.
Deixa un comentari