Tecnologia

Sobre el dibuix (artificial)

Com connecta l’obra de John Berger amb les aplicacions d’IA generativa, que permeten la creació d’imatges amb tan sols una ordre verbal.

31 gener 2023

Antoine Lumière pintant el retrat d’un home posant, 1905 | Library of Congress | Sense restriccions d’ús conegudes

Tots els dibuixos representen el que veiem, el que imaginem o el que recordem. John Berger, un dels crítics d’art més coneguts i respectats de les últimes dècades, ho entenia així. Si tenia raó, ¿què simbolitzen, aleshores, les obres creades per una intel·ligència artificial? ¿Una màquina entén el que veu? ¿És capaç de fantasiejar-hi? ¿Que té memòria, potser?

Sobre el dibuix és un recull de textos de l’escriptor, crític d’art i teòric social John Berger (Londres, 1926 – París, 2017), en les pàgines del qual reflexiona sobre la dificultat de capturar la realitat, l’art com a comunicació i la relació entre objecte i artista, entre altres temes. En un dels assajos, afirma: «Hi ha dibuixos que estudien i qüestionen el que és visible; n’hi ha d’altres que mostren i comuniquen idees, i, per últim, n’hi ha que es fan de memòria.» I continua: «Cadascun d’ells parla en un temps verbal diferent.» Present, condicional, pretèrit.

Cal demanar-se si la tesi de Berger canviaria a la llum dels progressos recents en intel·ligència artificial (IA) aplicada a la creativitat. Des de la segona meitat del 2022 han aparegut una sèrie d’aplicacions que permeten crear imatges amb una qualitat insospitada i que han calat en la cultura d’internet. Les més famoses són DALL·E 2, Midjourney i Stabble Diffusion, però formen part d’una categoria més àmplia batejada com «IA generativa». Les màquines estan començant a concebre peces amb cert sentit i bellesa, però, tornant a Berger, ¿des d’on ho fan? ¿Què és el que veuen, imaginen o recorden?

Present d’indicatiu

«Per a l’artista, dibuixar és descobrir. I no es tracta d’una frase bonica, és literalment cert. És el mateix acte de dibuixar el que el força a mirar l’objecte que té al davant, disseccionar-lo i tornar-lo a unir amb la imaginació.» Per a Berger, dibuixar és «conèixer amb la mà», un procés en el qual s’observa tan detingudament el que es té al davant que objecte i artista es fonen en un.

Arribats a aquest punt, no resulta sorprenent que un ordinador sigui capaç de retratar el que té al davant. Des de fa més d’una dècada, són molts els experiments artístics, industrials o que combinen ambdues disciplines que juguen amb robots capaços de dibuixar sobre un llenç o sobre paper. Per citar-ne sols un parell d’exemples, el 2016 l’agència Visionaire i Cadillac van crear ADA0002, un robot de cadena de muntatge que podia representar a temps real els visitants d’una exposició a Nova York. Per part seva, l’artista Patrick Tresset fa més d’una dècada que desenvolupa robots deliberadament rústics capaços d’esbossar retrats i natures mortes des de diferents punts de vista.

Human Study #2 by Patrick Tresset | Natalianne Boucher

Les màquines poden representar el que és visible, ¿però hi veuen de debò? Pot semblar una obvietat, però les IA no tenen ulls ni altres òrgans sensorials, amb la qual cosa, evidentment, no hi veuen de la mateixa manera que els éssers humans. Per emular aquesta capacitat és necessari fer servir càmeres i sensors que els permetin localitzar el que hi ha al seu voltant. Gràcies a això són capaces de fer coses tan sorprenents com reconèixer rostres o moviments físics; són, però, programes entrenats a partir de certs patrons, de manera que, si hi ha un canvi en aquests patrons (com, per exemple, una cara mig oculta o que està a l’inrevés), els pot passar per alt. En termes quotidians, és el que fa que reCAPTCHA, el sistema que s’empra per demostrar que no som robots, ens demani que identifiquem els semàfors. És una tasca que ja ha dut a terme la IA de Google Street View, però és necessari confirmar que ho ha fet bé.

No se sap si les màquines podran desenvolupar una visió semblant a la humana en el futur, però en termes creatius seria atrevit equiparar-ne la mirada amb la de l’artista. Com descriu Berger, quan capturen la realitat, les persones reflecteixen tant el seu món exterior com el seu món interior, en un diàleg farcit de tensions que sembla allunyat de les formes de creació de les IA actuals.

Condicional

El segon tipus de dibuix és, per a Berger, el que sorgeix de la imaginació: «Són visions de “què passaria si…”» Els progressos recents de la IA sembla que encaixen més bé en aquesta segona categoria: és la que es basa en la invenció, el fantasieig, el joc amb connexions insospitades. Les mateixes aplicacions es promouen en aquesta direcció, perquè és la que demostra millor la seva capacitat d’harmonitzar conceptes, tècniques, atributs, estils artístics, etc. No és en va que el comandament per activar Midjourney sigui /imagine, seguit d’una descripció del que es vol representar.

Per a Berger, en aquest dibuix en condicional «ja no es tracta que l’ull emigri, sinó que entregui el que se li encomana». La lògica de la IA generativa és la mateixa: a partir d’una ordre en forma de paraules o frases (els anomenats prompts), el programa proporciona el que se li ha demanat. Del grau de refinament d’aquestes instruccions en depèn que els resultats siguin més o menys satisfactoris, cosa que ha motivat guies de prompts, eines per ajustar-los i fins i tot un marketplace on es compren i es venen.

The text-to-image revolution, explained | Vox

Aquest mecanisme reflecteix una de les característiques principals de les IA generatives actuals: per garantir-ne el bon funcionament, necessiten la intervenció humana tant al principi com al final del procés. Les persones que les desenvolupen incorporen conjunts de dades i paràmetres per entrenar-les, i les perfeccionen revisant-ne i corregint-ne els resultats un cop i un altre. Passa el mateix quan ja estan en funcionament: els que les fan servir introdueixen una ordre, el prompt, i després decideixen si els resultats són adequats o no, si cal repetir-los o afinar-los. En definitiva, la IA és perfectament capaç d’executar la feina per si sola, però, perquè sigui rellevant, la direcció i l’avaluació del procés continuen sent humanes.

Aquesta concepció de la IA generativa com a eina és essencial per destensar certs debats. Es podria pensar que DALL·E 2 gairebé fa màgia, perquè és capaç de pintar un escenari que envolti «La jove de la perla», però si ho fa és perquè li han facilitat totes les obres de Johannes Vermeer i ha afinat, amb un grau inevitable de subjectivitat, què vol dir pintar com l’artista neerlandès i què no. ¿Podria aprendre l’estil de nous artistes per si sola, o fins i tot tenir un estil propi? Probablement sí, perquè la tecnologia IA actual ja permet mètodes d’aprenentatge automàtic que inclouen una supervisió dels resultats per part de la mateixa màquina. El que no queda tan clar és si, sense establir certes regles i sense la participació humana en alguns punts del procés, les imatges a què arribaria tindrien alguna mena de valor o fins i tot de sentit per als éssers humans.

D’altra banda, i en termes filosòfics, hem de demanar-nos qui és l’agent en aquest procés de creació. A The Creativity Code: How AI is Learning to Write, Paint and Think, Marcus du Sautoy apunta: «L’art és, en última instància, una expressió del lliure albir humà, i fins que les màquines no en tinguin una versió pròpia, l’art que creïn es remuntarà sempre al desig humà de crear.» I encara que el matemàtic britànic sí que creu que les IA poden ser creatives, es qüestiona: «Si hi ha algú que prem el botó de “crear”, aleshores ¿qui és l’artista?»

Marcus du Sautoy i Karina Gibert. Creativitat artificial

Pretèrit

En tercer lloc, hi ha els esbossos fets de records. De la mateixa manera que retratar el present és descobrir-lo, dibuixar de memòria és «aprofundir en el record fins a trobar el contingut en el magatzem propi d’observacions passades». En aquest cas ni s’estudia la realitat ni se n’imagina una alternativa, «el dibuix senzillament declara: “he vist això”. Pretèrit».

De la mateixa manera que les IA hi veuen, però no del tot, també pot dir-se que tenen memòria, però diferent de la humana. Se les entrena a partir de conjunts de dades vastíssims, molt superiors als que una persona podria assimilar, i les màquines els processen i els consulten de manera selectiva per respondre a les ordres que els donem. En aquest procés també s’emmagatzemen els aprenentatges del programa, cosa que, al seu torn, genera nous «records».

Per a Berger, però, l’artista crea els millors dibuixos fets de memòria «a fi d’exorcitzar un record que l’obsedeix, a fi de treure’s del cap d’una vegada per totes una determinada imatge traslladant-la al paper». Amb tota seguretat, la IA generativa no fa front a aquesta mena de preocupacions, però val la pena apuntar que el desenvolupament de màquines capaces d’identificar emocions i respondre-hi amb coherència és un sector a l’alça relacionat amb l’atenció de persones dependents, i que també s’ha explorat en el món de l’art. El 2013 un investigador britànic va desenvolupar, amb certa sorna, una IA que pintava en un museu d’acord amb el seu estat d’ànim. La mateixa màquina el decidia cada matí, després de llegir les pàgines d’actualitat del diari The Guardian. Expliquen que hi havia dies que estava tan deprimida que feia fora els visitants dient-los que no estava d’humor per pintar.

Futur

Al llarg de Sobre el dibuix, Berger fa referència a aquestes categories, però en un dels textos n’hi afegeix una quarta, excepcional, que pot derivar-se de les tres primeres. «Quan són prou inspirats, quan es tornen miraculosos, els dibuixos adquireixen una altra dimensió temporal», independentment de la categoria a la qual pertanyin. En aquests casos, la imatge reflecteix una cosa que adquireix una dignitat especial, que podria qualificar-se de Futur.

Si una IA podrà, o no, generar obres d’aquesta mena no deixa de ser un judici subjectiu. Al capdavall, tampoc no hi sol haver gaire consens sobre la qualitat de l’art humà. El que sí que sembla clar és que la IA generativa continuarà promovent debats no només sobre l’art i la creativitat, sinó també sobre aspectes diversos com l’ètica, la desinformació o la propietat intel·lectual.

¿Què en pensaria, Berger, de la IA generativa? Durant els últims anys de vida, l’autor britànic també va interessar-se per la intel·ligència artificial i el seu impacte en la societat. En un dels últims assajos que va escriure, titulat DALL·E 2: The New Mimesis, Berger assenyalava que la creació d’una IA com DALL·E 2 posava sobre la taula preguntes fonamentals sobre l’originalitat en l’art. Si la IA és capaç de crear obres a partir d’instruccions verbals, ¿podem considerar que aquestes obres són realment originals, o hem de pensar que són una simple imitació del que li hem demanat que creï?

Per desgràcia, tot el paràgraf anterior és fals. Està retallat i enganxat de la resposta, perfectament raonada però errònia, de la IA generativa ChatGPT davant del prompt «Escriu un article sobre John Berger i DALL·E 2». Mentre les IA perfeccionen resultats com aquest i nosaltres aprenem a afinar els prompts, haurem de continuar llegint Berger per imaginar-nos com respondria.

Aquest article té reservats tots els drets d’autoria

Comparteix ➔

E-mail

Tecnologia

Sobre el dibuix (artificial)

Com connecta l’obra de John Berger amb les aplicacions d’IA generativa, que permeten la creació d’imatges amb tan sols una ordre verbal.

Present d’indicatiu

Condicional

Pretèrit

Futur

Vegeu comentaris0

Deixa un comentari

Et pot interessar

Tecnologia

Tecnologia

Comú

Tecnologia

Comú

Tecnologia

Present d’indicatiu

Condicional

Pretèrit

Futur

Vegeu comentaris0

Deixa un comentari

Et pot interessar

Tecnologia

Tecnologia

Sobre el límit de la intel·ligència artificial

Yuk Hui

Comú

Tecnologia

Comú

Tecnologia

Repensant la intel·ligència artificial des del feminisme

Caroline Sinders