Tecnología

Sobre el dibujo (artificial)

Cómo conecta el trabajo de John Berger con las aplicaciones de IA generativa, que permiten la creación de imágenes con solo una orden verbal.

31 enero 2023

Antoine Lumière pintando retrato de hombre posando, 1905 | Library of Congress | Sin restricciones de uso conocidas

Todos los dibujos representan lo que vemos, lo que imaginamos o lo que recordamos. Así lo entendía John Berger, uno de los críticos de arte más conocidos y respetados de las últimas décadas. Si estaba en lo cierto, ¿qué simbolizan las obras realizadas por una inteligencia artificial? ¿Una máquina comprende lo que ve? ¿Es capaz de fantasear? ¿Acaso tiene memoria?

Sobre el dibujo es una recopilación de textos del escritor, crítico de arte y teórico social John Berger (Londres, 1926 – París, 2017). En sus páginas reflexiona, entre otras cuestiones, sobre lo difícil que es capturar la realidad, sobre el arte como comunicación y sobre la relación entre objeto y artista. En uno de sus ensayos afirma: «Hay dibujos que estudian y cuestionan lo visible, otros que muestran y comunican ideas y, por último, aquellos que se hacen de memoria.» Y añade: «Cada tipo habla en un tiempo verbal distinto». Presente, condicional, pretérito.

Cabe preguntarse si la tesis de Berger cambiaría a la luz de los avances recientes en inteligencia artificial (IA) aplicada a la creatividad. Desde la segunda mitad de 2022, una serie de aplicaciones que permiten crear imágenes con una calidad inusitada han ido calando en la cultura de internet. Las más famosas son DALL·E 2, Midjourney y Stable Diffusion, pero forman parte de una categoría amplia bautizada como «IA generativa». Las máquinas están empezando a concebir piezas con cierto sentido y belleza pero, volviendo a Berger, ¿desde dónde lo hacen? ¿Qué es lo que ven, imaginan o recuerdan?

Presente de indicativo

«Para el artista dibujar es descubrir. Pero esto no es solo una frase bonita: es literalmente cierto. Es el acto mismo de dibujar lo que fuerza al artista a mirar el objeto que tiene delante, a diseccionarlo y volverlo a unir en su imaginación». Para Berger, dibujar es «conocer con la mano», un proceso en el que se observa con tanto detenimiento lo que se tiene enfrente que objeto y artista se fusionan.

A estas alturas, no sorprende que un ordenador sea capaz de retratar lo que tiene delante. Desde hace más de una década son muchos los experimentos artísticos, industriales o una combinación de ambos que juegan con robots capaces de dibujar sobre lienzo o papel. Por citar solo un par de ejemplos, en 2016 la agencia Visionaire y Cadillac crearon ADA0002, un robot de cadena de montaje que podía representar en tiempo real a los visitantes a una exposición en Nueva York. Por su parte, el artista Patrick Tresset lleva más de una década desarrollando robots deliberadamente rústicos capaces de esbozar retratos y naturalezas muertas desde distintos puntos de vista.

Human Study #2 by Patrick Tresset | Natalianne Boucher

Las máquinas pueden representar lo visible, pero ¿acaso ven de verdad? Puede parecer una obviedad, pero las IA no tienen ojos ni otros órganos sensoriales, por lo que naturalmente no pueden ver del mismo modo en que lo hacemos los seres humanos. Para emular esta capacidad es necesario usar cámaras y sensores que les permiten localizar lo que hay a su alrededor. Gracias a ello son capaces de cosas sorprendentes como reconocer rostros o movimientos físicos, pero son programas entrenados a partir de ciertos patrones, por lo que un cambio en los mismos (por ejemplo, una cara medio oculta o vuelta del revés) puede pasarles desapercibido. En términos cotidianos, es lo que hace que reCAPTCHA, el sistema para demostrar que no somos un robot, nos pida que identifiquemos semáforos. Es una tarea que ya ha realizado la IA de Google Street View, pero es necesario confirmar que la ha hecho bien.

Quién sabe si las máquinas podrán desarrollar una visión cercana a la humana en el futuro, pero a nivel creativo sería atrevido equiparar su mirada con la del artista. Como describe Berger, al capturar la realidad, las personas reflejan tanto su mundo exterior como interior, en un diálogo repleto de tensiones que parece alejado de las maneras de trabajar de las IA actuales.

Condicional

El segundo tipo de dibujo es, para Berger, el que surge de la imaginación: «Son visiones de “qué pasaría si…”». Los avances recientes en IA parecen encajar mejor con esta segunda categoría: la que se basa en inventar, fantasear, jugar con conexiones insospechadas. En esta dirección se promocionan las propias aplicaciones, porque es la que mejor demuestra su capacidad de armonizar conceptos, técnicas, atributos, estilos artísticos, etc. No en vano, el comando de texto para activar Midjourney es /imagine seguido de una descripción de lo que se desea representar.

Para Berger, en este dibujo en condicional «ya no se trata de que el ojo emigre, sino de que entregue lo que se le encomienda». La lógica de la IA generativa es la misma: a partir de una orden en forma de palabras o frases (los llamados prompts), el programa devuelve lo que se le pide. Del nivel de refinamiento de estas instrucciones dependen unos resultados más o menos satisfactorios, lo que ha motivado guías de prompts, herramientas para ajustarlos e incluso un marketplace donde se compran y venden.

The text-to-image revolution, explained | Vox

Este mecanismo refleja una de las características principales de las IA generativas actuales: para garantizar su funcionamiento correcto, necesitan una intervención humana tanto al inicio como al final del proceso. Las personas que las desarrollan incorporan conjuntos de datos y parámetros para su entrenamiento, y las perfeccionan revisando y corrigiendo sus resultados una y otra vez. Lo mismo ocurre cuando ya están operativas: quienes las usan introducen una orden, el prompt, y luego deciden si los resultados son adecuados o si hay que repetirlos o afinarlos. En definitiva, la IA es perfectamente capaz de ejecutar el trabajo por sí sola, pero para que sea relevante, la dirección y la evaluación siguen siendo humanas.

Este entendimiento de la IA generativa como herramienta es esencial para distender algunos debates. Se podría pensar que DALL·E 2 hace poco menos que magia cuando es capaz de pintar un escenario alrededor de La joven de la perla, pero si hace esto es porque se le han facilitado todas las obras de Johannes Vermeer y se ha pulido, con un grado inevitable de subjetividad, qué es pintar como el artista neerlandés y qué no. ¿Podría aprender el estilo de nuevos artistas por sí sola e incluso generar un estilo propio? Probablemente sí, ya que la tecnología IA actual ya permite métodos de aprendizaje automático que incluyen una supervisión de los resultados por parte de la propia máquina. Lo que no está tan claro es si, sin el establecimiento de ciertas reglas y sin una participación humana en algunos puntos del proceso, las imágenes a las que llegaría tendrían algún tipo de valor o incluso un significado a ojos de los seres humanos.

Por otro lado, y en términos filosóficos, cabe preguntarse quién es el agente en este proceso de creación. En Programados para crear, Marcus du Sautoy apunta: «El arte es, en última instancia, una expresión del libre albedrío humano, y hasta que las computadoras tengan su propia versión de esto, el arte creado por una computadora siempre se remontará a un deseo humano de crear». Y aunque el matemático británico sí cree que las IA pueden ser creativas, se pregunta: «Si alguien presiona el botón de «crear», ¿quién es el artista?».

Marcus du Sautoy y Karina Gibert. Creatividad artificial

Pretérito

En tercer lugar, están los esbozos hechos de recuerdos. Del mismo modo que retratar el presente es descubrirlo, dibujar de memoria es «ahondar en ella, hasta encontrar el contenido de su propio almacén de observaciones pasadas». En este caso, ni se estudia la realidad ni se imagina una alternativa, «el dibujo sencillamente declara: vi esto. Pretérito».

Del mismo modo que las IA ven, pero no del todo, puede decirse que tienen memoria, pero diferente a la humana. Se las entrena a partir de vastos conjuntos de datos, muchos más de los que una persona podría asimilar. La máquina los procesa y consulta de manera selectiva para responder a las órdenes que se le han dado. En este proceso también se almacenan los aprendizajes del programa, lo que a su vez genera nuevos «recuerdos».

Para Berger, sin embargo, los mejores dibujos realizados de memoria «se hacen a fin de exorcizar un recuerdo que obsesiona al artista, a fin de sacarse de la cabeza de una vez para siempre una determinada imagen, llevándola a un papel». Con total seguridad, la IA generativa no se enfrenta a este tipo de preocupaciones, pero vale la pena apuntar que el desarrollo de computadoras capaces de identificar emociones y responder acorde a ellas es un sector al alza relacionado con la atención a personas dependientes; esto también se ha explorado en el mundo del arte. En 2013, un investigador británico desarrolló, con no poca sorna, una IA que pintaba en un museo de acuerdo a su estado de ánimo. La propia máquina lo decidía cada mañana tras leer la actualidad en The Guardian. Algunos días, según cuentan, estaba tan deprimida que echaba a los visitantes aduciendo que no estaba de humor para pintar.

Futuro

A lo largo de Sobre el dibujo, Berger hace referencia a estas categorías, pero en uno de sus textos añade una cuarta, excepcional, que puede surgir de las otras tres. Cuando «son lo suficientemente inspirados, cuando se tornan milagrosos, los dibujos adquieren otra dimensión temporal», independientemente de la categoría a la que pertenezcan. En esos casos, la imagen refleja algo que adquiere una dignidad especial, que podría calificarse de Futuro.

El que una IA pueda generar obras de esta consideración a largo plazo no deja de ser un juicio subjetivo. Al fin y al cabo, tampoco suele haber consenso entre lo que es buen o mal arte humano. Lo que sí parece claro es que la IA generativa seguirá suscitando debates no solo acerca del arte y la creatividad, sino también de aspectos diversos como la ética, la desinformación o la propiedad intelectual.

¿Qué pensaría Berger de la IA generativa? En los últimos años de su vida, el autor británico también se interesó por la inteligencia artificial y su impacto en la sociedad. En uno de sus últimos ensayos, titulado «DALL·E 2: The New Mimesis», Berger señala que la creación de IA como la que produce DALL·E plantea preguntas fundamentales sobre la originalidad en el arte. Si la IA es capaz de crear obras a partir de instrucciones verbales, ¿podemos considerar esas obras como realmente originales o simplemente una imitación de lo que le pedimos que cree?

Lamentablemente, todo el párrafo anterior es falso. Es un corta y pega de la respuesta perfectamente razonada pero errónea de la IA generativa ChatGPT al prompt: «Escribe un artículo sobre John Berger y DALL·E 2». Mientras las IA continúen perfeccionando este y otros resultados y nosotros aprendamos a pulir los prompts, deberemos seguir leyendo a Berger para imaginar esta respuesta.

Este articulo tiene reservados todos los derechos de autoría

Comparte ➔

E-mail

Tecnología

Sobre el dibujo (artificial)

Cómo conecta el trabajo de John Berger con las aplicaciones de IA generativa, que permiten la creación de imágenes con solo una orden verbal.

Presente de indicativo

Condicional

Pretérito

Futuro

Ver comentarios0

Deja un comentario

Te puede interesar

Tecnología

Tecnología

Común

Tecnología

Común

Tecnología

Presente de indicativo

Condicional

Pretérito

Futuro

Ver comentarios0

Deja un comentario

Te puede interesar

Tecnología

Tecnología

Sobre el límite de la inteligencia artificial

Yuk Hui

Común

Tecnología

Común

Tecnología

Repensando la inteligencia artificial a través del feminismo

Caroline Sinders