La IA generativa propone un juego estilístico, una imitación del estilo del conjunto de datos con el que se ha entrenado. Cuestionar cómo se lleva a cabo este proceso nos lleva a reflexionar sobre las capacidades y las limitaciones de la herramienta, y sobre el valor de sus resultados. Estas son las reflexiones que nos propone el colectivo Estampa a partir de dos instalaciones que experimentan con el Archivo CCCB a través de la IA.
El campo de la inteligencia artificial se ha desarrollado progresivamente en diferentes áreas. Uno de los últimos espacios donde se ha expandido es en el de la generación, con servicios que ofrecen una aparente creación automatizada de contenidos. Estas herramientas de la IA generativa son instrumentos de imitación. Están pensadas para, ante un conjunto de datos (texto, imagen o audio), buscar soluciones estadísticas óptimas de píxeles, letras o sonidos, que también pudiesen formar parte de ella. Es decir, intentan reproducir un estilo en una operación de camuflaje. En catalán, una buena palabra para referirse a esto es «estrafer» (que en castellano podría traducirse como «remedar»).
Como cualquier disfraz, estas herramientas llevan implícita una propuesta de análisis: ¿cuáles son las características más comunes de lo que se quiere mimetizar? ¿Qué motivos se repiten? ¿Cómo combinan los elementos? La IA generativa es un espejo, más o menos realista, más o menos deformado, de lo que le piden que imite; un análisis del conjunto de datos (dataset) con el que se ha entrenado.
Hoy en día, cualquier fondo de archivo no es solo un lugar de conservación, investigación y difusión, sino también un posible dataset, uno de esos conjuntos de datos de los que extraer el estilo. Así, para la instalación «La conferencia infinita», el archivo de charlas del CCCB se ha convertido en el material de base de una red de generación de texto. La red remeda el género de la conferencia y el habla del centro; combina las palabras para crear discursos que se hubieran podido pronunciar aquí, textos susceptibles de parecer también material del archivo. En la imitación aparece el análisis, la mirada reflexiva del espejo y, también, a veces, la sorpresa de las combinaciones inesperadas, quizá plausibles, quizás incongruentes.
Si se habla a menudo de la IA como una reproducción o imitación de características humanas -y esta imitación tendría que utilizarse, a nuestro entender, como análisis reflexivo y no como camuflaje-, también es importante entender qué es claramente diferente. Un elemento central de esta diferencia es la escala. La escritura de la red es una escritura infinita y rápida; podría no detenerse, siempre se le puede pedir otra generación casi instantánea. En este sentido, no es analítica de manera asertiva sino propositiva; siempre hay otra posibilidad, una nueva variación, una muda diferente que también se parece… No hay una solución -como si fuese la conclusión de lo leído o el texto supuestamente ideal-, sino una aparente cascada de formas posibles, una cantinela que mana cuando abrimos el grifo.
Un segundo elemento relevante es el carácter automático de las herramientas de IA; y lo es atendiendo a dos sinónimos de esta palabra: compulsivo y reflejo. Una red solo puede hacer lo que hace y hacerlo de manera compulsiva; no puede callar, por ejemplo, ni dejar de remedar la base con que se ha configurado. En este sentido, la IA se podría entender como la construcción de actos reflejos sociales, como una automatización de procesos a gran escala basada en imitar decisiones particulares anteriores. Como un músculo social que se contrae según antes se habrían tensado y destensado músculos individuales, la IA es una reificación de lo que ha sucedido. Cuando nos la describen como el futuro, quizá no está de más que seamos conscientes de hasta qué punto es pasado solidificado.
El hecho de que la IA sea como abrir el grifo, como hemos mencionado antes, también se puede expresar en otro sentido: igual que la gestión del agua corriente, la IA es una infraestructura. No está en nuestro dispositivo, sino que depende de una computación que se hace en servidores lejanos con maquinaria industrial, mientras los datos viajan de ida y vuelta. También es una infraestructura porque necesita entrenamientos que solo pueden realizarse con grandes herramientas de computación, en data centers con una capacidad y un consumo muy elevados. Este es el carácter de la IA industrial, de las herramientas generativas que todos conocemos y que han sido entrenadas con conjuntos de datos muy amplios, una técnica extensiva que permite aumentar la cantidad de estilos que se imitan (lo que en el campo de la generación de texto se conoce como large language models). Todo esto aumenta el problema de la materialidad y el gasto energético del mundo digital (se calcula que el proceso de entrenamiento de ChatGPT consumió tanto como el gasto eléctrico anual de mil casas en Estados Unidos, y que su uso actual consume el equivalente a treinta y tres mil casas; una cifra que, al ritmo de implantación de estas tecnologías en todo tipo de tareas, se multiplicaría rápidamente). Esta concepción de la IA también se sustenta en la dudosa lógica extractiva del internet comercial, que considera que todo lo que sucede y hacemos en la red es material susceptible de ser utilizado y monetizado.
Frente a este carácter de infraestructura, el entrenamiento de la red generativa de «La conferencia infinita» se ha realizado de manera local, con un ordenador de altas prestaciones pero disponible a escala de usuario, y centrándose en un conjunto de datos concreto: la transcripción de las conferencias realizadas en el CCCB y conservadas en el archivo.[1] El hecho de no utilizar servicios de corporaciones permite evitar la huella ecológica más grande y también el carácter genérico, y en gran parte tópico, de los resultados de estas herramientas generativas industriales. Y si bien en una comparación esta red perdería en coherencia lingüística y textual frente a la última versión de GPT, quizá ganaría en ideas inusitadas o salidas inesperadas.
En la base de este proyecto hay un conjunto de preguntas sobre la IA y sus potencias y limitaciones. ¿Quién habla en la generación de texto? ¿Qué valor otorgamos a sus resultados? ¿Cómo queremos entenderlos? ¿Cómo se conjuga la variación estadística, y su escala potencial, con la veracidad? ¿Qué hace la IA con aquello que fagocita?
Trabajar en un modelo pequeño, además de las motivaciones ecológica y estilística ya mencionadas, permite plantear estas preguntas a una escala relativamente manejable. Ante los resultados de esta red, es más probable que nos preguntemos qué es lo que hace y hasta dónde llega. Vemos no solo un resultado, sino el juego estadístico sobre el que se sostiene y, de esta manera, nos preguntamos por las tensiones entre las variaciones plausibles según la estadística o según nosotros mismos. Las costuras de la imitación quedan a la vista sin deshacer el vestido. Nos parece importante tener presente esta mirada y trasladarla hacia modelos grandes y hacia todos los usos de la IA. Cualquier resultado de una herramienta de IA debe ser una interrogación a la red que la ha generado.
[1] La red que se ha utilizado tiene un primer entrenamiento genérico con un corpus amplio que funciona como una especie de aprendizaje del idioma. Nosotros hemos realizado un segundo entrenamiento, también llamado refinado, solo con las transcripciones del archivo del CCCB. Aunque este entrenamiento previo es genérico y viene predeterminado, presenta una escala diferente de la de los modelos industriales. En el caso de la instalación «Turno de preguntas», se emplean redes ya entrenadas. Con una se ha convertido el archivo de conferencias en un conjunto de preguntas y respuestas (la instrucción dada a la red es que resuma en forma de pregunta cada párrafo) y se utiliza otra para escribir la respuesta final, condicionada por fragmentos de texto del archivo. El entrenamiento de estas redes escapa a nuestro control, pero ambas se han utilizado de manera local en el ordenador del proyecto, evitando el trabajo en línea.
Deja un comentario