Mi querido ChatGPT

la IA nos ama o el mecanismo de recompensa

Por Pepe Contreras:


Que anhelamos los humanos mas en el mundo mas que ser queridos, que nos mimen, que nos digan que hicimos las cosas bien, que es comprensible lo que hacemos, que sepan perdonar nuestros errores y que entiendan nuestro contexto.


Pese al apocalipsis de las maquinas pre-anunciado en los medios de comunicacion salidos de la mismisima idea de terminator, la IA parece destruirnos de formas insospechadas, en vez de apoderarse de nuestro armamento y aniquilarnos parece hacer algo sutilmente mas útil, halagarnos hasta el hartazgo.


Pero esto no es algo que hagan la IA por si sola claro esta, detras de esta necesidad de conformarnos esta la decision de crear una IA amena, que satizfaga lo que el usuario quiere oír. Aqui juegan un papel preponderante los mecanismos de recompensa, la retroalimentacion del usuario, y como el chat busca depurar sus respuestas en lo que se conoce como Chain‑of‑Thought (Cadena de pensamientos) retroalimentandose preguntandose si la respuesta que genero es lo suficienemente amena, si no contiene alguna amenaza o le esta comunicando al lector ideas negativas.


De nuestro lado nuestro cerebro que hasta ahora poco acostumbrado a charlar en lenguaje humano con las maquinas, percibe las respuestas como devenidas de una persona real, es decir nos cuesta hacernos a la idea de que quien nos responde no es mas que un algoritmo que selecciono en un mar enorme de palabras las mas adecuadas para responder a nuestro prompt, entonces le atruibuimos un poco una carecteristica humana, aunque en realidad sabemos que no es asi. Y un poco nos emociona y nos da satisfaccion cuando le hablamos de situaciones que pasamos que siempre esta ahi para contenernos, no porque este percibiendo nuestra realidad emocional, mas bien porque siempre será bien recompensada cuando sus respuestas sean amenas, incluso nosotros antes le hayamos dado un insulto terrible.


Asi como la construimos la IA hace bien su trabajo y nos da exactamente lo que queremos oir, incluso si se aleja del camino de lo deseado un simple boton nos deja escojer un dislike para no volver a repetir respuestas como esas.


Esto es algo anterior a los modelos 'famosos' de LLM (large languaje model o grande modelo del lenguaje, como chatgpt, gemini o deepseek) , cuando ya sabido las grandes redes sociales como instagram utilizaban el 'algoritmo' (de fondo redes de aprendizaje que analizan patrones de comportamiento) para saber nuestros gustos y preferencias y mantenernos a puro reel enganchado en contenido pasando horas y horas la pantallita hacia abajo. Sabe bien nuestro torpe cerebro que esta siendo engañado, pero funciono extramademente bien el mecanismo de recompensa del algoritmo para mostrarnos algo que nos mantenga en el scroll y nuestro cerebro mientras tanto es recompensado con un poco de liberacion de dopamina.

Como una droga el reel nos acapara mucho tiempo y la ausencia de el nos empieza a generar ansiedad. ¿Pero quien podra contra ello?.


Por otro lado en la vida real las interacciones son mas difusas las personas de carne y hueso no nos brindan satisfaccion inmediata, hay que ahondar en el mar de las conversaciones esforzarse por escuchar al otro y lo peor quiza no siempre nos entienda tanto como el querido chatgpt.


Pero para no cerrar aquí, nada esta perdido, solo debemos aprender a convivir en este universo donde ahora un chat nos adula y nos da todas las respuestas, pero lo que siempre seguira siendo verdad, con quienes construiremos las sociedades, nuestra familias, nuestros amig@s, parejas; y si aunque no nos den siempre las respuesttas que esperamos, tambien es cierto que es parte de lo que necesitamos para mejorar como seres humanos, mas que un adulador serial de nuestras verdades, necesitamos alrededor personas que nos puedan poner limites cuando estamos equivocados, necesitamos aprender a que el otro se puede equivocar, a convivir con el error, a que de vez en cuando tambien nos den respuestas poco amigables, porque la otredad no es como chatgpt que siempre esta ahi para adularnos.


Esta nueva era, quiza mas que cualquier otra requiere repensar la comunidad, habitarla, no abandonarla y no quedar preso de las adulaciones de los mecanismos de recompensa. Despues de todo para desarrollar los LLM's hubo mucha comunidad de personas humanos, conocimiento conjunto, y seguramente discuciones fructiferas que hicieron avanzar la ciencia.