martes, 7 de marzo de 2023

La Máquina de las Respuestas

Años atrás, haciendo una tarea para el colegio, encontré una cita, atribuida a un artista famoso, la cual decía que los computadores eran inútiles porque solo podían dar respuestas.

Mis recuerdos al respecto se difuminaron con el tiempo y, por muchos años, cuando recordaba dicha frase, la atribuía erróneamente a algún escritor latinoamericano, de esos que le hacen leer a uno en el colegio.

Hace unos días, cuando empecé a reunir información para este nuevo post, me di cuenta que la frase se le atribuye a Pablo Picasso. Creo que dicha autoría es aún más pertinente para el tema que revisaremos hoy (aunque la razón la trataremos en un post futuro).



Sin lugar a dudas, los computadores, junto con el software que los hace funcionar, son de bastante utilidad. La sociedad actual sería imposible sin aquello que llamaremos la "Máquina de las Respuestas".

Para guiar mejor la discusión, es bueno definir qué es exactamente una "respuesta".

En términos muy simples, entenderemos por "respuesta" a la información que nos entrega el computador para satisfacer una petición que se le hace. Dicha petición no necesariamente tiene el formato de una pregunta. Puede ser texto, un par de clicks en la pantalla del computador, imágenes, etc.

Asimismo, la respuesta puede ser en diferentes formatos. Cuando buscamos en Internet alguna información, estamos enviando una pregunta a un computador en otro lugar del mundo y éste nos entrega una respuesta en forma de texto, imágenes, multimedia o de algunas maneras menos ortodoxas.

-- La Máquina de las Respuestas entrega información útil.


 

Antaño, los computadores eran más difíciles de usar. La forma de hacerle preguntas requería un fuerte entrenamiento en matemáticas, electrónica y otras disciplinas afines. Los formatos de las respuestas también eran complejos de entender.

Pasaron las décadas y los computadores pasaron de ser un aparato de laboratorio a un objeto de uso diario, no muy distinto a un electrodoméstico. La mayoría de los avances que lo permitieron, consistieron en formas de preguntar y responder de manera análoga a como los humanos interactuamos entre nosotros y con objetos de uso cotidiano.

Un hito muy importante fue el primer intento de emular, en un computador, el uso de lápiz y cuaderno. El Sketchpad, creado en 1961, permitía realizar tareas en un computador usando un "lápiz de luz" y una pantalla donde se podía dibujar y señalar.

Otro evento importante fue la madre de todos los demos, en 1968. En aquella ocasión se presentaron  tecnologías que son la base de las oficinas modernas: computadores de uso personal, con pantalla, teclado y mouse, procesadores de texto, conexiones de red y videoconferencia.

Por supuesto, no hay que olvidar el Internet, cuyos orígenes se remontan a 1969. Su principal utilidad, en un principio, era crear una conexión resiltente entre computadores a través de múltiples rutas. Con la creación de la Web, en 1989, se hizo más fácil para usuarios no expertos, navegar a través de la información.

-- La Máquina de las Respuestas se volvió más amigable y conocedora


 

Con algunas excepciones, la mayoría de los avances de las siguientes décadas fueron mejoras incrementales de lo anterior. La reducción en el precio de los computadores y redes facilitó su masificación. De manera similar, cada vez más personas y organizaciones pudieron conectarse a través de Internet.

Un hito más reciente fue la creación del primer iPhone. El paradigma de interacción, basado en usar uno o varios dedos para manipular una pantalla se sigue usando, sin cambios sustantivos, en la actualidad.

El resto de la historia la mayoría lo conoce: buscadores, mensajería instantánea, redes sociales, su masificación global gracias a bajos costos, facilidad de uso y conectividad en todo lugar.

En la actualidad la "máquina" se puede guardar en el bolsillo. Cuando tenemos una duda, podemos sacarla y preguntarle.

-- La Máquina de las Respuestas responderá diligentemente.


 

Todas estas tecnologías eran argumento de ciencia ficción hace algunas décadas. Basta con mirar series de los 60s a los 90s para corroborarlo.

Probablemente la más representativa es Star Trek. Ya en su versión original de los 60s se veían aparatos no muy distintos a computadores portátiles, tabletas y celulares.

Sin embargo, entre todos esos ingenios, hay uno que aún no se ha hecho del todo realidad:

La interacción verbal con un computador usando lenguaje natural.

Muy probablemente, al lector se le vendrá a la mente Alexa, Google Assistant, Siri y un sinnúmero de otros asistentes personales, como razones suficientes para refutar lo anterior.

Si bien estos servicios hacen un trabajo bastante bueno de reconocer la voz del usuario, sus respuestas aún dejan mucho que desear.

-- La Máquina de las Respuestas, cuando le preguntamos verbalmente, aún no entiende bien lo que le decimos.

 

Sin embargo, hemos llegado a un punto de inflexión en el desarrollo tecnológico. Una nueva tecnología que puede generar cambios grandes en la forma de interactuar con los computadores:

Los Modelos Grandes de Lenguaje (Large Language Models o LLM).

En términos simples, un LLM es un software. A dicho software se le puede suministrar un texto escrito en lenguaje natural. El LLM es capaz de completarlo, "adivinando" qué palabras, frases o párrafos serían los más probables que le sucedan, de tal forma que el texto completo parezca "coherente" o sea similar a algún texto existente.

Por ejemplo, si a un LLM le damos el texto "Un elefante se balanceaba", el LLM es muy probable que responda "sobre la tela de una araña".

¿Cómo se logra esto?

La creación de un LLM requiere "entrenarlo". Dicho entrenamiento consiste en tomar muchos textos, remover palabras de ellos aleatoriamente y pedirle al LLM que intente adivinar cuál es el texto que se removió. El resultado de dicho entrenamiento, las "entrañas" del LLM, se almacena en algo denominado los "parámetros", concepto análogo a las neuronas y sus conexiones entre sí.

Mientras más parámetros tenga un LLM, mientras más textos se hayan usado en su entrenamiento, mejor debería ser su desempeño.

Esta tecnología no es particularmente nueva. La razón por la cual se popularizó en los últimos meses fue por los resultados exitosos de crear un LLM muy grande y, posteriormente, hacer un trabajo intensivo de fine tuning para mejorar sus respuestas:

ChatGPT.

Dado que ChatGPT fue entrenado con textos de muchos tipos, tiene en sus "entrañas" información de muchos dominios. Cuando le formulamos una pregunta sobre un tema, su respuesta consiste en "adivinar" cuáles serían las frases más probables que habría que escribir a continuación para responder a esa pregunta.

Si dentro de los textos que se usaron para entrenarlo hay alguno pertinente, esto se reflejará en las respuesta que entregue.

Debido a las características de este LLM, dichas respuestas tienden a estar muy bien redactadas y son particularmente convincentes.

-- La Máquina de las Respuestas, puede entender lo que le decimos verbalmente y es capaz de entregar una respuesta adecuada...

Un momento!, no lleguemos a conclusiones apresuradas!

Confieso que, cuando tuve acceso por primera vez a ChatGPT, estuve horas "conversando" con la "máquina". La experiencia se sentía muy similar a hablar con la "computadora" de Star Trek.

Mis interacciones fueron, de dos tipos: preguntas técnicas especializadas y creación interactiva de argumentos para novelas.

Para el primer tipo, me sorprendió la calidad de muchas respuestas. Cuando la pregunta es directa, no excesivamente compleja y el LLM ha sido entrenado con suficientes textos sobre el tema, las respuestas tienden a ser casi indistinguibles de las que entregaría un experto humano.

Para el segundo tipo, si bien tiende a generar historias relativamente genéricas, con un diálogo adecuado, se pueden crear argumentos bastante interesantes.

A pesar de lo anterior, ChatGPT aún tiene limitaciones importantes.

En general, no es capaz de retener información de los diálogos como lo haría un humano medianamente inteligente.

Por ejemplo, en las conversaciones técnicas, a veces no tiene en cuenta elementos de sus propias respuestas, en la elaboración de las siguientes. Para la generación de historias, tiende a olvidar detalles argumentales importantes que se han dialogado previamente, a confundir personajes o cambiarle los nombres y sus características.

Pero, por sobre todo, ChatGPT tiene todavía un gran defecto que lo diferencia de la "computadora" de Star Trek.

Cuando uno le pregunta sobre algo que no existe, o para lo cual no conoce una respuesta, ChatGPT tiende a fantasear, inventar respuestas, decir cosas claramente no veraces.

En esas situaciones, ChatGPT no es capaz de decir:

"Unable to comply".

-- La Máquina de las Respuestas aún no sabe cuándo callarse.



No hay comentarios.: