El fenómeno ChatGPT ha sido todo un acontecimiento mundial. De la noche a la mañana un «simple» programa de simulación se coló en todos los hogares, empresas, noticias y conversaciones. Fue la estrella de las conversaciones navideñas.
¿Has visto como redacta? Si, los profesores temblaban pensando en como iban a copiarse los alumnos con este nuevo Rincón del Vago.
¿Has visto como programa? ¡Si hasta corrige BUGS! Se tiraban del pelo los programadores pensando en las horas tontas buscando esos fastidiosos problemas informáticos…
Los que más y los que menos jugaron a preguntar sobre hechos históricos, personajes, como escribir el mejores tweet, etc. etc.
ChatGPT es un programa de simulación lingüística que gracias a la tecnología de OpenAI que utiliza y a muchas horas «de entrenamiento» es capaz de relacionar patrones del lenguaje para componer oraciones y respuestas cada vez más largas con la información contenida en sus bases de datos (DB).
Han pasado los meses y el impacto de ChatGPT se mantiene. Todos los gigantes tecnológicos tienen ya o están preparando la aplicación de esta tecnología OpenAI en sus herramientas de negocio. Lo que supondrá mejoras en nuestro día a día. O lo que viene a ser que las compañías podrán predecir nuestras necesidades y satisfacer nuestras demandas antes de que las tengamos mediante mejoras en las herramientas de minería de datos y Big Data.
¿Pero como es posible que un programa de simulación de conversaciones sepa hacer todas estas cosas?
Para entenderlo primero tenemos que comprender que ChatGPT en todas sus versiones es un simple simulador conversacional o chatbot. Es como los que responden a las preguntas frecuentes de muchas de las webs corporativas. Simulan los callcenters o centros de información y atención al cliente donde las personas que se encontraban o encuentran al otro lado del telefoneo tratan de seguir un patrón de preguntas.
Cuando llamas a una compañía por que por ejemplo la televisión no se enciende, el afortunado empleado empieza a hacer preguntas que nos desesperan. ¿Tiene enchufada la televisión? ¿El mando tiene pilas? ¿Están cargadas? Y siguiendo hasta que terminas el cuestionario básico. Si habéis tenido suerte y tu problema puede solucionarse con una respuesta estándar es posible que en unos minutos tengas la solución. Si no es así, las instrucciones se vuelven confusas, llega la desesperación y terminamos preguntando por el encargado.
Puede ser que en vez de realizar una llamada, la página web de la compañía nos ofrece un simpático chatbot para resolver nuestras dudas y problemas. En ese caso nuestra percepción es otra. Intentamos comunicarnos con el «para que nos entienda», nos congratulamos si nos responde y si la solución no está entre sus preguntas programadas pensamos irónicamente que bien lo han diseñado.
Los dos, el operario y el chatbot, han realizado al misma tarea. Solo que a las personas les exigimos más ya que los humanos son animales con la capacidad de hablar razonadamente y de, por lo tanto, transmitir información en sus conversaciones. Mientras que un robot es un sistema programado y determinista, sin capacidad de decisión, y que solo puede responder en lenguaje máquina o utilizando intermediarios como son los diferentes programas software.
Probemos con un símil. Imaginemos un «mono que va de rama en rama recogiendo plátanos». Hace no tantos años, esos monos eran estadistas que recopilaban las conversaciones de los puntos de atención, los plátanos, y las comparaban para obtener una lista de casos comunes y sus soluciones, los mejores sitios para comer. Este resultado es la lista de preguntas del operario del centro de atención al cliente.
Estos estadistas dejaron paso a informáticos que recopilaban más información y realizaban complejos sistemas de tratamiento de datos para obtener más casos y mejores respuestas en menos tiempo. Un mono robótico es más eficiente haciendo tareas rutinarias y requiere menos esfuerzo debido a cosas como la optimización de trayectorias y a que no se distrae con una mosca o se para a comerse uno de los plátanos.
Toda esa información que recoge el mono, los plátanos, se almacena en complejas bases de datos relacionales que, a base de almacenar y cotejar datos aparentemente dispares, nos respondía a preguntas que ni nos habíamos planteado. El Big Data y las IA comenzaban a dar respuestas anticipadas y predecir comportamientos. El mono robótico estaba empezando a utilizar sus recursos para elegir los plátanos maduros, tirar los infectados y predecir cuando estarían en su punto los que solo comenzaban a crecer.
Este cambio se consigue aplicando algoritmos estadísticos y evolutivos de control como redes neuronales, etc. Todo esta gestión predictiva de comportamientos en ChatGPT se lo debemos a la evolución de OpenAI.
Pero el mono suele quedarse en su selva. No tiene capacidad para salir de su ámbito de control por motivos como la capacidad de almacenamiento, la velocidad de procesamiento, etc. etc. Además de plátanos, el mono necesita un árbol donde dormir, compañeros con los que compartir la información sobre las mejores palmeras, etc. En el caso de los monos robóticos necesita electricidad, capacidad de cómputo para realizar los cálculos y almacenamiento para guardar los datos.
Y aquí es donde entra a escena Nvidia y sus tarjetas.
Por lo que tenemos dos personajes secundarios en esta historia.
- OpenAI: Compañía sin ánimo de lucro fundada por Elon Musk, Sam Altman y otros socios en 2015. El objetivo inicial no era crear una herramienta de código abierto colaborativa como otras organizaciones tecnológicas similares, sino colaborar con las compañía en la investigación y desarrollo de tecnologías de inteligencia artificial. Los primeros programas estuvieron dedicados a ser capaces de jugar a videojuegos de forma autónoma. Y después saltaron a la escritura con herramientas lingüísticas. Paso previo de ChatGPT.
- Nvidia: Es una compañía de semiconductores y herramientas software especializada en tarjetas gráficas con unidades de procesamiento específicas (GPU). Analogía de las CPU pero diseñadas originalmente para el procesado en tiempo real de imágenes debido al crecimiento exponencial de los videojuegos de realidad simulada que necesitaban altas capacidades de cómputo para crear los entornos visuales en tiempo real o RT. Para sacar el máximo partido a estos procesadores, Nvidia desarrollo un API específico denominado CUDA. Rápidamente los chip y la tecnología se exportó a otras áreas tecnológicas gracias a la alta velocidad en espacios pequeños, lo que la presenta como un gran soporte para realizar tareas algorítmicas complejas como las necesarias en la Inteligencia Artificial o el Blockchain.
ChatGPT es por lo tanto un software desarrollado con tecnología OpenAI que se despliega en una enorme cantidad de unidades de procesamiento de gran capacidad de cómputo para realizar los cálculos necesarios para procesar, analizar, relacionar y obtener resultados específicos con la enorme cantidad de datos recogidos en la fase de entrenamiento y/o aprendizaje.
Al «liberar» las versiones de ChatGPT al publico, los usuarios ponemos a disposición de este gigante ciclos de procesamiento y nuevas horas de entrenamiento. Lo que ha hecho que este nuevo compañero creciera exponencialmente a su popularidad. Y mientras todos poníamos a prueba sus límites, aumentábamos la extensión de su selva y por lo tanto de su capacidad de sorprendernos.
Hay que decir que este tipo de software de inteligencia artificial no se ha inventado con ChatGPT, que hay varias alternativas y no solo en sistemas lingüísticos. Pero como siempre en tecnología, no se lleva el gato al agua el primero, si no el más mediático. Y aunque a ChatGPT le queda muchas sorpresas que darnos, siempre tendrá competidores que no están tan lejos tecnológicamente hablando. Es posible incluso que algún sistema de los que ahora prometen incorporar esta eficiente tecnología sea el próximo boom mediático. Por ahora solo podemos decir que todos se están subiendo al carro de esta nueva ola tecnológica. Y que por lo tanto podemos llegar ver el desarrollo de grandes aplicaciones en los próximos meses.
Pingback: Redes neuronales computacionales. - Fisicotrónica
Pingback: Gemini y otras IA - Fisicotrónica
Pingback: Procesador cuántico lógico programable y los plazos de IBM - Fisicotrónica