ChatGPT

¿Qué es ChatGPT?

ChatGPT describe un llamado chatbot, que puede interactuar con personas sobre la base de inteligencia artificial. Los chatbots son básicamente capaces de establecer comunicación entre un humano y una máquina.

ChatGPT fue lanzado por su desarrollador OpenAI en noviembre de 2022 y se considera el sucesor de los modelos InstructGPT. OpenAI es una empresa estadounidense que investiga en inteligencia artificial y cuenta con el apoyo de Elon Musk y Microsoft, entre otros.

La organización sin fines de lucro OpenAI, fundada en 2015, también publicó los módulos de lenguaje GPT-2 y GPT-3. Así como el programa DALL-E y su sucesor DALL-E 2, que pueden utilizar el aprendizaje automático para crear imágenes basadas en descripciones de texto.

¿Cómo funciona el modelo de lenguaje?

Si bien ChatGPT se comercializa como un modelo hermano del InstructGPT mencionado, el algoritmo se basa en un modelo de GPT-3, específicamente la serie GPT 3.5.

El modelo de lenguaje utiliza lo que se conoce como “Reinforcement Learning from Human Feedback (RLHF)”. Ppor lo que las bases del modelo se establecen mediante el aprendizaje supervisado. Para ello, se utilizaron entrenadores humanos para generar datos de entrenamiento asumiendo tanto el rol de usuario como el de asistente de IA.

En el segundo paso, ayudaron en la creación de modelos de recompensa para el aprendizaje por refuerzo (reinforcement learning) del modelo mediante la evaluación de las respuestas generadas por los entrenadores. En base a esto, los modelos de recompensa podrían refinarse optimizando la política proximal.

Acceso a Internet

Actualmente se puede acceder y utilizar ChatGPT en el sitio web de OpenAI. Después de registrarse con una cuenta de OpenAI e iniciar sesión, el modelo se puede usar y probar de forma gratuita durante la llamada “research preview”.

En esta fase, OpenAI espera recibir comentarios de los usuarios y permitirles probar las fortalezas y debilidades de la herramienta. Los acuerdos de usuario aclaran que el modelo de lenguaje no se puede usar para ningún propósito que viole los derechos de las personas a descubrir el código fuente, desarrollar otros modelos a gran escala que compitan con OpenAI o declarar que la salida de datos fue generada por humanos, cuando no lo es.

El modelo de lenguaje está diseñado para comunicarse con los usuarios en formato de diálogo. También debería poder responder correctamente a las preguntas de seguimiento dentro de una conversación. Esto es posible porque ChatGPT tiene estado y recuerda las indicaciones anteriores, lo que permite que el usuario se refiera a ellas y que el modelo de lenguaje las entienda.

También se dice que ChatGPT puede rechazar solicitudes inapropiadas e ilegales y negarse a responder. La empresa indica limitaciones en la función al señalar que el chatbot a veces genera respuestas que suenan plausibles, pero incorrectas y sin sentido. Se discuten las causas de este comportamiento, argumentando que no hay fuente de verdad durante el aprendizaje por refuerzo, el conocimiento del entrenador humano es crucial en el aprendizaje supervisado, y una política de respuesta conservadora o más cautelosa lleva a que las preguntas queden sin respuesta, a pesar de que el sistema podría responderlas correctamente. Además, los cambios menores en la entrada pueden provocar un cambio en la respuesta de salida o, en el caso de consultas ambiguas, el modelo intenta adivinar y responder la pregunta prevista en lugar de hacer una consulta.

ChatGPT a menudo proporciona respuestas muy extensas, ya que fueron las preferidas por los entrenadores y, por lo tanto, son más recompensadas. Aunque el modelo de lenguaje está entrenado para evitar solicitudes inapropiadas, esto no se puede evitar por completo.