anthropic claude projects

Claude lanza «Projects», ¿competencia a los GPTs de ChatGPT?

Este final de mes de junio de 2024, Anthropic ha dado un buen estirón a su LLM Claude con la incorporación de dos/tres de las novedades más importantes hasta la fecha.

Por un lado, nos enterábamos del lanzamiento de su modelo mejorado Sonnet 3.5, que supera de largo en muchas de las métricas principales de benchmark respecto a otros modelos de mercado. Sobre todo en el MMLU (Massive Multitask Language Understanding) de generación de texto.

Su inteligencia está actualizada a abril de 2024 a fecha de hoy (26/06/24) mientras que por ejemplo GPTo está actualizada a octubre de 2023.

Además, impulsa internamente entre el resto de modelos una competencia a potenciar en inteligencia, rapidez y coste, el resto de modelos como su versión más instant como Haiku, o su versión más potente, Opus. Sonnet 3.5 se hace como el modelo de Claude más inteligente al mejor precio por millón de tokens.

También anunciaban una nueva funcionalidad al chat llamada «Artifacts» que lo que permite es tener una vista previa del output de respuesta a la consulta.

Personalmente utilizo mucho esta funcionalidad, y es algo que Claude ofrece de forma automática cuando tu prompt tiene que ver con la generación de código. Permitiéndote incluso copiar el código, descargártelo o publicarlo para la comunidad.

Es cierto que siempre hay que corroborar ese output que te dan de código porque no siempre se previsualiza bien en Artifacts, por lo que te recomiendo que lo valides con herramientas gratuitas como Visual Studio Code instalando la extensión «Live Preview».

Y por otro lado, y más recientemente, Claude anunció lo que denominan «Projects». Esta funcionalidad (por ahora sólo disponible para la opción Pro y Team) básicamente viene a ser lo que ChatGPT ofrece con sus poderosos GPTs Personalizados aunque con matices.

Por detrás de esta funcionalidad estaría corriendo el modelo Sonnet 3.5, con una ventana de contexto de 200k tokens (lo que equivaldría a un libro de 500 páginas).

Es decir, creas tu propio proyecto con información específica que se añade al conocimiento de todo tu historial de conversaciones que tengas con él. El proyecto te permite crear contenido, código, previsualizar con Artifacts la respuesta, generar diagramas, etc.

Una vez alimentas con información el proyecto, puedes ir pidiéndole en el hilo que te vaya generando lo que necesitas. Yo personalmente lo estoy usando para crear contenido específico sobre una temática, donde lo voy alimentando de un SYSTEM PROMPT, de datos de audiencia, palabras clave, etc. Y me permite de una forma algo más sencilla, poder generar el contenido en lugar que ir iterando con la IA en prompt-respuesta-prompt.

Adjuntan información valiosa de cómo nutrir al proyecto de knowledge, con una guía en formato markdown sobre cómo hacer prompting en Claude, (igual que ya compartió OpenAI en su guía de Prompt Engineering) lo que te ayudará a tomar los primeros pasos.

Esta guía de Claude resulta por tanto muy útil para que puedas optimizar la manera en la que interactúas con el chatbot y así obtener las mejores respuestas.

Además, puedes añadir unas custom instructions al estilo GPT, sería lo equivalente a un SYSTEM PROMPT como te decía, que viene a ser como las reglas básicas sobre las que tiene que correr la IA:

Entre la reciente funcionalidad de Claude en su modelo Sonnet 3.5 con la preview del código «Artifacts», y la funcionalidad de crear proyectos con conocimiento específico a modo GPT personalizado, creo que Claude actualmente es el mejor LLM del mercado.

Incluso se hace aún mejor, si trabajas con la opción de API en su Playground, ya que el output es mucho más fino y además te permite ajustar valores como la temperatura de respuesta y el máximo número de tokens de salida (además de otras opciones).

Sólo le añadiría un pero y que deberían de incluir en algún momento en todos lo modelos de Claude (o al menos incluirlo en Opus, el más potente), y es la conexión a internet en tiempo real para nutrir de más contexto e información a la inteligencia y así ofrecer muchas mejores experiencias. Esto es algo que me gusta de ChatGPT y que hecho en falta en Claude. Al igual que la funcionalidad de Artifacts que creo que acabará incluyendo OpenAI.

De lo que he podido probar con la creación de diferentes Projects, he visto que, si bien más o menos sigue una lógica en la respuesta, en ocasiones le cuesta seguir el hilo, y termina siendo más una herramienta de análisis de esos docs que subes y sobre estos hacer consultas (excels, pdfs, etc).

En cualquier caso creo que es un gran paso para un futuro lanzamiento de una funcionalidad mucho más completa y personalizada que permita customizar tus necesidades.

Otros posts relacionados