Es uno de los temas tendencia desde que en noviembre de 2022 se anunciara por parte de OpenAI la herramienta de ChatGPT.
Por todas sus aplicaciones y usos que puede tener en el ámbito del marketing digital en concreto, ha habido mucho ruido en cuanto a cuál será el papel de ChatGPT en el futuro del SEO y qué usos podría tener.
Ya comentamos en este sitio en agosto de 2020 la nueva tecnología de GPT-3 (ya van por ChatGPT-4 – 2023) y cómo se estaba usando en ChatGPT. Os dejo el enlace donde ya mencionábamos como buscadores como Microsoft o Google estaban aplicándola en sus herramientas.
En mi opinión, pese a que la IA ha avanzado mucho en los últimos años y puede ser útil en tareas como la generación de contenido, etc. todavía hay muchas limitaciones en lo que respecta a la creatividad, la originalidad y la capacidad de comprensión del contexto y la intención del usuario.
Es por eso que creo que ChatGPT (como cualquier otra herramienta) lo que hará será ser usado como apoyo al trabajo del SEO (tanto editorial como técnico), y no como sustituto. Y es que nunca tendrá el conocimiento del negocio o de la web, como para tomar decisiones u opiniones concretas adaptadas a esa necesidad.
Sí que es cierto que podrá darte algunas respuestas genéricas o incluso detalles técnicos de ciertas implementaciones (ya que vendrá referenciada seguramente de documentación oficial de Google, etc.) pero en ningún caso podrá ser un sustituto real de esta profesión.
También es cierto que a nivel de contenidos puede servirte mucho como herramienta donde apoyarte en la generación de ideas sobre las que escribir, o incluso en momento concretos, pedir unos textos (títulos, meta descriptions, etc.) que pueden ser interesantes. Algunos medios (por ejemplo CNN en USA) llevan ya utilizando esta tecnología desde hace un tiempo para generar contenido (muy genérico/evergreen) sobre ciertas temáticas aunque siempre bajo una revisión manual del redactor especializado.
Por mucho que el contenido pueda estar muy conseguido, en ocasiones, la semántica, estructura, etc. no está curada, por lo que al final, se requiere de una revisión de un especialista SEO editorial o de un periodista, para darle un tono, y guía editorial a detalle.
Otro de los usos que creo que ChatGPT puede ayudar a los SEOs, es al de configurar un keyword research como una fuente más de consulta sobre una temática concreta a través de los prompts definidos. Te recomiendo que consultes este listado de Aleyda por ejemplo sobre algunos prompts y usos de ChatGPT que puedes aprovecharte en SEO.
Por tanto, y a modo de resumen en mi opinión, si bien este tipo de tecnologías están avanzando mucho y dando mucha ayuda en ámbitos tan diferentes de la vida, en lo que respecto al marketing digital y al SEO en particular, creo que no pondrá en peligro la profesión (al menos no a corto/medio plazo) y sin embargo sí que será una gran herramienta de apoyo al SEO en cuanto a ciertas áreas de análisis y optimización como keywords research, automatización técnica de tareas, consultas técnicas puntuales, etc.
Estructura del contenido
Rastreadores web de ChatGPT y GPTBot de OpenAI
En este sentido, medios de comunicación como por ejemplo CNN, se han quejado que por ejemplo herramientas como ChatGPT está usando sus fuentes de información sin permiso.
Es decir, que el propio chatbot es capaz de scrapear su contenido para nutrirse de su generación de contenido para servirlo en su herramienta.
Es por esto, y por otros motivos que, desde OpenAI han hecho pública información sobre su rastreado web llamado «GPTBot» y «ChatGPT«.
Desde tu registro de logs puedes detectar si estos bots están haciendo peticiones a tu servidor para recoger esa data. Sus datos son:
- User agent token: GPTBot
- Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
- User agent token: ChatGPT-User
- Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/bot
Si los detectas y quieres evitar que puedan acceder a tu sitio, puedes deshabilitarlos desde tu fichero raíz del robots.txt o excluyendo en una black list el rango de IPs de GPTBot o la IP de ChatGPT User (23.98.142.176/28).
Cómo Bloquear el rastreo de GPTBot y ChatGPT
En la propia documentación de OpenAI tanto para el ChatGPT-User como para GPTBot, se muestra la opción de poder configurar por user-agent el no rastreo de tu sitio web para los diferentes plugins que puedan acceder a tu contenido y ser usado en sus bases de datos.
Para ello tendrás que editar el archivo robots.txt de tu sitio web e incluir las siguientes directivas:
User-agent: ChatGPT-User
Disallow: /
User-agent: OpenAI
Disallow: /
User-agent: ChatGPT
Disallow: /
User-agent: GPTBot
Disallow: /
Si sólo quieres que este Bot pueda tener acceso a ciertos directorios o partes de tu sitio, puedes configurar tu robots.txt de esta forma:
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/