Contenido Sindicado, Contenido Duplicado y Thin Content SEO

El pasado 5 de febrero de 2021, en uno de los Google SEO Office-Hours, salió una interesante pregunta en la que mencionaban cuál sería la mejor manera de controlar aquel contenido sindicado en términos de SEO que por ejemplo puedes publicar tú procedente de terceros, desde tu sitio web, o cuando esos terceros por ejemplo publican contenido tuyo pero bajo su sitio web.

En concreto la pregunta fue:

What is the best way to treat syndicated content on my site? I mean, if the content its already in other sites too, I have to noindex my page? canonicalized to original source? nofollow all internal links of that page?

Pues bien, la recomendación de John Mueller fue la de incluir un rel canonical desde la url que hostea ese contenido sindicado apuntando hacia la url origen que aporta ese contenido único y que tú publicas desde tu sitio web. Sin embargo no siempre es posible automatizarlo, por lo que otra opción para poder conseguir algo de rendimiento desde SEO sería aportar valor único a esa url ofreciendo más contenido y mejor estructurado que interese a tus usuarios. Aún así, es complicado que esa url pueda llegar a tener un buen rendimiento en las SERPs.

CÓMO TRATA GOOGLE EL CONTENIDO SINDICADO

Si el principal objetivo es conseguir tráfico desde buscadores, a través de la opción de canonicalización hacia la url origen, quizás ésta no es la mejor opción, ya que Google tratará (en la mayoría de los casos) de priorizar esa url origen/fuente en SEO frente a la tuya (tendrá más señales).

Pero puede darse el caso que, aún alojando contenido de terceros en una url tuya, ésta consiga mejor posicionamiento que la original, si por ejemplo la autocanonicalizas y eres capaz de aportar contenido único diferencial que haga a esa url significativamente distinguible.

En cualquier caso Google recomienda que el contenido sindicado tal cual sea o bien canonicalizado a la fuente origen, o que no se indexe en los casos en los que por tecnología no fuera posible hacer esa atribución.

Contenido duplicado SEO

Si por ejemplo se trata de contenido duplicado tuyo en una web externa sin tu permiso o aprobación, la recomendación de Google es primero contactar con el propietario de ese sitio web y pedirle su eliminación completa, y si no es posible, Google habilita esta página llamada «Retirar información de Google» donde podrás indicar en un formulario cuál es ese problema.

Otras acciones recomendadas por Google para tratar contenido duplicado son: usar redireccionamientos 301, consolidar señales a través de enlazado interno, etc. Más información en «Cómo evitar que se cree contenido duplicado«

Thin Content

Google detecta como «contenido bajo» aquellas páginas que aportan poco o ningún valor. Por ejemplo, algunas de las consideradas como malas prácticas por parte de Google y que son clasificadas como de «low-quality content» son:

  • «Contenido generado automáticamente«: como su propio nombre indica, se trata de contenido generado de forma automática por diferentes programas de software, sin intervención manual o «casera» del propietario del sitio. De esta forma, la página no está añadiendo valor único y original, sino que se comporta más parecido a como lo haría un robot, intentando manipular el posicionamiento de la página de forma artificial algo que para Google no es de suficiente valor para la página y podría tener una penalización manual y algorítimica.
  • «Contenido Duplicado«: determinado contenido dentro de una página que, en su proporción de tamaño, coincide exactamente o es muy similar a otro contenido ya publicado, tanto en el mismo dominio como en otro.
  • «Doorway pages«: se trata de páginas, creadas con muy poco contenido original usando prácticas como keyword stuffing, y específicamente con la intención de ser utilizadas para redirigir o centrar al usuario en otra página.