¿Has oído hablar sobre el Thin Content? Seguro que en tu web tienes Thin Content, pero no eres consciente de ello. Es más, te diré que todos tenemos Thin Content en la web. Lo que hay que hacer es detectarlo y trabajarlo para que Google no lo tenga en cuenta.
En este post te voy a explicar todo lo relacionado con este tipo de contenido que tantos quebraderos de cabeza trae a los bloggers y te voy enseñar qué hacer con él.
Como sabréis los que me seguís habitualmente, no me gusta extenderme en las introducciones y esta vez no va a ser una excepción. Así que vayamos al grano.
¿Qué es el Thin Content?
Thin Content, es el término que usa Google para denominar al contenido de baja calidad o pobre. La verdad es que el Thin Content es uno de los principales problemas a la hora de posicionar un sitio web.
Mientras que la mayoría cree que el Thin Content es un contenido breve por el significado de Thin en inglés, no es del todo correcto y existe más tipos de contenido que son considerados Thin por Google. Thin Content es todo contenido de baja calidad o relevancia para el usuario.
Puedes encontrarte con contenidos que no lleguen a las 300 palabras recomendadas por Yoast, que sin embargo es relevante y de calidad. Por lo tanto, no estaríamos hablando de Thin Content.
¿Por qué es importante el Thin Content para el SEO?
Tengo que romper el mito de que tener Thin Content en tu web penaliza. El Thin Content no penaliza, sino que no posiciona. Además, está ocupando tiempo al crawler de Google encargado de rastrear tu web.
Por eso lo mejor es hacer que Google no indexe y no rastree esos sitios que son catalogados como Thin Content.
¿Qué tipos de Thin content existe?
Contenido auto-generado
Este es el tipo de Thin Content que detecta Google con mayor facilidad ya que normalmente se hace usando herramientas de automatización de contenido. Esto conlleva a que la mayoría de textos creados de esta forma, no tienen sentido. Es como si escribieras en indio.
Esto es muy habitual encontrarlo en las famosas PBN’s de las que hablaba en el artículo de Link Building.
Contenido duplicado o robado
Si es cierto que el contenido duplicado es el tipo de Thin Content más extendido, no significa que esté bien usarlo. De hecho, a Google no le gusta. ¿Conoces a Google Panda? Es el encargado de detectar contenido duplicado en tu web.
De ahí la importancia de crear contenidos originales, exclusivos y de calidad. Es decir, que aporte valor al lector. ¿Para qué quieres tener contenido en tu web que no aporta nada a tus usuarios? Además de tener connotaciones negativas en el posicionamiento de tu web, el contenido duplicado es una práctica poco profesional y moral.
¿Cómo puedes saber si el contenido de tu web es duplicado?
Existen varias herramientas que te permitirán saber si el contenido de tu web es duplicado. Los más conocidos y usados son:
- Site Liner
- Plagiarism Checker
- Plagiarisma
De todas formas, no hay que tener solo en cuenta el contenido de otras webs. A la hora de mirar si tu contenido es duplicado también hay que tener en cuenta tu propia web. Es muy común encontrarse tiendas online con descripciones de productos completamente idénticas.
En realidad, puede llegar a tener cierto sentido, pero no es del todo bien visto por la gran G. Si este es tu caso, te recomiendo que en vez de intentar posicionar los productos posiciones categorías de producto. Usando la descripción en la categoría y capando al robot de Google el acceso a los productos.
Uso de páginas puerta o Doorway Pages
Esta técnica consiste en crear una web con infinidad de palabras clave, pero con poco o sin ningún contenido que pueda aportar valor al usuario. Su único fin es el de posicionar y posteriormente redirigir al usuario al dominio principal.
En principio parece una buena idea. Creas una web optimizada hasta la eternidad para posicionarla en primera página y luego creas una redirección hacia la web de tu negocio. Si usas estas técnicas, cuidado. Google lleva tiempo detrás de este tipo de técnicas.
¿Cómo puedes eliminar el Thin Content en tu web?
Existe contenido de baja calidad que no podemos quitar de la web. Como, por ejemplo, la página de contacto. Ahora me dirás, que la página de contacto es relevante para tus usuarios, y en cierta medida tienes razón. Pero, ¿para qué usuarios es relevante? ¿Es interesante que lo indexe Google?
A mi parecer, no es interesante a los ojos de Google y solo es relevante para aquellos usuarios que ya han visto los servicios o productos que ofreces y les interesa contactar contigo. Por lo tanto, mi recomendación es que uses etiquetas metarobots. Es decir, poner un noindex y nofollow en esas páginas. Que Google no pierda tiempo en rastrear esas partes de tu web. Lo agradecerá y lo agradecerás.
En el caso de tener contenido duplicado, si es duplicado dentro de tu propia web, deberías canonalizarlo. Es decir, usar la etiqueta canonical para que Google sepa cuál es el contenido principal. Sin embargo, si el contenido duplicado es de otra web, elimínalo. No hay cosa más fea y poco profesional que copiar contenidos. Lógicamente si el contenido te han copiado a ti el contenido, ponte en contacto con quién lo haya hecho para que lo elimine o por lo menos te mencione y enlace. Si no lo hace denúncialo a Google. Aunque no siempre hacen caso a este tipo de peticiones.
Estas son las formas que hay para evitar que Google Panda, el algoritmo de Google que se centra en el Thin Content, afecte al posicionamiento de tu web. Espero que ahora seas capaz de encontrar el Thin Content de tu web y trabajar en él para que Google no lo tenga en cuenta a la hora de posicionarte.
5 comentarios en «Qué es Thin Content y cómo evitar ser “penalizado” por Google»
Hola Rober!
Mi pequeña aportación. Otro podo de encontrar contenido duplicado dentro de tu web es con la archiconocida herramienta Screaming Frog. Por un lado, esta herramienta te muestra títulos duplicados, muchas veces debido a que has duplicado contenido ya sea porque te lo ha generado tu CMS o por cualquier otra razón. Pero además screaming frog también te da un dato llamado Hash. Si dos páginas tienen un Hash muy similar probablemente tengas contenido duplicado.
Muchas gracias Sergio.
Me lo apunto. Suelo usar muy frecuentemente screaming frog pero no conocía esta función.
Un abrazo!!
Hola Roberto, muy buen artículo. Tengo una duda de este mismo tema y me gustaría saber que recomiendas hacer en un caso como este.
¿Si tengo artículos que Google no indexa por contenido pobre o de baja calidad que me recomiendas hacer?
1-Ponerle noindex y excluir esas entradas del sitemap.
2-Eliminarla esas entradas y hacer 301 a otros post del mismo tema.
3-Mejorar el contenido para ver si en un futuro Google decide indexarlo
Estaré atento a tu respuesta, gracias de antemano.
Hola Erickson,
No se si he entendido bien la pregunta. Creo que te refieres a qué hacer en caso de que no quieras indexar un contenido porque es de baja calidad. Yo te recomendaría mejorar el contenido.
De todas formas, si Google no lo está indexando, puedes enviarle la url a través de search console. En el apartado rastreo > explorar como google lo envías y le indicas que indexe el contenido. Aunque en realidad si es contenido de baja calidad no es recomendable que lo indexe.
Una cosa que me gustaría aclarar, es que por ser contenido de baja calidad Google no deja de indexar las entradas. Precisamente por esto es recomendable usar noindex o bloquearlo a través de robots para evitar su indexación y que los bots de los buscadores no pierdan el tiempo que tienen asignado a tu web rastreando contenido que no vaya a ser relevante para el usuario.
No sé si me he explicado bien. Si tienes cualquier pregunta no dudes en comentar.
Un saludo!!
Gracias por la respuesta, me han sido de mucha ayuda tus consejos.
Un saludo.