Qué es el contenido duplicado y cómo solucionarlo

qué es el contenido duplicado y cómo evitarlo

El contenido duplicado es uno de los problemas más comunes en el SEO, aunque extrañamente, uno de los que menos se suele prestar atención, lo que supone un grave error.

Pueden generarse de manera interna o externa, por eso debes tener cuidado a varios aspectos como las URLs, el diseño móvil, las páginas de productos de e-commerce, las categorías y etiquetas, el texto de los blogs y mucho más…   

Su presencia en una página web puede costarte muy caro, ya que no tendrás una buena posición en los buscadores (o incluso puedes desaparecer si el error es demasiado evidente). Por fortuna, existen maneras efectivas para solucionarlo.

Puede parecer muy tedioso, pero solo debes tener un poco de paciencia y considerar todos los aspectos de revisión para eliminar por completo la duplicación y prevenir su aparición en el futuro.

En este artículo conocerás todo lo que necesitas saber del contenido duplicado SEO, así podrás detectarlo y arreglarlo sin problemas. 

Cómo afecta al SEO el contenido duplicado

Qué es el contenido duplicado y cómo solucionarlo 1

El contenido duplicado es cualquier texto repetido en más de una URL, interna o externa. Esto es lo que sucede cuando un sitio genera múltiples copias de la misma página o cuando copia descaradamente (o sin querer) el texto de otro.

Puede parecer que no sea un factor muy importante, pero la verdad es que es un problema serio que debe ser atendido con rigor, ya que puede salirse de control con el tiempo y las consecuencias pueden ser severas para el posicionamiento.  

Cualquier usuario de Google espera encontrar resultados diferentes, no la misma información una y otra vez. Por esta razón, Google filtra las copias de un contenido para que sea único, y CUANDO NO ES AUTÉNTICO, LO PENALIZA.

Tu página web puede verse muy afectado. En primer lugar, tener varias páginas para las misma información significa dejar que el motor de búsqueda elija la que considere correcta. Y eso no es necesariamente bueno, ya que puede elegir una versión diferente de la que realmente te conviene.

Además, tendrás que pelear con:

  • Una mala visibilidad, ya que si el motor búsqueda muestra una copia incorrecta de la página, se va a posicionar mal con respecto a la versión que necesitas.
  • Si el contenido duplicado es una parte significativa de tu web, el motor de búsqueda tomará estas páginas con menos importancia (o excluirlas por completo).
  • Si tomas texto de otra web también puedes afectarla y el dueño original puede hacer una solicitud a Google para eliminar tu publicación (lo que también afectaría tu credibilidad).

Como puedes ver, este texto similar puede estar en prácticamente cualquier parte de tu sitio y para poder solucionarlo debes conocer los tipos que existen actualmente y cómo solucionarlo.

Tipos de contenido duplicado

Qué es el contenido duplicado y cómo solucionarlo 2

Este mal común de Internet no sólo es el resultado de la copia voluntaria (o involuntaria) de textos o parte de ellos, sino que muy a menudo también se debe a razones técnicas relacionadas con el funcionamiento del sistema de gestión de la información y la estructura de las URLs.

Todas sus variaciones pueden clasificarse en origen interno o externo.

🔶 Contenido duplicado interno

Los parámetros que se crean en las URL, como los relacionados con el seguimiento de los clics y algunos códigos de Google Analytics u otros programas de análisis, pueden dar lugar a un contenido completamente duplicado (esto puede deberse al orden en que aparecen en la URL).

  • Los parámetros de la URL que identifican una sesión de usuario específica, los llamados identificadores de sesión, también crean un problema de contenido duplicado: HTTP y HTTPS o con WWW y sin WWW.

Si tu sitio tiene versiones separadas de los URL (con y sin “www”) todo lo que este adjuntado estará presente en dos URL diferentes, lo que generará una información duplicada para el buscador. El mismo problema se encuentra también para los sitios que mantienen en versión HTTP y HTTPS.

  Diccionario SEO

Aquí te dejo una guía de cómo pasar tu sitio web a https de forma que no tengas problemas con el contenido duplicado.

  • Puede suceder lo mismo si tu página usa extensiones diversas según los países donde prestas servicio (.es, .ve, .mx, etc.) donde muestres el mismo contenido enfocado a distintas regiones

Para evitar problemas de contenido duplicado por el uso de distintos idiomas o del mismo idioma enfocado a disintas ubicaciones usando el TLD de cada país, es haciendo un uso correcto de las etiquetas hreflang y canonical.

  • Otra forma de la que podemos estar creando contenido duplicado si no se etiqueta correctamente, es en el caso de que tengamos una versión para móviles y otra para ordenadores. En este caso la url m.roberflores.com estaría arrojando el mismo resultado que roberflores.com ya que es la misma web, pero enfocada a distintos dispositivos.
  • También se generan en el caso del comercio electrónico, por razones relacionadas con la gestión del catálogo de productos. Aquí también debes cuidar la paginación, las categorías y las etiquetas de tu blog con mucho detalle.

🔶 Contenido duplicado externo

Este es el texto copiado (sacado de los sitios de terceros). Básicamente, se trata de páginas en las que el texto es el mismo que en otros sitios, como el de proveedores  y/o competidores que tengas. Esto lo puedes encontrar fácilmente en las páginas de productos de comercio electrónico, que contienen información técnica sobre los productos y sus funciones.

No es muy raro que ocurra, ya que son muchos los casos de comercio electrónico que vende los mismos productos y utiliza descripciones de sus proveedores. Esto lleva a la presencia del mismo texto descriptivo y muchas páginas pelean con ello diariamente.

También es frecuente en blogs especializados que no se toman la molestia de publicar información original, o que al menos no luzcan completamente idéntica a otra. Por esta razón, es indispensable que cuides con detalle toda la información escrita ya que puedes afectar hasta al dueño del texto original.

  • Para evitar molestias, debes hacer referencia cada vez que publiques texto que no sea completamente original. Solo debes enlazar a la información original dentro de la redacción.
  • También ten cuidado cuando hagas estrategias de sindicalización, ya que si das tus textos a diferentes páginas para ganar visibilidad de tu trabajo, de igual manera puedes caer en duplicación si no citan tu link original correctamente. 

Cómo detectar el contenido duplicado de tu web

Qué es el contenido duplicado y cómo solucionarlo 3

A menudo se habla de cómo optimizar una página para los motores de búsqueda, cómo conseguir enlaces, etc. pero pocos toman en cuenta cómo comprobar contenido idéntico. Lo cierto es que, aunque sea molesto, hay que solucionarlo.

No siempre se trata de un copiado y pegado intencional, a veces es una cuestión de ligereza o desconocimiento de qué estás haciendo algo contraproducente para tu página. En el caso de los e-commerce, piensa en todas las veces que se insertan las descripciones proporcionadas por los fabricantes.

Recuerda que Google no siempre toma medidas drásticas, sino que sólo cuando detecta una intención manipuladora de posicionamiento pasa a la verdadera penalización. En los otros casos no muestra los sitios que no considera útiles para los usuarios.

Esto significa que si hay información duplicada en tu página, difícilmente obtendrás un buen posicionamiento. Para eso, puedes probar estas herramientas para comprobar contenido duplicado SEO:

🔶 Comprobación manual

El buscador de Google es un detector confiable (casi siempre). Para utilizarlo debes tomar una fracción del texto (no mayor a 32 palabras) y colocarlo entre comillas en la barra buscadora.

Google te mostrará todos los sitios que contengan la información de manera exacta.

🔶 Herramientas online

Una de las mejores opciones es Copyscape, una de las herramientas más populares para controlar el plagio, que es el pan de cada día en internet. En la versión gratuita, sólo tienes que introducir la URL de la página que quieres comprobar y hacer clic en Go.

  ¿Realmente Yoast ayuda al posicionamiento SEO de tu web?

Hay varias características clave de este software que te ayudarán a hacer que tu sitio funcione y asegurarte de que todo en tu web sea 100% original. Si sospechas que tu texto ha sido copiado, puedes comparar dos páginas del sitio web o texto junto texto de forma gratuita.

También, existe una versión de pago que permite introducir el texto a comprobar, iniciar la búsqueda en más de 10.000 páginas, excluir algunos dominios de la búsqueda y mucho más. Para utilizar las funciones Premium, solo has de inicia sesión en su cuenta, hacer clic en el botón Premium de la barra de navegación superior y asegurarte de que tienes créditos.

Aunque Copyscape es la más popular de todas, existen otras opciones como Copygator, Duplichecker y Plagarisma. Copygator es libre y fácil de usar, ya que revisa Rss y encuentra dónde se ha copiado o “republicado” el texto que has subido a tu web.

Por su parte, Duplichecker te permite encontrar textos copiados en toda la red. Basta con introducir un artículo (máximo 1000 palabras) o un archivo de texto en el cuadro de búsqueda.

🔶 Otras herramientas

Con Google Search Console y Screaming Frog podrás revisar a profundidad dentro de tu sitio web y detectar duplicados en el blog, titles y descriptions o en las secciones de productos que tengas.

Google Search Console es una herramienta de control y análisis muy básica pero eficiente. Solo debes entrar a ella por medio de tu cuenta Google, revisar los informes de rendimiento e inspeccionar las URLs. De esta manera, podrás optimizar tu web y posicionarte mejor en las búsquedas.

De hecho, con esta herramienta podrás especificar al buscador qué parámetros debe ignorar en la indexación de las páginas. Para hacerlo debes ir Herramientas e Informes antiguos > Parámetros de URL.

Por su parte,  Screaming Frog actúa como un Seo Spider, haciendo un rastreo profundo para que tengas una revisión completa y profesional. Además te permitirá ver todos los aspectos mejorables en tu página buscando en cada rincón (estado HTTP, URL, Meta-description, imágenes, etc.).

Su uso es bastante «básico» (lo pongo entre comillas ya que tiene muchas opciones avanzadas que si nos adentramos en ellas…) . Una vez terminado el escaneo, simplemente haz clic en una de las pestañas de arriba para ver algún aspecto específico de tu sitio. También verás todos códigos que se utilizan cuando quieres informar a Google de cambios en la página.

Para revisar la duplicación de texto con Screaming Frog:

  • Primero introduce tu dominio en la barra superior. Así podrás obtener todas las URLs.
  • Luego ve hasta la pestaña URI y selecciona el filtro «duplicate»
  • Se generará una lista con los elementos duplicados.  

La versión completa de Screaming Frog es de pago, pero con la versión gratuita podrás hacer esta revisión sin problema. También podrás rastrear hasta 500 URLs de tu dominio.  

Ambas herramientas son bastante confiables y te permitirán realizar mejoras de HTML de manera rápida y efectiva, ya que te mostrarán fácilmente dónde debes hacer los ajustes dentro de tu página.

Cómo corregir el contenido duplicado

Qué es el contenido duplicado y cómo solucionarlo 4

Recuerda, si tu sitio está inundado de páginas repetidas, es difícil que los motores de búsqueda le den el valor que se merece. Así que es esencial minimizar el problema con las herramientas que ya te hemos mostrado.

Además, puedes pensar en una observación de TODO el contenido de tu web y así asegurarte de que todo esté en orden. Pero descuida, si te parece demasiado engorroso, actualmente hay profesionales, como yo 😉, que puedes contratar para una revisión completa SEO.   

Estas son soluciones aplicables en los casos duplicación:

🔹 Para cuidar las URL

  • Mantén una estructura de URL consistente que corresponda al contenido de la página.
  • Debes usar la metaetiqueta hreflang si tienes en tu sitio muchas versiones de una página en diferentes idiomas o que estén dirigidas a regiones concretas. Así Google puede mostrar la versión precisa según el idioma del usuario.
  • Ingresa en el código fuente de tu sitio rel=»canonical» para indicar al buscador cuál es la página principal que deseas mostrar si tienes varias con contenido similar. (no necesitas modificar ficheros para utilizarla). 
  SEO local: Cómo posicionar en Google Maps

🔹 Para tener una mejor distribución

  • Comprueba la distribución del contenido que publicas. Si solicita que se publique en otro lugar asegúrate de que siempre haya un enlace a tu sitio y pide que se inserte la etiqueta noindex. En principio en el primer sitio que se publica es, supuestamente, al que Google le da la legitimidad del contenido, pero por si acaso….
  • Con la etiqueta rel=»nofollow» podrás bloquear el rastreo de Google de algunos enlaces porque están en construcción y revisión.
  • Minimiza al máximo el texto similar en tus páginas. No tomes texto de otros sitios así por así, ya que será completamente contraproducente.
  • Conoce y configura correctamente el CMS de tu sitio para evitar la duplicación inconsciente de contenido.
  • No publiques páginas para las que aún no hay contenido. Si lo haces, asegúrate de insertar la etiqueta noindex.

🔹 Para una versión móvil funcional  

  • Asegúrate de tener un diseño responsive para tener la misma URL en distintos los distintos dispositivos de los usuarios. Además, te permitirá ahorrar tiempo en desarrollo y aumentar sus visitas.

🔹 Para cuidar las categorías y etiquetas

  • Usa meta-etiquetas noindex, en caso de que contengan el mismo contenido que la página de blog.
  • No utilices demasiadas categorías o etiquetas, y sobretodo evita la similitud en sus nombres.
  • Para evitar dolores cabeza, siempre ten una planificación adecuada, con una estructura simple y que se te haga fácil seguir sin tanto problema

🔹 Para las descripciones de productos

  • Usa los atributos para diferenciar los productos que tengas que sean similares. Así te ahorrarás de tener el mismo texto en varias páginas de manera innecesaria.
  • Y si debes tener varias páginas, invierte en escribir descripciones diferentes, esto te será de mucha ayuda ya que mantendrás tu web diferenciada de la competencia.
  • Tampoco olvides revisar tus títulos y metadescripciones con frecuencia.

🔹 Para la paginación

  • Las etiquetas rel=”next” y rel=”prev” sirven para señalar que existe relación entre URLs en una serie de páginas. En principio Google ya no hace caso a estas etiquetas desde hace mucho tiempo, pero nunca estarán de más.

🔹 Para evitar plagios

  • Revisa con Copyscape todos tus contenidos antes de publicarlos (ya sean descripciones de categorías, landing page o artículos de blog). Así descartarás posibles plagios involuntarios que podrían perjudicar tu posicionamiento.
  • Si ves que otro sitio está plagiando (por error o coincidencia 🧐) tu texto original, puedes escribir a su propietario para solicitarle que lo retire, ya que esto puede afectaros a ambos. Si se niega, puedes hacer la solicitud formal a Google.
  • Si ofreces tus textos a otros sitios asegúrate de que hagan los enlaces de forma correcta, siempre enlazando al texto original.

🔹 Usa las herramientas disponibles

  • Recuerda que con Google Search Console y Screaming Frog podrás detectar contenido duplicado SEO y hacer las revisiones necesarias para optimizar lo más posible tus textos y cuidar tu posicionamiento.
  • También puedes hacer redirecciones 301 si deseas rediseñar tu sitio. Aunque lleve su tiempo, es necesario para evitar la duplicación. Al mismo tiempo, conservarás el potencial SEO que ya hayas conseguido.
  • También existe una herramienta especializada en contenido duplicado llamada Safecont, con la opción Panda Risk (en honor al algoritmo Google Panda), podrás ver el riesgo de caer en una penalización por contenido duplicado.

Ahora que conoces todos los factores que pueden incidir en la duplicidad en tu página web, empieza por planificar la revisión detallada y sigue todos estos consejos. Así potenciarás tu posicionamiento y te ahorrarás dolores de cabeza mayúsculos en el futuro.

Si quieres saber más información sobre cómo trata Google el contenido duplicado y cómo solucionarlo, puedes hacerlo aquí: https://support.google.com/webmasters/answer/66359?hl=es

Suscríbete a la newsletter

Y sé el primero en enterarte de nuevos post del blog

Responsable: Roberto Flores González
Finalidad: Contestar a las cuestiones planteadas a través de este formulario.
Legitimación: Consentimiento del interesado.
Destinatarios: Los datos no se cederán a terceros salvo en los casos en que exista una obligación legal. En todo caso, los datos que nos facilitas están ubicados en servidores cuya sede se encuentra dentro del territorio de la UE o gestionados por Encargados de Tratamiento acogidos al acuerdo “Privacy Shield”.
Derechos: Acceder, rectificar y suprimir los datos, así como otros derechos.

Te recomendamos leer:

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.