Una medida importante Onpage que debería implementarse para la optimización de motores de búsqueda es la prevención del contenido duplicado (DC). Se trata de proporcionar contenido que se pueda acceder a través de diferentes URLs. De un documento pueden existir una o más «copias» y, por ello, Google quiere evitar que varias páginas web indexadas tengan el mismo contenido en los resultados de búsqueda. Lo que es importante para el motor de búsqueda es que los webmasters «comuniquen» cuál es la dirección URL original y cuál es la copia.
¿Por qué es un problema el contenido duplicado?
Así, el contenido duplicado puede ser desventajoso ya que Google prefiere que haya un contenido único. El motor de búsqueda pretende que en cada consulta se muestren los resultados de la búsqueda de mejor calidad y, por lo tanto, satisfacer las necesidades de los usuarios – una demanda muy alta que Google está tratando de lograr a través de diversas medidas y que ha ido mejorando en los últimos años. Ahora Google identifica diferentes direcciones URL con el mismo contenido o muy similar, por lo que el algoritmo es capaz de clasificar las URL según su relevancia en los resultados de búsqueda. Si hay contenido duplicado, Google hará fluctuar constantemente las URLs de las páginas en los resultados de búsqueda (SERPs). No es posible conseguir un ranking estable si existe contenido duplicado en el índice de Google.
Otro factor problema es la frecuencia de rastreo. Google rastrea diariamente millones de sitios web. Dependiendo del tamaño y la calidad, Google asignará un nivel de importancia a cada sitio web visitado por el bot de Google. Incluso la potencia de los rastreadores de Google es limitada. La frecuencia de rastreo de una página web no se da a conocer – y además tiene un límite. Quién tenga contenido duplicado en múltiples direcciones URL habrá desperdiciado el “crawler budget”. Es decir, rastreo que le tiene asignado Google y, tal vez, la página ya no vuelva a ser rastreada hasta un determinado tiempo después. Así pues, evitar o eliminar el contenido duplicado ayuda a que Google rastree las páginas que son realmente importantes y a que sean incluidas en su índice.
¿Cómo es el contenido duplicado interno?
Las causas del contenido duplicado se encuentran en que puede aparecer contenido idéntico (es decir, una misma descripción para las variantes de productos en una tienda online) o algunos problemas técnicos que son perfectamente evitables.
Aquí ofrecemos algunos ejemplos comunes:
Problema n° 1: Con WWW vs. Sin WWW
(http://www.dominio.es vs. http://dominio.es)
Solución: se recomienda optar por una de las dos variantes y redirigir la versión con una redirección 301 a la versión preferida. Además, también se debe especificar en la Google Search Console cuál es la versión que se ha seleccionado.
Problema n° 2: http vs. https
(http://www.dominio.es vs. https://www.dominio.es)
Solución: Si se ha incluido un certificado SSL para permitir la transmisión segura de datos, las URLs son válidas ambas versiones, es decir, HTTP y HTTPS. De nuevo, en este caso es posible derivar a través de una redirección 301 las páginas HTTP a la URL HTTPS protegida.
Problema n° 3: Barras laterales
(http://www.dominio.es versus http://www.dominio.es/)
La barra al final de la URL indicada efectivamente referencia a un directorio. Se deben evitar estas barras al final, ya que se sugiere que el enlace es un directorio, que ya no está allí.
Solución: A menudo, no se reconoce este error de inmediato ya que el navegador hace las dos versiones y muestra las páginas con facilidad. Derivar la versión con la barra al final con una redirección 301 a la versión sin barra. Solo tienes que introducir las siguientes líneas a un archivo .htaccess
RewriteCond %{REQUEST_URI} ^(.*)//(.*)$
RewriteRule . %1/%2 [R=301,L]
Matt Cutts, antiguo jefe del equipo de Spam de Google nos lo cuenta en un vídeo:
Problema n° 4: letras mayúsculas y minúsculas en las URLs
Ejemplo: /blog/nuevos-productos vs. /blog/nuevos-Productos
Solución: Una vez más, recomendamos la solución de llevar a cabo un redireccionamiento 301 para la versión deseada e informar a Google de ello.
Problema n° 5: Funciones de filtro en las tiendas online
En las tiendas online a menudo hay productos individuales en diferentes variantes. En la ropa se hace distinción. por ejemplo, entre el tamaño y el color. Normalmente, se simplifica la búsqueda del cliente gracias a un sistema de filtros para las diferentes funciones del producto. Si alguien quiere en una tienda de zapatos online específicamente unos zapatos rojos, se mostrarán solamente zapatos rojos gracias al uso de los filtros correspondientes. El resultado técnico es que la descripción general del producto filtrada se muestra con una URL diferente y, sin embargo, los contenidos son idénticos.
Página de categorías sin filtro: https://www.zalando.es/calzado-de-mujer/
Página de categorías con filtro de color rojo: https://www.zalando.es/calzado-de-mujer/_rojo/
Solución 1: Si es posible, en el sistema de la tienda se elimina la categoría de la URL de la página de detalles del producto.
Ejemplo: www.tiendaonline.es/categoria/producto >> www.tiendaonline.es/producto. Debido a la URL es única es no se produce ningún contenido duplicado. Zalando ha optado por esta solución.
Solución 2: Este problema es bastante fácil de resolver, la llamada etiqueta canonical se instala en el código fuente del filtro con un enlace a la categoría sin filtrar. Así, se marca en el motor de búsqueda que se trata de una copia «intencional». Google dejará de tener en cuenta este sitio, sino que solo contará la página original en el índice señalada por el canonical Link. En nuestra wiki, explicamos lo que es un enlace canónico.
Problema n°6: categorización múltiple de los productos en la tienda online
A menudo, un producto aparece en múltiples categorías de la tienda online. Esto puede tener sentido cuando se ofrece una lista con los diferentes productos en los respectivos sectores de la tienda online, por ejemplo, en «Ventas» y en «Novedades» si el producto acaba de salir al mercado.
Solución 1: Si es posible, en el sistema de la tienda se elimina la categoría de la URL de la página de detalles del producto. Ejemplo: www.tiendaonline.es/categoría/producto >> www.tiendaonline.es/producto. Este detalle las páginas del producto puede incluirse en muchas categorías. Debido a que la URL es única y, por lo tanto, no se produce ningún contenido duplicado.
Solución 2: Si la solución 1 no es posible, también se puede instalar un elemento de enlace canónico. En www.tiendaonline.es/categoria1/producto, a continuación, un elemento de enlace canónico se establecería en www.tiendaonline.es/categoria2/producto…
Problema n°7: Relaunch o transferencia de dominio
Si has reconstruido el sitio web o has cambiado la estructura de dirección o el contenido a un nuevo dominio, puede que aparezca contenido duplicado. La versión previa de URL está todavía online y vigente en el índice de Google con una buena clasificación.
Solución: redirigir las URLs antiguas con una redirección 301 a las nuevas páginas correspondientes de manera que Google encuentre la nueva dirección de los contenidos durante el rastreo.
Motivos de contenido
También podemos encontrarnos con contenido duplicado como el propio término indica. Aquí damos algunos ejemplos:
Problema n°8: descripción del producto muy similar o idéntica
Solución: Para las grandes tiendas, el contenido duplicado es casi imposible de prevenir por completo a nivel de producto. Es recomendable poner el foco en la optimización de las páginas a través de categorías. A nivel de producto, es posible también identificar los productos TOP (los más vendidos, por ejemplo) destacando la alta calidad y descripciones de estos productos más exclusivos.
Problema n°9: páginas internas como resultado de búsqueda
Muchos sitios web ofrecen a sus visitantes una búsqueda interna. El resultado de esta búsqueda interna también tiene su propia URL, pero el contenido es el mismo que otros documentos.
Solución: Evitar la indexación de estas páginas con la etiqueta «noindex» de Google Meta Robots. Google se encuentra con estos sitios, pero no los añade al índice. De este modo, se evitará que aparezca el contenido duplicado.
Las versiones en PDF de los sitios web NO es contenido duplicado
Algunas páginas web ofrecen a sus visitantes la posibilidad de descargar los contenidos en versión en PDF para descargar. Naturalmente, en el PDF encontraremos exactamente el mismo contenido que en la versión web. Durante mucho tiempo, se ha pensado que esto también constituía un caso de contenido duplicado y que los archivos PDF son indexados por Google. El mismo John Müller de Google ha confirmado recientemente que Google entiende esta conexión entre la versión web y la versión PDF, y que estos archivos no se ven como contenido duplicado.
Aquí el tweet de John Müller como respuesta a la pregunta de David Butler.
La herramienta Onpage de XOVI te ayuda a encontrar contenido duplicado
En XOVI Suite nos encontramos con el apartado de SEO Onpage, que nos ayuda a que el contenido sea accesible a través de dos o más direcciones URL.
En la página de Información General de Análisis Onpage se puede ver una lista de «errores, sugerencias y consejos». Dentro de esta lista de , descubrirás todas las páginas donde Google entiende que hay contenido duplicado y otros tipos de errores Onpage. Estas aparecerán como un error dentro del análisis y se indicará la URL en concreto que incluye ese contenido duplicado.
A continuación, haz clic en el aviso de error o en el número para obtener una lista de direcciones URL que se ven afectadas.
Selecciona la dirección URL que desees investigar más a fondo y, una vez acabado el análisis, pasa a ver los detalles Onpage de la URL.
Por último, con esta información ya se puede analizar la causa y solucionar el problema.
Conclusión
Evitar el mismo contenido en diferentes sitios es una tarea importante SEO. Lo bueno es que, a diferencia de otras medidas de SEO, no es necesario recurrir a terceras personas, sino que es posible realizar esta optimización uno mismo. No obstante, son necesarios algunos conocimientos técnicos para poder llevar a cabo ciertas modificaciones.