qué es la desindexación en google

¿Qué es la desindexación en Google y cuándo deberías aplicarla?

Introducción: ¿Qué es la desindexación en Google?

Cuando nos referimos a desindexar es eliminar una página o URL de la base de datos del índice de Google (u otro buscador como Bing, etc).

Eso significa que esa página no va a aparecer en los resultados de búsqueda del buscador en cuestión.

Hay que diferenciar que una página o url por estar publicada, no necesariamente puede ser indexada o rastreada. También hay que diferenciar que el rastreo no es la indexación. Rastreo es que el robot del buscador pueda enocntrarla e investigarla por así decirlo (follow, nofollow) y luego puede indexarla o no dependiendo de las directrices que tenga esa URL (index, no index).

"Desindexar no es desaparecer de Internet, es decirle a Google qué páginas no te interesa posicionar."

diferencias entre indexación y desindexación

¿Cómo funciona la indexación y desindexación?

Para que Google pueda encontrar las páginas de tu Web e indexarlas en su buscador, se tiene que poder:

  • 1. Rastrear: Googlebot descubre tus URLs a través de enlaces internos, sitemaps, enlaces externos, etc.
  • 2. Procesa: analiza el contenido, el código y las señales técnicas de cada página.
  • 3. Indexación: si la URL cumple ciertos criterios, se añade al índice y puede empezar a posicionarse.

La desindexación se produce por 2 motivos principales:

  • 1. Tú mismo: le indicas a Google explícitamente que no indexe una página (meta robots, cabecera HTTP, etc.).
  • 2. El propio buscador: decide retirarla por problemas técnicos, contenido pobre o directrices de calidad.

Motivos por los que una página debe desindexarse

Puede que al empezar cualquier proyecto Web pienses que todas las URLs se deben indexar. Algunas urls no se deben indexar, aunque la gran mayoría sí. Ahora, ¿cuáles debo desindexar y por qué? te cuento:

  • Páginas sin intención de posicionarse: contenido que no responde a ninguna necesidad de búsqueda del usuario.
  • Contenido duplicado o casi duplicado: fichas muy parecidas, urls que hablen del mismo contenido (indicando su canonical), etc.
  • Todo tipo de filtrados: los filtros generan muchas urls que no están relacionadas a palabras clave, por lo que no se deben de indexar. Esto pasa mucho en los ecommerce.
  • Thin content: páginas con contenido de poco valor, pobres, sin profundidad ni utilidad real.
  • Páginas técnicas o internas: carritos de compra, páginas de login, paneles de usuario, etc..
  • Contenido muy desactualizado: productos que ya no tienen sentido y que no vas a proveer.
  • Secciones legales: condiciones de uso, política de cookies, avisos legales, etc.
  • Pruebas: URLs que has creado para testear, no deben de indexarse mientras estés de pruebas.

Desindexar estas páginas ayuda a que el presupuesto de rastreo se concentre en lo importante y a que tu proyecto tenga una estructura más limpia de cara a Google y por ende mejore tu posicionamiento.

qué es la desindexación de url

Cómo saber si una URL está desindexada

Puedes hacerlo de varias formas:

  • Comando site:: escribe en Google site:tudominio.com/url-concreta. Si no aparece, probablemente no esté indexada.
  • Inspección de URL: desde Google Search Console puedes ver si la página está en el índice, si se rastrea o si hay algún problema concreto.
  • Informes de cobertura: el propio Search Console te indica cuántas URLs están indexadas, desindexadas, válidas, excluidas, con advertencias, etc. Es muy útil para saber qué urls no se han indexado y arreglar esos problemas en caso de que tengas que indexarlas.

Es importante diferenciar entre no indexada (Google la conoce, pero decide no indexarla o tú se lo has pedido) y no rastreada (Googlebot ni siquiera ha llegado todavía) como ya mencionamos en el primer apartado.

Principales errores que causan desindexación

Hay situaciones en las que una desindexación no es buscada, sino consecuencia de fallos de configuración o problemas técnicos. Algunos errores típicos y frecuentes son:

  • Meta robots noindex: dejar un noindex activo después de una fase de desarrollo o pruebas.
  • Bloqueos en robots.txt: impedir el rastreo de secciones completas sin querer al usar reglas demasiado genéricas.
  • Errores 4xx o 5xx recurrentes: si una página devuelve fallos durante mucho tiempo, Google puede retirarla del índice.
  • Contenido muy pobre o automatizado: Google puede considerar que no merece estar indexado si no aporta valor, es decir contenido de calidad para el usuario.
  • Falta de enlazado interno: páginas huérfanas que no reciben enlaces internos en tu Web y por ende Google les muy difícil llegar a ellas.
  • Redirecciones mal implementadas: cadenas infinitas, bucles o redirecciones hacia URLs irrelevantes.

Por eso es tan importante revisar periódicamente la cobertura de tu sitio y no dar por hecho que todas las páginas siguen indexadas igual que el primer día.

Pasos para desindexar una URL en Google

Cuando ya tienes claro que esa página o URL no la debes desinexar por la razón correcta, puedes segir estos pasos:

  1. Etiqueta noindex: en la url específica que quieres desindexar incluye ese parámetro. Según tu CMS lo tendrá en una pestaña u otra. La directiva a poner en html es esta:
  2. Dejar rastreo: no le pongas ninguna directriz en el robots.txt. Deja que Google siga accediendo a ella para que la lea y la desindexe.
  3. Quitarla del Sitemap: tanto del mapa Web html del sitio, como del sitemap en XML debes eliminar esa URL de ahí. Ya que si no son señales que se están contradiciendo y el robot de Google entraría en conflicto.
  4. Retirada temporal: dentro de Google Search Console accede al apartado de Indexación y a su subsección "Retirada de URLs". Aquí podrás indicarle a Google si quieres una desindexación temporal. Normalmente son 6 meses. Cuando pase ese tiempo, vuelve a comprobar si está indexada o no, y repite el proceso.

Mitos sobre la desindexación

  • “Cuantas más páginas indexadas, mejor SEO”: falso. Importa más la calidad y relevancia que el volumen bruto.
  • “Desindexar es malo por definición”: una desindexación correcta puede mejorar la salud global de la web y su SEO.
  • “Si una página no aparece en Google es que está penalizada”: seguramente será un error como los que te mencionamos en los apartados anteriores.
  • “Solicitar indexación garantiza aparecer rápido”: ayuda, pero la decisión final siempre es de Google.

Conclusión

La desindexación en Google es una herramienta. Bien utilizada, te permite limpiar tu proyecto, optimizar el rastreo y centrar la autoridad en las páginas que realmente necesitas posicionar.

Si defines una estrategia clara, revisas periódicamente la cobertura y controlas las señales técnicas, la desindexación dejará de ser un susto y se convertirá en una aliada más de tu SEO.