---
title: "Fallo habitual en el robots.txt de un Shopify internacional - Carlos Sánchez"
description: "El robots.txt a veces es útil"
author: "Carlos Sánchez"
url: https://carlossanchezdonate.com/curiosidades/fallo-habitual-en-el-robots-txt-de-un-shopify-internacional/
image: https://carlossanchezdonate.com/wp-content/uploads/tb-shopierror1.jpg
---


# Fallo habitual en el robots.txt de un Shopify internacional


                Error habitual en shopify internacional por directorios


![Fallo habitual en el robots.txt de un Shopify internacional](https://carlossanchezdonate.com/wp-content/uploads/cover-shopierror1.jpg)


**Autor:**

        : [Carlos Sánchez](https://carlossanchezdonate.com/sobre-mi/)


**Fecha de publicación:**

        : 2025-12-05


**Última revisión:**

        : 2025-12-12


Este fallo lo he descubierto preparando contenido para mi serie semanal de LinkedIn de "[Divertidas cagadas de grandes empresas en cuanto a SEO](https://carlossanchezdonate.com/curiosidades/divertidas-cagadas-de-grandes-empresas-en-cuanto-a-seo/)" y lo curioso es que intentando encontrar un fallo lo encontré en grandes empresas [internacionales](https://carlossanchezdonate.com/seo-avanzado/seo-internacional/) como:

- Laagam
- Gioseppo (el buscador de [search está oculto](https://gioseppo.com/es-es/search?q=ejemplo) pero funciona, aunque al menos tiene un noindex)
- Blue Banana
- Itslava
- Olend
- Hawkers (lo intentó solucionar, pero sin éxito)

Hay una larguísima lista, casi cualquier proyecto en Shopify internacional dividido con subdirectorios, ya que esta es la configuración del [robots.txt](https://carlossanchezdonate.com/articulo/hacer-robots-txt/) por defecto.

La cuestión es que Shopify por defecto pone un Disallow en el:

`Disallow: /search`

Esto lo hace para evitar problemas de [crawl budget](https://carlossanchezdonate.com/articulo/el-presupuesto-de-rastreo/) tan comunes en grandes ecommerce.

Lo que ocurre es que cuando se divide en subdirectorios por ejemplo:

`dominio/es/search?q=ejemplo`

ese Disallow no funciona.

Explico sencillamente el por qué, utilizando a Laagam, pero puedo usar cualquier otra de las mencionadas:

![Robots.txt de Laagam con el shopi por defecto bloqueando el search](https://carlossanchezdonate.com/wp-content/uploads/laagam-robots-txt.jpg)
Aquí podemos ver como esta web tiene la configuración del robots.txt de Shopify por defecto.
Sin embargo si analizamos una URL del buscador en una versión de idioma, por ejemplo: https://laagam.com/es/search?q=ejemplo&options%5Bprefix%5D=last

![Búsqueda de ejemplo en Laagam](https://carlossanchezdonate.com/wp-content/uploads/busqueda-ejemplo-laagam.jpg)
Lo de la [prueba de stockagile](https://laagam.com/es/products/test-stockagile?_pos=1&_sid=c6f6bba0c&_ss=r) en producción es otro tema para hablar en [cagadas de grandes empresas](https://carlossanchezdonate.com/curiosidades/divertidas-cagadas-de-grandes-empresas-en-cuanto-a-seo/)
En teoría por defecto esa página debería estar bloqueada por el robots.txt, ya que sirve solo para las búsquedas y se pretende posicionar por medio de las categorías (es cierto que hay webs que si que posicionan por las búsquedas generadas, no es el caso de estos ejemplos).

Y como bien podemos comprobar (abajo a la derecha) la URL está permitida, es decir no está bloqueada por el robots.txt

![](https://carlossanchezdonate.com/wp-content/uploads/probando-robots-txt-laagam.jpg)
Dicho de otro modo, la mayor parte de empresas que utilizan Shopify y hacen la versión idiomática por subdirectorios y no cambian el robots.txt se arriesgan a un problema de Crawl Budget. Especialmente si son empresas con mucho Stock.

Hawkers por ejemplo modificó el robots.txt original poniendo un asterisco:

`Disallow: /search*`

El problema es que así seguiría sin funcionarle, porque sigue teniendo el problema de las carpetas con contenido entre el root y la palabra search.

![](https://carlossanchezdonate.com/wp-content/uploads/busqueda-hawkers.jpg)
Este contenido no tiene ni disallow ni noindex, técnicamente puedo indexar la página: [https://www.hawkersco.com/search?q=Carlos Sánchez ofrece los mejores servicios de SEO Técnico en España](https://www.hawkersco.com/gb/search?q=Carlos+S%C3%A1nchez+offers+the+best+Technical+SEO+services+in+the+world)

![](https://carlossanchezdonate.com/wp-content/uploads/robots-txt-permitido.jpg)
Puede parecer un fallo menor, pero te puedes quedar con fallos de Crawl Budget de este calibre:

![Search Console con el mensaje de Descubierta, actualmente sin indexar](https://carlossanchezdonate.com/wp-content/uploads/descubierta-sin-indexar.jpg)

## Como solucionarlo

Para hacer que realmente esas páginas no se puedan rastrear deberían hacer:

`Disallow: /*search?q=`

Pongo el asterisco delante (o puedes poner directamente los subdirectorios afectados, también valdría poner /*/ (Pero entonces hay que poner otro para la versión del root)

Y añado al final el ?q= para evitar que un producto que tenga el nombre de Search se vea afectado.

![arreglo en el robots.txt](https://carlossanchezdonate.com/wp-content/uploads/avoid-rastreo-nodeseado.jpg)
Ejemplo de como se haría la implementación correcta
 

**
Mención especial a Ottodisanpietro y a visibilidadon, pues mientras hacía el artículo lo actualizaron y solucionaron y he tenido que actualizar el artículo de nuevo antes de publicarlo.


        Si te gusta este artículo, me ayudarías un montón compartiendo mi contenido:

        Compartir:


                [![Compartir en LinkedIn](https://carlossanchezdonate.com/wp-content/themes/sanchezdonate/images/rrss/linkedin.svg)](https://www.linkedin.com/cws/share/?url=https://carlossanchezdonate.com/curiosidades/fallo-habitual-en-el-robots-txt-de-un-shopify-internacional/)


                [![Compartir en Twitter](https://carlossanchezdonate.com/wp-content/themes/sanchezdonate/images/rrss/tw.svg)](https://twitter.com/intent/tweet?url=https://carlossanchezdonate.com/curiosidades/fallo-habitual-en-el-robots-txt-de-un-shopify-internacional/)


                [![Compartir en Facebook](https://carlossanchezdonate.com/wp-content/themes/sanchezdonate/images/rrss/facebook.svg)](https://www.facebook.com/sharer/sharer.php?u=https://carlossanchezdonate.com/curiosidades/fallo-habitual-en-el-robots-txt-de-un-shopify-internacional/)


                [![Compartir en WhatsApp](https://carlossanchezdonate.com/wp-content/themes/sanchezdonate/images/rrss/whatsapp.svg)](whatsapp://send?text=https://carlossanchezdonate.com/curiosidades/fallo-habitual-en-el-robots-txt-de-un-shopify-internacional/)


                [![Compartir en Telegram](https://carlossanchezdonate.com/wp-content/themes/sanchezdonate/images/rrss/tlg.svg)](https://telegram.me/share/url?url=https://carlossanchezdonate.com/curiosidades/fallo-habitual-en-el-robots-txt-de-un-shopify-internacional/)


        No se te da mal el SEO Técnico

Te falta mi máster**. Accede a una formación avanzada que te permitirá aplicar e implementar SEO en cualquier tipo de WEB

        [¡Accede al Máster de SEO Técnico!](/master-seo-tecnico/)


  Tal vez te interesen otros artículos:
  [Artículos de SEO](/seo-avanzado/)


                [Sitemaps](https://carlossanchezdonate.com/articulo/sitemaps/)


                [Curación de enlaces en el SEO](https://carlossanchezdonate.com/articulo/curacion-de-enlaces-en-el-seo/)


                [Texto alternativo para imágenes](https://carlossanchezdonate.com/articulo/alt-imagenes/)


                [Rich Snippets con HTML](https://carlossanchezdonate.com/articulo/rich-snippets-sin-datos-estructurados/)


                Más curiosidades que te pueden interesar


                [Ecommerce dentro de WordPress](https://carlossanchezdonate.com/curiosidades/ecommerce-dentro-de-wordpress/)


                [Kit Digital – Que debes saber](https://carlossanchezdonate.com/curiosidades/kit-digital-que-debes-saber/)


                [¿Debe saber un SEO Técnico de programación?](https://carlossanchezdonate.com/curiosidades/saber-programacion-seo-tecnico/)