El SEO de la Casa Real elimina a Urdangarin


El SEO de la Casa Real elimina a Urdangarin
es el post de la semana de Soy de Marketing, pero algo diferente a los anteriores… Se trata de una noticia de Marketing y SEO que nos ayuda a conocer el funcionamiento de los robots.txt, tan utilizados en SEO y en general por muchos webmasters para proteger una página web. El artículo comienza con una introducción que pretende ser el nexo de unión entre estos dos temas tan dispares pero a la vez tan actuales…

Caso Urdangarin

Iñaki Urdangarin, para quien aún no lo conozca, es un antiguo balonmanista español, pero en la actualidad es más conocido por ser el marido de la Infanta Cristina de Borbón, hija de nuestro ya ex-Rey, y sobre todo por su presunto fraude al Estado español mediante el Instituto Nóos.

Te preguntarás qué relación puede tener una noticia de SEO con un exjugador de balonmano, es normal, yo también me lo preguntaría. Por este motivo, vamos a empezar con introducción a los robots.txt para no perdernos durante el post.

blog de marketing digital

¿Qué es un Robot.txt?

Toda página web debe tener dos archivos para proteger su integridad; uno es el archivo htaccess y otro el robots.txt, del que trata nuestro artículo. Mediante estos archivos vamos a garantizar la seguridad de nuestra página web, o al menos aumentar notablemente la seguridad.

El archivo Robots.txt indica a los rastreadores de los motores de búsqueda a que partes no queremos que accedan de nuestra web. Mediante una serie de comandos vamos a indicar a las “arañas” de los buscadores qué es lo que pueden y no pueden ver (y por tanto indexar) en nuestra web.

Robots.txt básico

Estamos hablando de un archivo con formato “txt” (quizás más conocido como “bloc de notas” o “documento de texto”) que incluye una serie de parámetros como por ejemplo:

Blog de Marketing Digital

Este es el robot más habitual para aquellos con menos conocimientos de programación. Google nos aconseja tener este archivo, por lo que será recomendable subirlo a nuestro servidor si es que aún no lo tenemos.

En este caso indica a Google (o nuestro buscador habitual) que todos los robots tienen permitido el paso y por tanto la lectura de nuestra web. Esto puede suponer un problema para aquellos que copian contenido de manera automatizada y lo publican en su sitio web, perjudicando a los que creamos el contenido original.

Robots.txt antirastreo

Soy de Marketing

En este caso ya podríamos incluir aquellos robots que no queremos que rastreen y entren en nuestra web a leer el contenido. Si no queremos escribirlos de uno en uno podemos usar “ALL” para indicar que no queremos que entre ninguno.

En Internet encontrarás listas con robots “maliciosos” que lo único que hacen es copiar contenido para mandarlo a otras webs. ¿Cuál será el original para Google? Ahí está nuestro problema.

Robots.txt de acceso a un solo robot

Blog de Marketing

En este caso solo se dejaría entrar a un solo bot o robot. A especificar por nosotros.

Robots.txt que bloquea directorios y subdirectorios

Marketing Digital

Este es el más interesante para nuestro artículo, puesto que habla de aquellos directorios y subdirectorios que deben ser bloqueados. De esta manera podríamos bloquear ciertas imágenes, contenido sobre personas, etc.

Aclaración sobre los Robots.txt

NOTA: Debemos tener en cuenta que hay ciertos robots que nos interesa que entren a nuestra web, por ejemplo si tenemos una newsletter automatizada tenemos que permitir al robot de nuestra aplicación (por ejemplo Mailchimp) que acceda a nuestro contenido. Si lo bloqueamos no podrá acceder a nuestro feed para descargarse los nuevos contenidos y reenviarlos en la newsletter.

Como podrás imaginar, para un SEO es fundamental el uso de estos archivos (entre otros) para proteger la web de bots maliciosos y “ocultar” el contenido que no queremos que sea visible para Google. ¿Tienes dudas sobre este archivo? Escribe tus preguntas en un comentario.

¿Qué ha hecho el SEO de la Casa Real?

¿Se ha cargado a Urdangarin? ¿Lo ha borrado del mapa? En efecto.

El encargado del posicionamiento orgánico de Casa Real, es decir el SEO, decidió hace tiempo vetar el contenido de la página web de la Familia Real Española para olvidar más rápido al presunto defraudador. Aunque las últimas informaciones señalan (siempre presuntamente) a la Casa Real como cómplice de estos delitos, ellos quisieron desvincularse de este señor y sus fechorías hace tiempo…

Para conocer el archivo robots.txt de una web podemos escribir en el navegador la URL seguida de /robots.txt para conocer lo que este archivo quiere ocultar a los ojos de Google:

Marketing

Nosotros hemos buscado el robot de la Casa Real y… ¡SORPRESA! Al único “bot” que quieren hacer olvidar y ocultar en un cajón es al marido de la Infanta, el señor Iñaki Urdangarin, y encima, en todos los idiomas:

Noticias de Marketing Digital


El Duque de Palma ha sido bloqueado, al menos el acceso a sus contenidos “reales”. De esta manera no habrá ningún enlace que conduzca a este señor, ni siquiera los que se han puesto en el pasado.

La Casa Real ha bloqueado todo el contenido de su página web que tiene que ver con este señor, de manera que marca distancias y quizás no quiera aumentar el desprestigio que ha ganado la Casa Real en los últimos años (según las encuestas del CIS).

Espero que el contenido del artículo os haya gustado y os haya servido para aprender algo más de SEO.

Un saludo a todos mis lectores.

2 Respuestas

  1. jajajaja Me ha gustado mucho. Al final ni la casa real tiene un SEO decente…

    Saluuudos.

  2. Simplemente genial.

Dejar una opinión