domingo, 12 de junio de 2005

Crea tu Google Sitemaps III: Usando Google Sitemap Generator.

Comentaba antes que Google pone a disposición de todo el mundo una forma de crear un Sitemap de una sitio Web entero automáticamente, la herramienta se llama Google Sitemap Generator, se trata de un script programado en python (archivos con extensión py) que hay que ejecutar en el servidor, si se dispone claro está, de python en el servidor y si se sabe hacerlo…

Para crear un Sitemap con Sitemap Generator primero ha que bajarse el script desde aquí, una vez descargado el zip lo descomprimimos y tendremos los siguientes archivos:

    • sitemap_gen.py
    • README
    • example_urllist.txt
    • example_config.xml
Además de estos también hay un par de archivos como setup.py, pero los importantes son los mencionados. Bien, lo primero que hay que hacer es editar el example_config.xml para indicar que sitio Web es el nuestro y en que path del servidor queremos almacenar el archivo zip que Sitemap Generator crea, porque el xml lo guarda en un archivo zip.

Editado el example_config.xml le cambiamos el nombre a config.xml y lo subimos junto con sitemap_gen.py, que es el script que genera el Sitemap al servidor.

En el servidor por tanto hemos de tener los siguientes archivos:
    • sitemap_gen.py
    • config.xml
También se puede usar un archivo de texto (.txt) para indicar al script las zonas que debe recorrer, en cuyo caso habrá que indicar en el config.xml su localización y subirlo al servidor. La composición de este archivo que se debe llamar urllist.txt se explica en el archivo example.txt

Una vez subido todo al servidor entonces habrá que ejecutar en el mismo servidor el archivo sitemap_gen.py, para ello habrá que tener instalado python en el servidor y saber como usarlo. La línea de comando que hay que introducir es:
python sitemap_gen.py --config=/path/config.xml

Ejecutada esa línea de comandos el script debería crearnos el archivo Sitemap.zip en el directorio indicado en el config.xml.

Pues este es básicamente el funcionamiento de Sitemap Generator, script que particularmente no me entusiasma y que veo demasiado complicado de manejar para gente sin experiencia, es más fácil entender el protocolo de sitemaps que aprender a usar Sitemaps Generator. Personalmente si tenemos un servidor con php y mysql o asp y la página Web está programada en estos lenguajes, prefiero crear el Sitemap mediante un script propio en php o asp, porque además este script irá actualizando automáticamente el Sitemap conforme se introduzcan nuevos contenidos en la Web y sin necesidad de ejecutar ni actualizar nada…

Si aun así el lector quiere más información acerca del tema, entonces recomiendo visitar la explicación de Google acerca de Sitemap Generator.

sábado, 11 de junio de 2005

Crea tu Google Sitemaps II: El protocolo de Google Sitemaps

Si se tienen algunas nociones de XML se entiende rápidamente el estándar de Google para crear un sitemap. Se trata -como digo- de un archivo XML, y por tanto lo primero de este archivo ha de ser el encabezado que indica que el documento es un XML:

<?xml version="1.0" encoding="UTF-8"?>

Después cada dirección o enlace se indica con 4 parámetro o tags, encapsulados entre los tag <url></url> que se pueden poner 50.000 en un documento y todo salvo el encabezado a de estar encapsulado con el tag <urlset></urlset>. Los tags que utiliza Google para Sitemaps son los siguientes:

    changefreq — Con que frecuencia se cambia el contenido de la página.
    lastmod — El tiempo en el que fue modificado por última vez el contenido de la página.
    loc — La URL de la página.
    priority — Prioridad de está página en el sitio Web.
    url — Este tag encapsula los 4 primeros tags, los anteriores.
    urlset — Este tag encapsula todo el contenido del documento salvo la cabecera.
De los 4 tags que se necesitan para clasificar un enlace solo <loc></loc> es obligatorio, los demás son opcionales. Este tag lo único que contiene es la dirección del enlace de la siguiente forma <loc>http://www.miweb.net/pagina.html</loc>, siendo obligatorio colocar http:// antes de la dirección de la página, sino lo hacemos así entonces Googlebot, el robot de Google lo detectará como un error cuando lo lea. Los otros 3 tags son opcionales y cada uno tiene sus características:

Changefrec
Se debe rellenar con uno de los siguientes valores:
always, hourly, daily, weekly, monthly, yearly y never.
Indicando con cada uno la frecuencia con la que se actualiza una página concreta.

Priority
Se debe rellenar con un número del 1.0 al 0.0, siempre en decimal, nunca como número entero.

Lastmod
Se debe rellenar con la hora en formato ISO 8601, por ejemplo: <lastmod>2005-02-21T18:00:15+00:00</lastmod>

Un ejemplo práctico de un Sitemap, recordad que se pueden poner tantos enlaces como se desee hasta llegar a 50.000:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.yoursite.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=73</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.yoursite.com/catalog?item=83</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>

Una vez creado el archivo se puede guardar comprimido en Gzip o zip, del modo http://www.miweb.com/sitemap.zip, pero siempre teniendo en cuenta -avisa Google- de que el archivo no tenga mas de 10 MB de tamaño descomprimido. Es importante que siempre se cree el Sitemap en una página con el nombre Sitemap, para ayudar a Googlebot a localizarlo y poner un enlace claro al principio de la página hacia el. Otra manera de dar a conocer nuestro Sitemap a Google es creando una cuenta en Sitemaps y agregándolo, es lo más recomendable porque siempre podremos ver el estado de nuestro Sitemap, si contiene errores y cuando lo ha leído Google.

Crea tu Google Sitemaps I: ¿Que es Google Sitemaps?.

Los mapas Web son una útil herramienta para guiar al visitante a través de los contenidos de un sitio Web, cuanto mas grande sea el sitio mas grande también es la necesidad de crear un mapa Web. Hasta ahora los mapas Web eran simplemente un conjunto de enlaces ordenados de mayor a menor importancia dentro de una página Web, la pega de este sistema que podemos llamar “tradicional” es que crear un mapa de todas las direcciones de un sitio Web era un trabajo muy costoso, además como Google avisa en sus FAQs, las paginas Web con mas de 100 enlaces no le gustan, las considera un nido de enlaces y por tanto una trampa, así que en los mapas Web nada mas que se indicaban los enlaces a las páginas de mayor importancia.

Para mejorar la calidad de sus buscas y también beneficiar a los buenos diseñadores, Google ha creado una nueva forma de hacer mapas Web a la que ha llamado Sitemaps, se trata de un código XML similar al de las noticias RSS. Las ventajas para los que adopten este método de mapa Web será un mayor numero de páginas indexadas y por lo tanto más posibilidades de recibir visitas, por tanto es altamente recomendable adoptar este nuevo sistema de crear mapas Web. Además aquí el número de enlaces máximo aumenta a nada menos que 50.000 enlaces, prácticamente todos los de una página Web mediana.

Para crear un Sitemap Google pone a disposición de todo el mundo una aplicación llamada Sitemaps Generator, es una aplicación pitón y un archivo XML de configuración, que con tan solo ponerlo en el sitio Web y ejecutar el archivo pitón crea un archivo con el Sitemap de todo un sitio Web. Pero hay mas formas de crear un Sitemap, la que a mí mas me gusta es la que uno mismo se diseña.

Presentación.

Con la creación de este blog, me propongo dar a conocer curiosidades de la creación, diseño y programación de páginas Web, asimismo como el posicionamiento en buscadores, principalmente Google, todo mirado desde un punto de vista de un aprendiz para otros aprendices y no con el a veces lenguaje serio de páginas Web que se dedican a esto profesionalmente, Webs que por supuesto visito y leo a menudo, pues un buen programador y/o Webmaster está obligado a estar pendiente de las novedades que aparecen en este convulso mundo, donde nuevos estándares aparecen casi de un día para otro y lo que ayer era bueno hoy no lo es tanto.

Por tanto este, mi pequeño rincón es mas para compartir experiencias que para enseñar, no pretendo corregir errores ni enseñar al que ya sabe, sino compartir con ellos mis experiencias, de las que por supuesto la gente que quiera aprender podrá sacar provecho.

Hablaré mucho sobre Google en este blog, mi empresa favorita de Internet, y por supuesto del posicionamiento Web y de cómo programar de modo que Google no nos penalice, y podamos seguir con el desarrollo de nuestras Webs sin que errores de programación nos hagan perder puntos frente a la competencia.

PHP, HTML, CSS, XML serán otros lenguajes de programación de los que hablaré mucho, y por supuesto espero que tanto para corregirme algún error , como para aportar experiencias el lector se anime a participar…