Alejandrox

Blog personal de Alejandro Meroño Hernández

wget. Descarga contenidos desde servidores web de forma simple  

GNU wget es una herramienta que permite la descarga de contenidos desde servidores web de una forma simple. Su nombre deriva de «World Wide Web» (w), y de «obtener» (get), esto quiere decir: obtener desde WWW. Actualmente soporta descargas mediante los protocolos HTTP, HTTPS y FTP.Entre las características más destacadas que ofrece wget está la posibilidad de fácil descarga de mirrors (espejos) complejos de forma recursiva, conversión de enlaces para la visualización de contenidos HTML localmente, soporte para proxies… (Información extraida de la Wikipedia)

Cómo usar wget

La forma más simple de usar wget es escribiendo en la consola wget URL/Nombre_fichero.

Ejemplo:

  • wget http://www.alejandrox.com

Si escribes este comando obtendrás un fichero llamado index.html en el directorio en el que lo has escrito. Este fichero contiene la página principal de www.alejandrox.com

Realiza una copia completa de un sitio web

Para obtener todo el contenido del directorio raíz de un sitio web y todos sus subdirectorios tendremos que añadir a wget el parámetro -r.

Ejemplo:

  • wget -r http://debaday.debian.net/

Este comando generará en el disco duro una copia exacta del blog debaday.net. En este punto debo hacer una aclaración. Wget respeta el contenido del fichero robots.txt si es que el directorio raíz del sitio web lo contiene. Esto quiere decir que wget no descargará directorios o ficheros que estén incluidos en este fichero.Yo suelo usar el parámetro -r para hacer una copia de seguridad de mi blog. !Con tan sólo un comando guardo en mi disco duro todo el contenido de mi web!: wget -r http://www.alejandrox.com

Múltiples URLs

Wget soporta también múltiples URLs. Podemos especificar las direcciones en un fichero (una dirección por línea) o en la línea de comandos, separando las direcciones con espacios.

Ejemplo:

  • wget www.alejandrox.com www.boscolorca.es

Si especificamos las direcciones en un fichero tenemos que utilizar el parámetro -i.

  • wget -i fichero

Otras opciones de wget

Wget soporta varios parámetros más aparte de los ya comentados:

  • -l: para especificar la profundidad a la que llegará la descarga recursiva. Por defecto la profundidad es 5.
  • -o: permite especificar el nombre de un fichero de salida, donde se guardarán los resultados.
  • -c: reanuda la descarga en la próxima ejecución si se corta la conexión o se para el programa.

Podemos ver todos los parámetros que soporta wget escribiendo “man wget” en la consola.

Fuente: http://debaday.debian.net

Popularity: 2% [?]


Otras entradas que te pueden interesar



Esta entrada tiene

0 comentarios

Escrito por Alejandrox

Octubre 20th, 2007 at 2:28 pm

Categoría: Ubuntu

Deja un comentario