23 nov. 2016

Descargar una página web sencilla con wget

$ wget web -kcrN -np -l 30 -P destino
Explicación:
  • -k --convert-link: transforma los enlaces a archivos locales
  • -c --continue: si por algún motivo se ha interrumpido la descarga, continúa desde ese punto la siguiete vez
  • -r --recursive: descargar la página y cada uno de los enlaces que incluya
  • -N --timestamping: no re-descarga al archivo a no ser que sea más moderno que el ya descargado
  • -np --no-parent: no sube en la estructura jerárquica de directorios de la web
  • -l --level: máximo nivel de profundidad en la descarga recursiva
  • -P --directory-prefix: directorio local en el que descargar los archivos

Comprobar que la versión de wget no es antigua, porque la 1.8.2 me ha estado dando muchos quebraderos de cabeza con la interpretación del parámetro -P. Se puede obtener wget para windows en https://eternallybored.org/misc/wget/
Existe un complento de Firefox llamado cliget para poder llamar a wget desde la página visitada.