|
miércoles, febrero 18, 2009
|
|
Si utilizas Linux o una variante de UNIX (como el mismo OS X) en donde puedas instalar o tengas acceso al comando wget, he aquí un truco que te gustará, ya que te permite descargar un website completo (es decir, todas las páginas web dentro de un mismo dominio) con una sola linea de comando, lo que resulta bastante útil.
El comando es el siguiente y lo debes escribir en una sola linea, aunque simplemente copia-pega directamente desde aquí a tu linea de comando y cambia el final que dice foo.com (nota que como es Linux/UNIX, que debes poner atención a las mayúsculas y minúsculas): wget --random-wait --limit-rate=64k -e robots=off -r -p -U mozilla http://www.foo.com Es importante entender por qué ciertas opciones del comando wget que utilizamos: --random-wait significa que entre un pedido y otro al website, que espere un tiempo aleatorio, para así no pedir demasiadas páginas y archivos uno detrás de otro y alarmar a algún sistema de seguridad. --limit-rate=64k significa que no pase de 64 KiloBytes por segundo en transferencia de datos. Este número depende de tu conexión a Internet, y no es recomendado que lo incrementes mucho para no alarmar al website remoto. También puedes especificar el valor en MB/s sustituyendo la "k" por una "m". -e robots=off significa que wget no debe prestar atención al archivo robots.txt que indica cuáles páginas no deben accederse por un navegador web. -r significa que queremos todo de manera recursiva. -p indice que descargue todos los archivos para desplegar adecuadamente una página HTML. -U mozilla significa que impersonifique a la familia Mozilla de navegadores (como Firefox). Y finalmente sustituye http://www.foo.com por el website que deseas descargar. Noten que este truco es bastante útil para esas páginas que ofrecen miles de fotos para diseñadores gráficos, pero que te hacen moverte una página a la vez de manera manual y lenta. Mientras que con esto puedes dejar a que wget "navegue y descargue" todo por ti. Manual ("man page") de wget con las otras opciones que ofrece autor: josé elías |
|
|
|
|
|
Comentarios
Añadir Comentario |
"Hola Elías, un abrazo desde Costa Rica y un muy sincero agradecidimento por haber aportado al mundo tu esfuerzo buscando información, explicandola al estilo eliaxístico, por aportar tu opinion sobre las cosas y dándole significado a las señales de los tiempos actuales y del pasado.
De verdad muchas gracias porque en mi caso muy personal has dado a mi vida cimientos de lógica y razón. Me has hecho revelarme ante las verdades impuestas y me enseñaste a cuestionar todo, incluso a mi mismo.
Gracias de verdad, mas hayá que un hobbie has hecho una gran labor social a la intelectualidad."
De verdad muchas gracias porque en mi caso muy personal has dado a mi vida cimientos de lógica y razón. Me has hecho revelarme ante las verdades impuestas y me enseñaste a cuestionar todo, incluso a mi mismo.
Gracias de verdad, mas hayá que un hobbie has hecho una gran labor social a la intelectualidad."
en camino a la singularidad...
©2005-2026 josé c. elías
todos los derechos reservados
como compartir los artículos de eliax
Seguir a @eliax

y que pasa con los contenidos que estan dentro de bases de datos y que dependen de los parametros que se pasen por ejemplo
if($_request["acceso"] == true){
echo "contenido exclusibo";
}
que aria en este caso para descargar este tipo de contenido por que igual en las base de datos.