h1

wget no descarga RSS de Google News

14/09/2010

Si al intentar descargar un RSS o contenido de Internet por wget se produce en siguiente error:

carlos@adscompc02:~/Descargas$ wget "http://news.google.es/news?pz=1&cf=all&ned=es&hl=es&output=rss"
--2010-09-14 11:51:23-- http://news.google.es/news?pz=1&cf=all&ned=es&hl=es&output=rss
Resolviendo news.google.es... 209.85.227.147, 209.85.227.105, 209.85.227.104, ...
Conectando a news.google.es|209.85.227.147|:80... conectado.
Petición HTTP enviada, esperando respuesta... 403 Forbidden
2010-09-14 11:51:23 ERROR 403: Forbidden.

es debido a que el servidor web está configurado para rechazar las conexiones de clientes con User-agent «wget» ó similares «wget123», etc. Se soluciona cambiando el User-agent de wget:

carlos@adscompc02:~/Descargas$ wget -U hola "http://news.google.es/news?pz=1&cf=all&ned=es&hl=es&output=rss"
--2010-09-14 11:52:49-- http://news.google.es/news?pz=1&cf=all&ned=es&hl=es&output=rss
Resolviendo news.google.es... 209.85.227.106, 209.85.227.99, 209.85.227.103, ...
Conectando a news.google.es|209.85.227.106|:80... conectado.
Petición HTTP enviada, esperando respuesta... 200 OK
Longitud: 51756 (51K) [application/xml]
Guardando en: «news?pz=1&cf=all&ned=es&hl=es&output=rss.7»

100%[===============================================>] 51.756 --.-K/s en 0,06s

2010-09-14 11:52:50 (790 KB/s) - «news?pz=1&cf=all&ned=es&hl=es&output=rss.7» guardado [51756/51756]

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

A %d blogueros les gusta esto: