JavaCrawler-ChangeLog
-
14-Febrero-2010
-
Se han refactorizado las clases, a partir de ahora las clases
principales se encuentran en el paquete org.javacrawler.core
-
Se ha añadido la opción de permitir seguir los enlaces redireccionados.
-
Se ha añadido una opción para poner un limite al número de enlaces a visitar
independientemente del nivel de profundidad indicado.
-
Se ha añadido una propiedad para que los HttpDocuments apunten
a su HttpDocument padre.
-
Se ha solucionado un problema en la visualización de los resultados
al utilizar la redirección. (se producía un StackException).
-
3-Febrero-2010
-
Se ha añadido la posibilidad de conectarse a partir de un Proxy HTTP.
Para ello se utiliza una nueva clase Proxy.
-
Se ha modificado el constructor de Crawler, a partir de ahora no
soporta indicar el puerto de conexión, se expecifica directamente
en la URL.
-
Se ha añadido interfaz CrawlerEvent y la clase CrawlerEventAdapter.
Permiten inyectar acciones antes y después del análisis de cada página.
-
31-Enero-2010:
-
Se ha modificado la implementación de las conexiones. A partir de ahora
las peticiones HTTP se realizan con HTTPClient.
-
Se ha modificado la forma de realizar el análisis del cuerpo
de la respuesta con HTMLParser.
-
Se permiten utilizar caracteres UTF-8 y espacios en la query de la URL.