Analyser du HTML en Java avec jsoup

Si vous avez besoin d’analyser une page HTML je vous recommande vivement la librairie jsoup.
Cette librairie permet d’extraire les informations voulues d’une page HTML en utilisant une syntaxe semblable à jQuery. Couplé à l’utilisation des expressions lambda apportés par la version 8 de Java il devient très simple d’écrire du code élégant pour manipuler du HTML :

Jsoup.connect("http://cdimage.debian.org/debian-cd/8.1.0/amd64/iso-cd/").get().select("a").stream()
    	.map(e -> e.attr("href"))
        .filter(s -> s.endsWith(".iso"))
        .map(s -> "http://cdimage.debian.org/debian-cd/8.1.0/amd64/iso-cd/" + s)
        .forEach(System.out::println);

La ligne suivante permet d’obtenir tous les liens de la page (sélecteur jQuery a), de récupérer uniquement leur attribut href, de ne conserver que ceux terminant par .iso, d’ajouter l’adresse à cet attribut et enfin de lister les résultats.
Je vous laisse faire la même chose en utilisant Java 7 !