Java HTML 解析器:jsoup

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。

比起之前用的HTMLParser方便很多,而且更轻便。

简单一句就可以搞定HTML过滤:

String  tt ="你访问的是<a href='http://www.quanlei.com/' target='_blank'>权记</a>网站。";
System.out.println(Jsoup.parse(tt).text());

同时还有其他一些更好的支持,比如:

1、对 HTML文档中链接可以进行处理。
2、对可能怀有恶意的HTML进行处理。
3、对 HTML 修改节点的属性、内容等。

更多内容,请查看 jsoup 或者 http://www.oschina.net/p/jsoup