Java HTML 解析器:jsoup

日期:2010年08月10日 分类:技术, 编程相关

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。

比起之前用的HTMLParser方便很多,而且更轻便。

简单一句就可以搞定HTML过滤:

String  tt ="你访问的是<a href='http://www.quanlei.com/' target='_blank'>权记</a>网站。";
System.out.println(Jsoup.parse(tt).text());

同时还有其他一些更好的支持,比如:

1、对 HTML文档中链接可以进行处理。
2、对可能怀有恶意的HTML进行处理。
3、对 HTML 修改节点的属性、内容等。

更多内容,请查看 jsoup 或者 http://www.oschina.net/p/jsoup

无觅相关文章插件,快速提升流量

Tags: , , ,

这篇文章发布于 2010年08月10日 at 10:20 归类于 技术, 编程相关。 您可以跟踪这篇文章的评论通过 RSS 2.0 feed。 您可以 留下评论, 或者从您的站点 trackback