`
jilong-liang
  • 浏览: 470675 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类

Jsoup解析HTML代码标签与属性

阅读更多
package com.app.jsoup;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;


/**
 *@Author:liangjilong
 *@Date:2013-8-8
 *@Email:jilongliang@sina.com
 *@Version:Version1.0
 *@CopyRight:liangjilong
 *@Description:
 */
public class Jsoup1 {
	public static void main(String[] args) {
		StringBuffer buffer=new StringBuffer("<table border=\"1\" align=\"center\">");
		buffer.append("<tr><td colspan=\"2\" class='td'>电&nbsp;&nbsp;话:</td><td id=\"tel\"></td></tr>");
		buffer.append("<tr><td colspan=\"2\" class='td'>用&nbsp;&nbsp;户:</td><td id=\"username\"></td></tr>");
		buffer.append("<tr><td colspan=\"2\" class='td'><img src=\"images/1.png\"/></td></tr>");
		buffer.append("</table>");
  		String html=buffer.toString();
  		Document doc=Jsoup.parse(html, "GBK");
  		Elements table=doc.select("table");//选择table标签
  		for(Element tab:table){
  			tab.attr("border", "2");//修改table的边框值
  		}
  		 Element td_classfirst = doc.select("td.td").first(); 
  		 td_classfirst.remove();//把第一个td的class=td的样式的标签都移除
  		 
  		 Element td_classlast = doc.select("td.td").last(); 
  		 td_classlast.remove();//把第最后的一个td的class=td的样式的标签都移除
  		 
  		 Elements pngs = doc.select("img[src$=.png]");// 所有引用 png 图片的元素
  		 for(Element png:pngs){
  			 String pngText=png.text();
  			 String src=png.attr("src");//根据属性名获取src的路径
  			 System.out.println(src+pngText);
  		 }
  		 //在id为tel的td标签里面添加一个value等于121212121的值 如:<td id="tel" value="121212121"></td>
  		 doc.getElementById("tel").val("121212121");//
  		 //在id为tel的td标签添加一个文本值 如:<td id="tel">121212121</td>
  		 doc.getElementById("tel").html("121212121");//
  		 
  		 String newHtml=doc.toString();
  		
  		System.out.println(newHtml);
	}
}

 文章推荐

0
0
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics