`
jilong-liang
  • 浏览: 472096 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
文章列表
package com.lm.org; import java.io.IOException; import java.io.PrintWriter; import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet; import java.sql.SQLException; import javax.servlet.ServletContext; import javax.servlet.Se ...
Clean Bootstrap Dashboard Theme   DevOOPS – A Modern Bootstrap Dashboard Theme   Metis – A Bootstr  ap Admin Template
需要做一个垂直搜索引擎,比较了nekohtml和htmlparser 的功能,尽管nekohtml在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是nekohtml),但感觉 nekohtml的测试用例和文档都比htmlparser都少,而且htmlparser基本上能够满足垂直搜索引擎页面处理分析的需求,因此先研究一 下htmlparser的使用,有空再研究nekohtml和mozilla html parser的使用。     html的功能还是官方说得最为清楚,     HTML Parser is a Java library used to pars ...
网页解析,即程序自动分析网页内容、获取信息,从而进一步处理信息。 网页解析是实现网络爬虫中不可缺少而且十分重要的一环,由于本人经验也很有限,我仅就我们团队开发基于关键词匹配和模板匹配的主题爬虫的经验谈谈如何实现网页解析。 首先,必须说在最前的是我们使用的工具——htmlparser 简要地说,htmlparser包提供方便、简洁的处理html文件的方法,它将html页面中的标签按树形结构解析成一个一个结点,一种类型的结点对应一个类,通过调用其方法可以轻松地访问标签中的内容。 我所使用的是htmlparser2.0,也就是最新版本。强烈推荐。 好,进入正题。 对于主题爬虫,它的功能就 ...
HTMLParser使用 HTMLParser具有小巧,快速的优点,缺点是相关文档比较少(英文的也少),很多功能需要自己摸索。对于初学者还是要费一些功夫的,而一旦上手以后,会发现HTMLParser的结构设计很巧妙,非常实用,基本你的各种需求都可以满足。 这里我根据自己这几个月来的经验,写了一点入门的东西,希望能对新学习HTMLParser的朋友们有所帮助。(不过当年高考本人语文只比及格高一分,所以文法方面的问题还希望大家多多担待) HTMLParser的核心模块是org.htmlparser.Parser类,这个类实际完成了对于HTML页面的分析工作。这个 ...
【谷歌翻译,参考可以看官方原文】  jsoup:Java的HTML解析器    jsoup是与现实世界的HTML工作的Java库。它提供了用于提取和操作数据,使用最好的DOM,  CSS和jquery的方法很像,而且的API很方便。       jsoup实现了WHATWG的HTML5规范,并解析HTML到同一个DOM现代浏览器做。     刮从一个URL,文件或字符串解析HTML   发现并提取数据,使用DOM遍历或CSS选择器 操纵HTML元素,属性和文本   对一个安全白名单干净的用户提交的内容,以防止XSS攻击  输出HTML整洁   jsoup是专门用来对付HT ...
package ivyy.taobao.com.dom4j; import ivyy.taobao.com.entity.Address; import ivyy.taobao.com.entity.Location; import ivyy.taobao.com.entity.Point; import ivyy.taobao.com.entity.Pois; import ivyy.taobao.com.utils.IoUtils; import ivyy.taobao.com.utils.UrlUtils; import ivyy.taobao.com.utils.Dom ...
http://www.cnblogs.com/xiang/archive/2009/04/05/310018.html   <script language="JavaScript"><!--var doc = new ActiveXObject("Msxml2.DOMDocument"); //ie5.5+,CreateObject("Microsoft.XMLDOM") //加载文档//doc.load("b.xml");/
Microsoft Office Word 中的域用作文档中可能会改变的数据的占位符,并用于在邮件合并文档中创建套用信函和标签。这些种类的域也称为域代码,它们不同于那些用于输入信息的域类型,如在表单上。有关向文档中添加表单域的信息,请参阅创建打印表单、创建用户在 Word 中填写的表单或在 Word 中制作核对清单 使用特定命令时(如插入页码时、插入封面等文档构建基块时或创建目录时),Word 会自动插入域。还可以手动插入域,以自动处理文档外观,如合并某个数据源的数据或执行计算。 在 Microsoft Office Word 2007 中,很少需要手动插入域,因为内置命令和内容控 ...
首先看看2个简单的fastjson的使用 例子一 package ivyy.taobao.com.domain.json; import java.util.Iterator; import com.alibaba.fastjson.JSONArray; import com.alibaba.fastjson.JSONObject; /** * @Author:jilongliang * @Date:2014-12-19 * @Version:1.0 * @Description: */ public class JsonTest1 { ...
  [java] view plaincopy  
//验证身份证函数 function checkIdcard(idcard){ idcard = idcard.toString(); //var Errors=new Array("验证通过!","身份证号码位数不对!","身份证号码出生日期超出范围或含有非法字符!","身份证号码校验错误!","身份证地区非法!"); var Errors=new Array(true,false,false,false,false); var area={11:"北京" ...
package com.test; import java.io.File; import java.io.FileWriter; import java.net.URL; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; /** *@Author:liangjilong *@Date:2014-8-27 *@Email:jilongliang@sina.co ...
/******************************************************************************* * Copyright (c) 2008, 2010 IBM Corporation and others. * All rights reserved. This program and the accompanying materials * are made available under the terms of the Eclipse Public License v1.0 * which accompani ...
package com.org; import javax.annotation.PostConstruct; import javax.annotation.Resource; import org.springframework.jdbc.core.JdbcTemplate; import org.springframework.jdbc.core.support.JdbcDaoSupport; /** * @author liangjilong */ public class JdbcTempBaseDao extends JdbcDaoSuppor ...
Global site tag (gtag.js) - Google Analytics