- 博客(95)
- 收藏
- 关注
原创 HtmlParser初探--使用Nodefilter和Visitor进行网页分析
最近在做html页面转化成jsf页面的工作,尝试过使用正则表达式、dom4j等方法,都没有取得很好的结果。(html-->jsf会另写一篇文章进行讨论)现在在使用htmlparser对html进行解析,对于html页面的解析htmlparser是一个功能比较强大的工具(相关下载:http://sourceforge.net/projects/htmlparser/)。以下是经常使用的对页面解...
2008-07-31 21:34:05
218
原创 使用HtmlParser解析HTML
如果要对HTML进行解析,提取HTML的数据或者修改HTML数据,HtmlParser是一个不错的选择.使用HtmlParser可以解析本地和网络上的HTML数据:Parser parser = new Parser( new Winista.Text.HtmlParser.Http.HttpProtocol(new Uri("uriString")));Parser parser = new ...
2008-07-31 21:33:37
278
原创 扩展 HTMLParser 对自定义标签的处理能力
本文阐述如何利用 HTMLParser 项目对 HTML 或者 WML 文档中出现的一些特殊的或者是自定义的标签进行处理。HTMLParser 是一个用来解析 HTML 文档的开放源码项目,它具有小巧、快速、使用简单的特点以及拥有强大的功能。对该项目还不了解的朋友可以参照 2004 年三月份我发表的文章--《从HTML中攫取你所需的信息》,这篇文章介绍如何通过 HTMLParser 来提取 H...
2008-07-31 21:32:45
180
原创 从HTML中攫取你所需的信息
本文并非想通过分析HTML的语法然后从中解析出数据,这样做实现困难而且没有什么实际应用的意义,或者应该这样说:我们并不想 自己去实现一个HTML语法的分析器。我们要做的仅仅是从HTML中提取我们所需的信息。不同于XML这种对格式要求非常严格的标志语言,HTML在推出 时并没有对其格式进行严格的定义,比如HTML中标签并不一定要成对出现,但是又要求浏览器能尽量的正确显示其所要表达出来的内容。浏览器经...
2008-07-31 21:31:59
181
原创 htmlparser使用指南
需要做一个垂直搜索引擎,比较了nekohtml和htmlparser 的功能,尽管nekohtml在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是nekohtml),但感觉 nekohtml的测试用例和文档都比htmlparser都少,而且htmlparser基本上能够满足垂直搜索引擎页面处理分析的需求,因此先研究一 下htmlparser的使用,有空再研究neko...
2008-07-31 21:31:08
217
原创 HTMLParser使用详解(4)- 通过Visitor访问内容
HTMLParser遍历了网页的内容以后,以树(森林)结构保存了结果。HTMLParser访问结果内容的方法有两种。使用Filter和使用Visitor。下面介绍使用Visitor访问内容的方法。4.1 NodeVisitor从简单方面的理解,Filter是根据某种条件过滤取出需要的Node再进行处理。Visitor则是遍历内容树的每一个节点,对于符合条件的节点进行处理。实际的结果异曲同工,两种不...
2008-07-31 21:30:28
197
原创 HTMLParser使用详解(3)- 通过Filter访问内容
HTMLParser遍历了网页的内容以后,以树(森林)结构保存了结果。HTMLParser访问结果内容的方法有两种。使用Filter和使用Visitor。(一)Filter类顾名思义,Filter就是对于结果进行过滤,取得需要的内容。HTMLParser在org.htmlparser.filters包之内一共定义了16个不同的Filter,也可以分为几类。判断类Filter:TagNameFilt...
2008-07-31 21:30:01
202
原创 HTMLParser使用详解(2)- Node内容
HTMLParser将解析过的信息保存为一个树的结构。Node是信息保存的数据类型基础。请看Node的定义:public interface Node extends Cloneable;Node中包含的方法有几类:对于树型结构进行遍历的函数,这些函数最容易理解:Node getParent ():取得父节点NodeList getChildren ():取得子节点的列表Node getFirst...
2008-07-31 21:29:11
303
原创 HTMLParser使用详解(1)- 初始化Parser
在研究搜索引擎的开发中,对于HTML网页的处理是核心的一个环节。网上有很多开源的代码,对于Java来说,HTMLParser是比较著名并且得到广泛应用的一个。HTMLParser的主页是http://htmlparser.sourceforge.net/,最后的更新是2006年9月的1.6版。不过没关系,HTML的内容已经很久没有大的变化了,HTMLParser处理起来基本没有任何问题。HTMLP...
2008-07-31 21:28:28
233
java 图象处理
方法一: (利用imageio类的读写函数) import javax.imageio.ImageIO; import java.io.File; import java.io.IOException; import java.awt.image.BufferedImage; publ...
2007-11-07 19:35:22
101
ifram的详细用法
ifram的详细用法2007-06-09 15:27IFRAM的详细用法: <IFRAME>用于设置文本或图形的浮动图文框或容器。 BORDER <IFRAME BORDER="3">IFRAME> 设定围绕图文框的边缘宽度 FRAMEBOD...
2007-10-31 10:56:25
280
详解struts2中struts.properties
Struts 2框架有两个核心配置文件: struts.xml和struts.properties 其中struts.xml文件主要负责管理应用中的Action映射,以及该Action包含的Result定义等。除此之外,Str...
2007-10-25 00:17:41
292
struts2的struts.properties配置文件详解
struts.action.extension The URL extension to use to determine if the request is meant for a Struts action 用URL扩展名来确定是否这个请求是被用作Struts action,其实也就是设置 action的后缀,例如login.do的\'do\'字...
2007-10-24 23:55:51
104
FCKeditor的使用
引:最近在做一个BLOG演示程序,用到了在线文本编辑器,以前一直用eWebEditor。后来发现FCKeditor是开源的,所以就转用这个了,这篇文章介绍了FCKeditor-2.4.3及FCKeditor.java-2.3.2的基本使用。新发现:原来优快云博客系统的在线文本编辑器用的也是FCKeditor。不过不太厚道,把人家的“关于”也去掉了. 一、FCKeditor介绍FCKedi...
2007-10-24 21:51:46
119
JDBC中处理存储过程的结果集的通用流程
oracle 对于高级特性总是与众不同(我极力讨厌这一点,如果使用它的产品就要对这种产品进行特定的编程,这也是我从不看好weblogic之类的平台的原因),大对象存取一要定用它自己的LOB对象,所幸我还能通过LONG RAW来代替.以便能使程序不需要特定的编码.但对于存储过程(我是说返回结果集的存储过程),我还没有什么方法能用一个通用的程序来处理ORACLE.太多的教材或文章在讲存储过程的...
2007-10-22 15:23:57
169
JAVA JDBC-CallableStatement调用存储过程
CallableStatement 对象为所有的 DBMS 提供了一种以标准形式调用已储存过程的方法。已储存过程储存在数据库中。对已储存过程的调用是 CallableStatement对象所含的内容。这种调用是用一种换码语法来写的,有两种形式:一种形式带结果参,另一种形式不带结果参数。结果参数是一种输出 (OUT) 参数,是已储存过程的返回值。两种形式都可带有数量可变的输入(IN 参数)、输出(O...
2007-10-22 15:01:57
147
ExtJS Creator Jack Slocum Discusses Upcoming 2.0 Release
Posted by Scott Delap on Oct 03, 2007 01:38 PM Community Java Topics Web Frameworks The ExtJS team recently released the alpha release of version 2.0. This comes roughly a month after a preview relea...
2007-10-21 22:03:23
187
临发布2.0前对ExtJS作者Jack Slocum的访谈
作者 Scott Delap译者 Frank Cheung 发布于 2007年10月11日 上午8时9分 社区 Java 主题 Web框架 在Ext下一个版本的预览文章发布近一个月之后,ExtJS团队最近发布了该框架的2.0 alpha版本 ,包含以下新功能: 可编组和摘要的表格 可滚动的Tabs 固定布局 包含列的Tree器件 Web桌面 ...
2007-10-21 22:01:25
115
extjs开发环境设置及实践
1、下载并解压缩extjs2、下载eclipse及Eclipse AJAX Toolkit Framework(ATF)本人一直习惯使用eclipse作为开发环境,各种开源的plugin使eclipse有全能的表现,运行效率也较其它IDE高。 ATF包括一个Mozilla浏览器,在eclipse中切换到"Mozilla视图"后,开发人员能进行html、dom、css的调试。但是如果要单步调试...
2007-10-21 12:44:38
167
extjs实现左侧tab
layout = new Ext.BorderLayout(document.body, ...{ center: ...{ titlebar: false, tabPosition: 'left' ...
2007-10-21 12:42:19
173
实现extjs的Dynamic Grid
我们知道,实现extjs的Grid必须先定义一个ColumnModel,指定列名称、列标题、宽度、对齐方式,然后定义一个Record和Store,指定数据源的字段名、类型,最后定义一个Grid,完整过程的代码类似如下: // the column model has information about grid columns // dataIndex maps the colu...
2007-10-21 12:40:56
112
关于ext和struts的交互
使用extjs配合struts的MVC架构是目前流行的做法,两者的整合相当简单,只需扩展Action,直接向HttpServletResponse里写xml和json格式的内容,不再需要forward到struts指定的页面。// 取查询结果xml和总记录个数 String xml = resultBuffer.getStringValue( CoreConsts.LIST_DATA_...
2007-10-21 12:37:26
220
使用Ext.UpdateManager实现页面任意部分自动刷新处理
通常我们使用html标签meta实现页面的自动刷新处理,这种方式会刷新整个html页面,但是很多情况下我们只需要更新页面中某一部分。Ext.UpdateManager为我们提供了一种随心所欲地刷新页面中任意部分的功能,并且为用户提供更好的浏览体验。 我们知道Ext.get()能够得到页面中任意一个Element的引用,只要该元素配置了一个id属性,请看下面的代码片段:<span ...
2007-10-21 12:30:01
221
EXTJS的自定义函数
EXTJS的自定义函数,以下语句可创建一个函数:Ext.Login=function(){ function IsLogin(){ . } return{ init:function(){ IsLogin(); }, Login:function(){ }}刚开始时让我比较郁闷的是...
2007-10-21 12:11:39
707
Ext.Ajax简单介绍
其实Ext.Ajax的使用并不难,只是当初我一直不清楚如何获取其返回值,搞得郁闷了一阵子,以下是一个比较简单的例子 1Ext.Ajax.request({ 2 url: 'Register.aspx', 3 params: { 4 oper: 'login', 5...
2007-10-21 12:02:38
110
ExtJS-入门
简介:记录一下ExtJS的一些简单使用的方法.备忘...开始...在ExtJS里最常用的,应该就是Ext.onReady这个方法了,而且它也可能是你学习ExtJS所接触的第一个方法,这个方法在当前的DOM加载完毕后自动调用,保证页面内的所有元素都能被Script所引用.可以尝试在这个方法中添加一条语句,看看页面打开后是什么反映:Ext.onReady(function() { ale...
2007-10-21 11:53:03
104
Struts 2 间接实现零配置
所谓间接实现零配置,是指只要做些初始化的配置之后,在以后的开发中基本上不用再对每个Action做配置 struts.xml这样配置 代码 <action name="*/*" method="{2}" class="workbench.web.actions.{1}Action"> <result name="custom">/vie
2007-10-19 11:41:23
97
A code generator for iBATIS
Abator 配置: xml version="1.0" encoding="UTF-8"?> "-//Apache Software Foundation//DTD Abator for iBATIS Configuration 1.0//EN" "http://ibatis.apache.org/dtd/abator-conf...
2007-10-13 16:26:55
153
奥迪A6带运动模糊,非常酷
奥迪A6 Webmax三维动画+汽车模型 http://www.suntoward.com/VGSShow/test2/saiche/test.htmhttp://www.suntoward.com/VGSShow/test2/danche/test.htm
2007-10-13 16:11:53
133
中国人打破了比尔盖茨2015互联网畅想
webmax最专业的娱乐应用交流平台:http://www.vrsh.cn 创业首选,最佳招商合作模式 虚拟@神话 http://www.vrsh.cn 最权威的网络三维交流平台 比尔盖茨的2015互联网畅想---网络三维时代的大趋势,但是现在却被中国人的国际优先技术打破了,国内唯一的专利技术,全新体验式的合作模式带领中国网络三维新型领域的方向,2007年底之前免收加盟费,希望有...
2007-10-13 16:09:58
172
WEBMAX功能简述
★ 关于界面 专业、高效、友好的图形编辑界面。 简便、快捷的开发流程,符合三维美工的制作习惯,非常容易上手。 ★ 关于运算能力 超乎寻常的3D图形处理能力,经过国家科技部测试,比英特尔的同类技术快将近6倍。 ★ 关于实用功能 支持模型关键帧动画、顶点动画。 支持摄像机关键帧动画。 支持动态灯光和灯光...
2007-10-13 16:08:04
388
新手入门:Javascript的使用技巧大全(三)
第几页,也可以使用访问过的URL) [虚拟] 神话 http://www.vrsh.cn 91.document.write()不换行的输出,document.writeln()换行输出 虚拟{神 话} http://www.vrsh.cn webmax 92.document.body.noWrap=true;防止链接文字折行. 虚拟@神话 http://www.vrsh.cn 最...
2007-10-13 16:06:20
113
新手入门:Javascript的使用技巧大全(二)
43.FRAME的表示方式: [window.]frames[n].ObjFuncVarName,frames["frameName"].ObjFuncVarN VRSH.CN 虚拟神话 webmax ame,frameName.ObjFuncVarName 虚拟{神 话} http://www.vrsh.cn webmax 44.parent代表父亲对象,top代表最顶端对象 [虚拟]...
2007-10-13 16:05:34
183
新手入门:Javascript的使用技巧大全(一)
1.document.write(""); 输出语句 webmax最专业的娱乐应用交流平台:http://www.vrsh.cn 2.JS中的注释为// 虚拟@神话 http://www.vrsh.cn 最权威的网络三维交流平台 3.传统的HTML文档顺序是:document->html->(head,body) 力挺国产最强的三维网页开发平台WEBMAX http://ww...
2007-10-13 16:04:54
122
WEBMAX函数 动态模糊特效【官方教程】
老师 12:00:06今天咱们看逐帧动态模糊的特效是怎么实现的这个主要涉及到两个函数,首先需要创建动态模糊VGS2.CreateFSMotionBlur(0);这里的参数0,表示动态模糊的强度数值范围是0--100然后再使用逐帧动态模糊的函数。VGS2.SetCameraKFRFSMotionBlur(”CAMERA01”, 1, 30, 50, 1);参数第一个是做动...
2007-10-13 16:03:55
268
1-50祯前景图淡入50-100祯淡出效果代码
function VGSMouseUp(LocH, LocV, type, modelUnderLoc, ID1, ID2){ } 虚拟@神话 http://www.vrsh.cn 最权威的网络三维交流平台 //前景图淡入function AutoNav_CAMERA01_Kfr_CallBackZM2In(nFrameIndex){ VGS2.SetOverlayOpac...
2007-10-13 16:03:15
151
Web3D软件WebMax正式版发布
[虚拟] 神话 http://www.vrsh.cn WebMax是公司自主研发的以VGS技术为核心的新一代网上三维虚拟现实软件开发平台。 WebMax具有独特的压缩技术、真实的画面表现、丰富的互动功能,通过WebMax开发的 VRSH.CN 虚拟神话 webmax 三维网页无需下载,只需输入网址,即可直接在互联网上浏览三维互动内容。 该产品适合大众网络环境,具有...
2007-10-13 16:02:23
1216
WEBMAX函数教程
·首届2007上海电子艺术节即将开幕·WebMax10菜鸟进阶系统培训教程·青岛如临其境科技有限公司·WEBMAX 怎样在一分钟内把所有贴图收集在texture目录里·Turntool新功能展示 [CN官方发布]·TNT二次编辑成动画得案例--动画行业杀手·WEBMAX基础电子书 【青蛙整理基础版】·webmax的剪切面和正对相机设置 图例·turntool脚本函数手册中文版 免费...
2007-10-13 16:01:27
264
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人