
database
迷路神码
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
互联网数据ETL-实用攻略
提取1.数据获取方式:post和get2.登陆,获取访问权限3.解析get方式的链接地址的内容,从网页中找到链接地址参数,并确定参数的定义域和含义功能4.获取网页数据,简单处理5.根据所要捕获内容进行方法选取:正则表达式截取指定格式部分;变量解析;6.存储捕获数据,按照设计好的数据结构存储到缓存数据库或文件中。转换1.格式标准化,比如时间,姓名,年龄,邮箱,原创 2012-09-19 09:51:29 · 321 阅读 · 0 评论 -
浅谈正则表达式在.net的运用-C#程序抓取网页信息
引:在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex原创 2012-09-05 15:20:21 · 473 阅读 · 0 评论