
群发/采集技术
文章平均质量分 53
zfrong
98年接触计算机,多年Windows软件Web开发经验。知识面广,善于发现问题、分析问题、解决问题。方向:IT项目(策划管理投资).大信息量处理(搜索检索信息抽取挖掘人工智能).
上海MSN:zfrong2000##hotmail.com
展开
-
使用HttpWebRequest的POST取得网页内容(异步操作)2篇集合
上次说了,如何通过post来取得网页内容。可是有一个问题出现了。当时用的方法是同步操作,如果我其中的一个IP或是在进行转化的过程中,出现了问题,哪么这个程序就会停下来,当然了,有的朋友可能会说,用try...catch也可以啊。因为我是循环取值,所以在catch里加一个continue就行了。可是以前没有搞过异步操作,所以想用这个机会搞一下。就看了一下。这一看不要紧,搞得我一头雾水。上网上转载 2009-01-09 20:25:00 · 8685 阅读 · 0 评论 -
proquest的采集程序demo测试截图
<br />proquest的采集程序demo测试截图<br /> <br />程序C#.net开发,程序使用了 Castle Activerecord, Nhibernate ,Spring.net, Memcached分布式数据排重,<br />自动分页,错误自动重试,超时处理等自能纠错技术,,<br />配置 部分 <br /> <br /> </configSections><br /><br /> <appSettings><br /> <add key="startId" va原创 2011-02-14 23:16:00 · 1424 阅读 · 0 评论 -
sinablog新浪博客API错误代码说明曝光!
sinablog新浪博客AP错误代码说明曝光!{B01001:"标题必须是48个中文或96个字符以内,请重新输入。",B02001:"请输入内容。",B02002:"内容超出博文容量限制,请重新编辑!博文内容最多允许100000个字符。",B02003:"是否要清除格式?粘帖的内容中含有冗余的格式,会影响在博客中的排版。",B02004:"上次撰写的博文未进行保存,要恢复内容继续编辑吗?",B02005:'您提交的内容中含有广告等不适当内容,"确认"后将被清除!',B03001:"标签总字数必须是30个中文原创 2011-01-17 18:37:00 · 5937 阅读 · 2 评论 -
贴下百度博客自动加好友的简单代码示例!!(c#.net实现)
贴下百度博客自动加好友的简单代码示例!!(c#.net实现)public static void BAIDU_F() { string c; string cookies = "BAIDUID=6AF8F4D56DFE7B89DF3A49890E46A6D2:FG=1; BDSTAT=zfrong2000"; Match原创 2010-01-05 16:21:00 · 2101 阅读 · 0 评论 -
自己原创的开心网外挂工具2.0,玩玩呵呵!!!(.net开发)
自己原创的开心网外挂工具2.0,玩玩呵呵!!!比我的开心网外挂1.0强大很多,增加了很多实用功能,.net开发。自动识别验证码,自动加好友,自动访问陌生人,自动按条件加群,群发短消息,自动同意好友请求等等。呵呵,不说啦贴图。。看图原创 2009-10-23 15:33:00 · 1502 阅读 · 1 评论 -
从HTML文件中抽取正文的简单方案 试验结果
懒人就直接看结果吧:笔者的实验则到此为止,并放弃了神经网络这个解决方案——直接采用这些特征值进行阈值判断,并对一些特殊部分设定过滤规则,这似乎比神经网络的表现来的简单、有效…… 假如仍然坚持神经网络的解决方案,或许,采用: 文本长度,文本长度链接数,上一行的结果 做特征值, 采用三个弱分类器的ada-boost组合分类或许会是一个好的选择。 除此之外,实际上对正文的定义对结果也是有很大转载 2009-09-11 16:07:00 · 983 阅读 · 1 评论 -
HttpClient+Jericho HTML Parser 实现网页的抓取
Jericho HTML Parser是一个简单而功能强大的Java HTML解析器库,可以分析和处理HTML文档的一部分,包括一些通用的服务器端标签,同时也可以重新生成无法识别的或无效的HTML。它也提供了一个有用的HTML表单分析器。 下载地址:http://sourceforge.net/project/showfiles.php?group_id=1010原创 2009-08-23 11:29:00 · 1631 阅读 · 0 评论 -
给客户美特斯邦威做的百度新闻百度博客百度论坛采集与监测报表程序(C#.NET)(新)
给客户美特斯邦威做的百度新闻百度博客百度论坛信息采集与监测报表程序(C#.NET)(新)原创 2009-05-02 12:13:00 · 1852 阅读 · 1 评论 -
为客户万科做的sofun搜房网论坛专用发帖群发机(C#.NET)
为客户万科做的sofun搜房网论坛专用发帖群发机(C#.NET)原创 2009-04-11 15:19:00 · 6023 阅读 · 15 评论 -
给客户美特斯邦威做的简单百度新闻资讯采集程序(C#.NET)
给客户美特斯邦威做的简单百度新闻资讯采集程序原创 2009-04-11 15:29:00 · 5555 阅读 · 4 评论 -
为客户万科做的sofun搜房网论坛专用顶帖群发机(C#.NET)
为客户万科做的sofun搜房网论坛专用顶帖群发机(C#.NET)原创 2009-04-11 14:58:00 · 4145 阅读 · 1 评论 -
c#实现的自动采集代理服务器和IP自动切换程序(C#.NET)
c#实现的自动采集代理服务器和IP自动切换程序(C#.NET)原创 2009-04-11 14:45:00 · 9114 阅读 · 11 评论 -
memcached完全剖析详解
原贴:http://tech.idv2.com/2008/07/31/memcached-005/memcached完全剖析–1. memcached的基础版权声明:可以任意转载,但转载时必须标明原作者charlee、原始链接http://tech.idv2.com/2008/07/10/memcached-001/以及本声明。翻译一篇技术评论社的文章,转载 2009-03-19 13:39:00 · 6970 阅读 · 0 评论 -
解决多线程代码中的11个常见问题[详细/经典]
解决多线程代码中的11个常见问题[详细/经典] 并发现象无处不在。服务器端程序长久以来都必须负责处理基本并发编程模型,而随着多核处理器的日益普及,客户端程序也将需要执行一些任务。随着并发操作的不断增加,有关确保安全的问题也浮现出来。也就是说,在面对大量逻辑并发操作和不断变化的物理硬件并行性程度时,程序必须继续保持同样级别的稳定性和可靠性。 与对应的顺序代码相比,正确设计转载 2009-03-19 14:16:00 · 1582 阅读 · 0 评论 -
在c#多线程使用IOCP(完成端口)的简单示例
在c#使用IOCP(完成端口)的简单示例上次给大家发了利用winsock原生的api来做一个同步的socket服务器的例子,大致上只是贴了一些代码,相信大家这么冰雪聪明,已经研究的差不多了。因为winsock的api使用在msdn或者google上都能很方便的查到,所以我没太多罗嗦代码的原理。但是c#进行平台调用方面是有一些经验的,单靠google和msdn及社区的力量有时候不容易得到转载 2009-03-13 15:52:00 · 2853 阅读 · 0 评论 -
去噪:用于验证码图片识别的类续(C#代码)
自从发表了用于验证码图片识别的类(C#代码)后,不断有网友下载这个类后,问如何用于一些特定的验证码。总结一下网友们的提问,很多都是不会从复杂背景中提到干净的字符图片来,这主要就是一个去噪问题,即除去图片上的背景、干扰点、干扰线等信息。这当中要用到很多图像学数学算法,首先声明,本人不是学图像学的,以下方法理论说得不对,敬请多批评指正。 1、如何设前景/背景的分界值 UnC转载 2008-12-01 14:11:00 · 2627 阅读 · 1 评论 -
很久以前开心网很火时候的群发代码
很久以前开心网很火时候的群发代码为了清理硬盘 哈哈 代码要干掉了 传网络上共享下。。。哈哈包含群发和验证码识别 自己看吧 乱的 不是好东西 呵呵 有问题就 企Q鹅 362.505.707using System;using System.Collections.Generic;using System.Text;using System.Drawing原创 2012-12-01 19:41:35 · 2118 阅读 · 0 评论