
MSN機器人MSNRobot
python二级题库
https://python22.blog.youkuaiyun.com/
展开
-
SharpICTCLAS分词系统简介(3)DynamicArray
从前文可以看出,ICTCLAS中DynamicArray类在初步分词过程中起到了至关重要的所用,而ICTCLAS中DynamicArray类的实现比较复杂,可以说是包罗万象,在一个GetElement方法就综合考虑了1)row优先排序的链表;2)col优先排序的链表;3)当nRow为-1时的行为;4)当nCol为-1时的行为;5)当nRow与nCol都不为-1时的行为 (可以参考本人的《天书般的I原创 2010-02-06 08:48:00 · 441 阅读 · 0 评论 -
MSNPSharp 代碼4
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Net;using Winista.Text.HtmlParser;using Winista.Text.HtmlParser.Util;using Winista.Text.HtmlParser.Http;u原创 2010-02-12 15:13:00 · 829 阅读 · 0 评论 -
用.NET开发MSN聊天机器人
用.NET开发MSN聊天机器人 - MSN聊天机器人开发揭秘。 写在前面: 我不是开发人员,不是高手,就是自己比较爱玩。在技术上,没有什么喜欢摸索的精神,而是喜欢投机取巧。在这篇文章里,你也不能"少劳而获"地通过我的机器人修改出一个自己的机器人,因为自己觉得程序写的比较臭,所以不会open source。但是,如果你对.net或者C#有点了解的话,相信从这篇文章里,你可以找到一切所需的原创 2010-02-10 11:29:00 · 693 阅读 · 0 评论 -
htmlparser入门讲解
一,数据组织分析: HtmlParser主要靠Node、AbstractNode和Tag来表达Html,因为Remark和Text相对简单,此处就将其忽略了。 Node是形成树结构表示HTML的基础,所有的数据表示都是接口Node的实现,Node定义了与页面树结构所表达的页面Page对象,定义了获取父、子、兄弟节点的方法,定义了节点到对应html文本的方法,定义了该节点对应的起止位置,定义了过滤原创 2010-02-11 11:37:00 · 753 阅读 · 0 评论 -
在.net中运用HTMLParser解析网页的原理和方法
在.net中运用HTMLParser解析网页的原理和方法 本文介绍了.net 版的一个HTMLParser网页解析开源类库(Winista.HTMLParser)的功能特性、工作原理和使用方法。对于使用.net进行Web信息提取的开发人员进行了一次HTMLParser的初步讲解。应用实例将会在日后的文中介绍,敬请关注。 一、背景知识 HTMLParser原本是一个在sourcefo原创 2010-02-11 20:46:00 · 8485 阅读 · 0 评论 -
MSNPSharp 代碼9
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Net;using Winista.Text.HtmlParser;using Winista.Text.HtmlParser.Util;using Winista.Text.Htm原创 2010-02-17 16:53:00 · 667 阅读 · 1 评论 -
MSNPSharp 代碼11
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Net;using Winista.Text.HtmlParser;using Winista.Text.HtmlParser.Util;using Winista.Text.Htm原创 2010-02-17 16:57:00 · 675 阅读 · 0 评论 -
MSNPSharp 代码5
using System;using System.Collections.Generic;using System.Text;using System.Net;using Winista.Text.HtmlParser;using Winista.Text.HtmlParser.Util;using Winista.Text.HtmlParser.Http;using原创 2010-02-14 17:47:00 · 573 阅读 · 0 评论 -
MSNPSharp 代碼6
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Net;using Winista.Text.HtmlParser;using Winista.Text.HtmlParser.Util;using Winista.Text.Htm原创 2010-02-15 11:35:00 · 587 阅读 · 0 评论 -
MSNPSharp 代碼8
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Net;using Winista.Text.HtmlParser;using Winista.Text.HtmlParser.Util;using Winista.Text.HtmlParser.Http;u原创 2010-02-17 16:50:00 · 628 阅读 · 0 评论 -
MSNPSharp 代碼10
using System;using System.Collections.Generic;using System.Text;using System.Net;using Microsoft.VisualBasic;namespace MSNPSharpClient.IDSearch{ class GetIDUrlAndHtmlCode {原创 2010-02-17 16:56:00 · 614 阅读 · 0 评论 -
MSNPSharp 代碼7
using System;using System.Collections.Generic;using System.Text;using System.Net;using System.IO;using Newtonsoft.Json;namespace GoogleTranslate{ class GoogleTranslate {原创 2010-02-15 11:35:00 · 615 阅读 · 0 评论 -
msn機器人已經可以基本實現以下的幾個功能
經過幾天的努力,msn機器人已經可以基本實現以下的幾個功能,想測試的朋友請先聯繫我的msn:zhuzhao1010@hotmail.com。謝謝!1、查詢:百度+空格+你所要查詢的內容,谷歌+空格+你所要查詢的內容,或b+空格+你所要查詢的內容,g+空格+你所要查詢的內容;2、查詢百度中文搜索风云榜,請輸入:“百度中文搜索风云榜” 或 “百度风云榜” 或“baidu top” 或“bt”3、查原创 2010-02-15 11:40:00 · 597 阅读 · 0 评论 -
可以查詢百度的MSN機器人已經基本上做好了
這幾天沒事,做了一個可以查詢百度的msn機器人,功能雖不完善,但也可以用了,msn機器人帳號:zhuzhao1010@163.com。想測試的朋友請先加:zhuzhao1010@hotmail.com,告訴我,我要先啟動。另外問個問題,msn機器人訪問的人多於2個,就很卡,什麽原因?是要用多線程嗎?謝謝!原创 2009-12-24 17:24:00 · 681 阅读 · 1 评论 -
中文分词和TF-IDF
中文分词(Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。 TF-IDF(term frequency–inverse document frequency)是一种用于信息搜索和信息挖掘的常用加权技术。在搜索、文献分类和其他相关领域有广泛的应用。原创 2010-02-10 14:30:00 · 863 阅读 · 0 评论 -
中文分词技术总结
中文分词技术总结 一、什么是中文分词 众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子“I am a student”,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道“student”是一个单词,但是不能很容易明白「学」、「生」两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,原创 2010-02-08 12:45:00 · 1910 阅读 · 0 评论 -
两个聊天机器人的情话
“机器会思考么?” 1950年,数学家Alan Turing思考着这个问题,他用了一个小游戏来解答:让人通过电报机分别与另一个人和一个电脑交谈;如果他分辨不出哪一个是电脑,那么以Turing的标准,认为这个电脑就会思考。如今,由于人工智能的发明,Turing的这个游戏开始在网络上流行起来。一流聊天机器人ALICE(女)和顶级网络机器人Jabberwacky(男)都没有长时记忆体,他们只对前一句话做原创 2010-02-08 11:21:00 · 1168 阅读 · 0 评论 -
SharpICTCLAS分词系统简介(5)NShortPath-2
在了解了1-最短路径的计算方式后,我们看看N-最短路径的计算。 N-最短路径的计算方式与1-最短路径基本相同,只是在记录所有可达路径时,要保留最短的前N个结果。让我们仍然以上篇文章的案例来看看如何实现N-最短路径的运算。 1、数据表示 这里我们仍然沿用前文例子,对下图求N-最短路径,每条边的权重已经在图中标注出来了。 (图一) 2、运算过程 仍然象1-最短路径一样,计算出每个结点上原创 2010-02-06 08:49:00 · 481 阅读 · 0 评论 -
开源的第三方MSN客户端项目介绍
MSNPSharp is a .net library that implements the MSN protocol. Its the continuation of project DotMSN started in 2002. Today, we have more than 10,000,000 users around the world using services develop原创 2010-02-05 22:55:00 · 2137 阅读 · 0 评论 -
SharpICTCLAS分词系统简介(4)NShortPath-1
N-最短路径中文词语粗分是分词过程中非常重要的一步,而原有ICTCLAS中该部分代码也是我认为最难读懂的部分,到现在还有一些方法没有弄明白,因此我几乎重写了NShortPath类。要想说明N-最短路径代码是如何工作的并不容易,所以分成两步分,本部分先说说SharpICTCLAS中1-最短路径是如何实现的,在下一篇文章中再引申到N-最短路径。 1、数据表示 这里我们求最短路的例子使用如下的有向图原创 2010-02-06 08:48:00 · 559 阅读 · 0 评论 -
SharpICTCLAS分词系统简介(7)OptimumSegment
上一篇文章说到经过NShortPath计算后,我们得到了数个候选分词方案,那么这么多个候选分词方案是如何最终成为一个分词结果的呢?其实这个过程是靠OptimumSegment完成的。SharpICTCLAS与ICTCLAS的OptimumSegment过程基本一样没有太大的变化。 1、OptimumSegment的运算过程 经过NShortPath处理后的多个结果首先会经过日期合并策略的处理,原创 2010-02-06 08:50:00 · 772 阅读 · 0 评论 -
SharpICTCLAS分词系统简介(8)其它
前文对SharpICTCLAS中的一些主要内容做了介绍,本文介绍一下SharpICTCLAS中一些其它考虑,包括事件机制以及如何使用SharpICTCLAS。 1、SharpICTCLAS中的事件 分词过程比较复杂,所以很可能有人希望能够追踪分词的过程,设置代码断点比较麻烦,因此SharpICTCLAS中提供了事件机制,可以在分词的不同阶段触发相关事件,使用者可以订阅这些事件并输出中间结果供查原创 2010-02-06 08:51:00 · 1475 阅读 · 0 评论 -
开源的网页抓取项目HTML Parser 介绍
HTML Parser is a Java library used to parse HTML in either a linear or nested fashion. Primarily used for transformation or extraction, it features filters, visitors, custom tags and easy to use JavaB原创 2010-02-05 22:58:00 · 1491 阅读 · 1 评论 -
SharpICTCLAS分词系统简介(6
DynamicArray与NShortPath是ICTCLAS中的基础类,本人在完成了基础改造工作后,就着手开始对Segment分词进行移植与改造。SharpICTCLAS中的改造主要体现在以下几方面: 1)合并不同类中的部分代码 原有ICTCLAS中使用了SegGraph与Segment两个类完成分词过程,SegGraph类负责完成原子分词与segGraph的生成,而Segment类负责Bi原创 2010-02-06 08:50:00 · 813 阅读 · 0 评论 -
SharpICTCLAS分词系统简介(9)词库扩充
1、SharpICTCLAS中词库的扩充 如果对SharpICTCLAS目前词库不满意的化,可以考虑扩充现有词库。扩充方法非常简单,代码如下: Copy Code 词库扩充 static void Main(string[] args) { string DictPath = Path.Combine(Environment.CurrentDirectory, "Data"原创 2010-02-06 08:52:00 · 816 阅读 · 0 评论 -
MSNPSharp 代码1
void Conversation_ContactJoined(object sender, ContactEventArgs e) { //The request is initiated by remote user, so we neednt invite anyone. this.Invoke(new CreateCo原创 2010-02-08 21:29:00 · 540 阅读 · 0 评论 -
監控收到消息 ,發送消息
/// /// 監控收到消息 ,發送消息 /// /// /// private void Switchboard_TextMessageReceived(object sender, TextMessageEventArgs e) { if (!Visible) { Invoke(new EventHan原创 2010-02-10 10:05:00 · 779 阅读 · 0 评论 -
中文分词
中文分词 中文分词(Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。 中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。 现有的分词算法可分为原创 2010-02-10 11:45:00 · 1913 阅读 · 0 评论 -
MSNPSharp 代碼2
/// /// sendMessageToolStripMenuItem Click /// /// /// private void sendMessageToolStripMenuItem_Click(object sender, EventArgs e) { Contact contact = treeViewFavori原创 2010-02-09 14:55:00 · 535 阅读 · 0 评论 -
MSNPSharp 代碼3
#region Copyright (c) 2002-2009, Bas Geertsema, Xih Solutions (http://www.xihsolutions.net), Thiago.Sayao, Pang Wu, Ethem Evlice/*Copyright (c) 2002-2009, Bas Geertsema, Xih Solutions(http://www.xihso原创 2010-02-11 11:19:00 · 1045 阅读 · 0 评论 -
MSN機器人MSNRobot1.0.0
MSN機器人MSNRobot1.0.0主要實現功能:可以通過百度和穀歌查詢,目前只能查詢第一頁,由於百度和穀歌的廣告原因,對查詢結果的抓取很困難,經常把廣告也抓取到了,這是一個要解決的問題。1.0.0版本有了幫組功能,對查詢輸入要求格式輸入正確。1.0.1版本將繼續對查詢功能進行優化。原创 2009-12-31 14:59:00 · 525 阅读 · 0 评论