- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 中文地址 识别 切分
c#版的 由于中文地址比较有规律 所以主要用到正则,先分割 再识别,识别率要高不少 中文地址容器: public struct ChineseAddress { public string source; public string nation; public string province; publ
2009-04-21 11:18:00
5724
6
原创 强烈推荐:C#/VB.NET 下最好的RAS拨号程序
以前控制ADSL拨号我一直用的是RasDisplay,也是一个老外写的封装Ras拨号类,它的优点是不需要输入任何参数,可以直接从系统中调出默认的拨号连接。 不过最近我的程序在运行了2天后,提示图形缓存写入失败,崩了。很奇怪的是,我没有用任何图像相关的函数……在网上搜了一大圈,发现MSDN有个专门讨论的帖子,认为这是一个隐藏的.net bug,原因可能是因为GDI对象数太多引起的。于是开了T
2009-04-15 12:20:00
2123
原创 什么是相似的两个中文字符串?
知识:字符串相似的几个算法:http://blog.youkuaiyun.com/dongle2001/archive/2007/01/02/1472235.aspx1 编辑距离(Levenshtein Distance)2 最长公共子串 (LCS)3 余弦定理 (向量空间算法) 对中文来说是否需要首先切词呢?
2009-02-25 13:02:00
561
原创 中文地址 解析 正则表达式 回溯版 v1.0
可以用来匹配80%以上的中文地址 (?[/u4e00-/u9fa5]+?(?:省|特别行政区|特区))?(?[/u4e00-/u9fa5]+?(?:市|自治州|地区|盟))?(? (?近郊)| (?[^区乡][/u4e00-/u9fa5]+?县)| (?[^区][/u4e00-/u9fa5]+?乡)| (?[/u4e00-/u9fa5]+?区
2009-02-18 14:33:00
2302
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人