
Python
flytiger_ouc
我要加油!加油!
展开
-
Python:字符编码详解
原文地址:http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html。1. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字转载 2013-10-27 13:15:13 · 616 阅读 · 0 评论 -
Python:python小手册地址
http://www.pythonclub.org/python-basic/start。转载 2013-11-04 18:11:12 · 481 阅读 · 0 评论 -
Python:中文处理攻略
原文地址:http://www.sqlite.com.cn/MySqlite/11/395.Html。1. 在Python中使用中文在Python中有两种默认的字符串:str和unicode。在Python中一定要注意区分“Unicode字符串”和“unicode对象”的区别。后面所有的“unicode字符串”指的都是python里的“unicode对象”。事实上在P转载 2013-10-27 12:08:17 · 640 阅读 · 0 评论 -
Python:实现简单的中文分词
原文地址:http://www.freedodo.com/2011/03/28/%E7%94%A8python%E7%AE%80%E5%8D%95%E5%AE%9E%E7%8E%B0%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D.html。最近想在google app engine上实现站内的全文检索。于是想写一个纯python实现的中文分词程序。目标转载 2013-10-26 22:22:58 · 1175 阅读 · 0 评论 -
Python:中文处理小结
文章地址,http://bbs.chinaunix.net/thread-1431029-1-1.html。唉,复制都是乱码。。。转载 2013-10-25 16:29:08 · 780 阅读 · 0 评论 -
Python:利用pymmseq-cpp实现分词
在python这pymmseg-cpp 还是十分方便的! 环境 ubuntu10.04 , python2.65 步骤:1 下载mmseg-cpp的源代码 http://code.google.com/p/pymmseg-cpp/2 tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录转载 2013-10-26 14:06:59 · 702 阅读 · 0 评论 -
Python:文件读写及中文编码处理
原文地址:http://hi.baidu.com/mdj_hu/item/4d7d0803d38e62e1fe240de4。python中读写文件及中文编码处理方法一、打开文件代码如下:>>> f = open("d:\test.txt", "w")说明:第一个参数是文件名称,包括路径;第二个参数是打开的模式mode'r':只读(缺省。如果文件不存在,则抛出错误)'w'转载 2013-10-26 10:59:57 · 1348 阅读 · 0 评论 -
Python:re中的group方法简介
原文地址:http://www.cnblogs.com/kaituorensheng/archive/2012/08/20/2648209.html。正则表达式中,group()用来提出分组截获的字符串,()用来分组import rea = "123abc456"print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0) #12转载 2014-02-22 20:18:27 · 7767 阅读 · 0 评论 -
Python:Python正则表达式指南
文章地址:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html。转载 2014-02-22 20:27:44 · 563 阅读 · 0 评论