
自然语言处理
孤独单行
这个作者很懒,什么都没留下…
展开
-
LBFGS 简单笔记
sample()lbfgs.c(){lm;计算原函数和梯度fx ,g;d = - g;计算xnorm,gnorm;判定gnorm/xnorm 是否满足条件;计算step = 1/sqrt(d^d) ;k = 1,end = 0;进入for循环{xp = x;gp =g;进入line_search函数;{dginit = gs = gd原创 2013-07-29 16:31:47 · 1771 阅读 · 0 评论 -
CRF学习
刚才写了半天的文章,因为不小心点了舍弃,一切都要重来。怪自己不小心,不过这优快云的自动保存功能做的有点弱。迅速进入正题。这些天在研究CRF的东西,由于之前对机器学习的方面接触比较少,看CRF比较费力,现在把看到的一些想法分享出来,理解不到位的地方希望大牛过来指点指点。一、CRF的概念和原理参考《条件随机场理论综述》(韩冬雪、周彩根),这篇文章里面对CRF的基本理论都做了介绍,主要包括原创 2013-09-01 16:02:21 · 19085 阅读 · 0 评论 -
C++中实现对map按照value值进行排序
map的两个值分别为key值和value值,map是按照key值进行排序的,但有时候需要按照value值进行排序,并且按照value的顺序输出key值,排序代码如下:typedef pair PAIR; int cmp(const PAIR& x, const PAIR& y) { return x.second > y.second; } map m;转载 2013-09-04 16:09:37 · 3318 阅读 · 0 评论 -
C++ Map 统计文件中的词频
#include #include #include #include #include using namespace std; void display_map(map &wmap); int main(){ using namespace std; string filename; cout << "Enter the file n原创 2013-09-04 16:12:51 · 4122 阅读 · 0 评论 -
字符编码笔记:ASCII,Unicode和UTF-8
来源:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html作者: 阮一峰日期: 2007年10月28日今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。下面就是我转载 2013-12-03 11:08:56 · 849 阅读 · 0 评论 -
c++ string 转化为wstring
string 转 wstringstd::wstring s2ws(const std::string &s){ std::string curLocale = setlocale(LC_ALL,""); const char * _Source = s.c_str(); size_t _Dsize = mbstowcs(NULL,_Source,0) + 1; wchar_t *_转载 2013-12-04 10:00:04 · 1774 阅读 · 0 评论 -
Python字符编码详解
1. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号。不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础。1.2. MB转载 2014-04-09 15:13:08 · 574 阅读 · 0 评论 -
python xlrd 使用
1.获取单元格颜色来自 stackoverflowimport xlrdbook = xlrd.open_workbook("sample.xls", formatting_info=True)sheets = book.sheet_names()print "sheets are:", sheetsfor index, sh in enumerate(sheets):原创 2015-02-04 16:43:12 · 4484 阅读 · 0 评论