
任务日志
时空霹雳
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
2014-6-24任务完成情况
对Trie树求多个字符串的编辑距离算法做了空间优化原创 2014-06-24 17:21:58 · 485 阅读 · 0 评论 -
2014-6-11任务完成情况
(1)实现传值版与传引用版的递归函数,观察递归深度; (2)将find函数改造为python版; (3)c++ primer阅读一章原创 2014-06-11 17:21:37 · 481 阅读 · 0 评论 -
2014-5-30任务完成情况
(1)实现qsort; 万 (2)不断从细节上优化qsort; (3)对比qsort与堆排序的时间差,并分析原因; 相同的数据规模,快速排序比堆排序的效率高很多,并且随着数据规模的扩大,二者的差距不断扩大,快速排序的优势越来越明显。快速排序的时间复杂度近似线性增长,堆排序则要大很多。究其原因,应该有以下几个方面: 在堆排序原创 2014-05-30 17:54:42 · 703 阅读 · 0 评论 -
2014-5-29任务完成情况
(1)硬盘安装linux系统; 完成。 (2)生成core文件; 完成,并整理文档 (3)初步学会gdb调试core; 完成,还不太熟练。可以根据core文件找到错误位置。 (4)将整理法建堆改成c++版,并用千万级的数据测试时间; 完成,发现一个问题,1000w的数据量在分配内存时就会core dump,后来发现100原创 2014-05-29 20:19:37 · 655 阅读 · 0 评论 -
2014-5-31任务完成情况
1.针对极端数据,对快速排序的性能进行测试原创 2014-06-01 13:43:36 · 575 阅读 · 0 评论 -
2014-6-13任务完成情况
1.优化词典查询的算法 使用Trie树重新写了算法,时间小原创 2014-06-13 19:43:02 · 467 阅读 · 0 评论 -
2014-6-16任务完成情况
(1)改造为二叉树; (2)将10w词典拼接,查找每个词在拼接字符串中出现的次数; (3)用kmp的思想对2做改进原创 2014-06-16 10:03:58 · 480 阅读 · 0 评论 -
2014-6-17任务完成情况
暂无原创 2014-06-17 22:33:09 · 456 阅读 · 0 评论 -
2014-6-18任务完成情况
暂无原创 2014-06-18 23:53:44 · 448 阅读 · 0 评论 -
2014-6-28任务完成情况
完成了并查集的相关程序。参见:原创 2014-07-11 08:52:45 · 521 阅读 · 0 评论 -
2014-6-19任务完成情况
暂无原创 2014-06-19 23:35:45 · 520 阅读 · 0 评论 -
2014-6-20任务完成情况
暂无原创 2014-06-20 23:46:29 · 547 阅读 · 0 评论 -
2014-7-12任务完成情况
1.查阅了中文编码的相关知识,了解了中文GB原创 2014-07-14 21:28:26 · 482 阅读 · 0 评论 -
2014-7-14任务完成情况
1.对分词程序进行准确性验证,完成了准确率、召回率的计算程序。原创 2014-07-14 22:01:28 · 512 阅读 · 0 评论 -
2014-6-12任务完成情况
(1)继续搞清楚,在函数调用时,c++与python各自做了什么? (2)搞清楚为什么传值与传引用的递归深度是一致的; (3)随机生成一个词典,10w左右的词,每个词是10~30的英文字母串,实现词典查找算法,即给定任意一个字符串,去看在词典中是否存在原创 2014-06-12 09:38:28 · 484 阅读 · 0 评论 -
2014-5-28任务完成情况
(1)想办法生成core文件; (2)初步学会gdb调试core; (3)算法时间复杂度分析:为什么增量方法比整理方法建堆速度慢? 调整法建堆的时间复杂度:循环是从i = headsize/2 -> 1。于是,有1/4的元素向下执行一次调整过程,有1/8的向下执行了两次,1/16的,向下执行了3次,......,1/2^k+1的向下比较了k次,其中原创 2014-05-28 19:39:24 · 676 阅读 · 0 评论 -
2014-6-10任务完成情况
1.将最短编辑距离算法用跑一趟和原创 2014-06-10 20:55:49 · 564 阅读 · 0 评论 -
2014-6-3任务完成情况
(1)了解“两字符串最长公共子序列”的概念; 一个字符串的子序列,是指从该字符串中去掉任意多个字符后剩下的字符在不改变顺序的情况下组成的新字符串。这个子序列是可以不连续的。最长公共子序列,是指多个字符串可具有的长度最大的公共的子序列。举个例子,如:有两条随机序列,如 1 3 4 5 5 and 2 4 5 5 7 6,则它们的最长公共子序列便是:4 5 5。 注意最长公共子串原创 2014-06-03 22:43:48 · 597 阅读 · 0 评论 -
2011-7-11任务完成情况
了解了在原创 2014-07-14 21:26:00 · 511 阅读 · 0 评论 -
2014-7-15任务完成情况
正向和逆向最大匹配分词接下来的问题: (1)准确率为什么低于召回率; (2)逆向为什么高于正向; (3)错误分词的主要问题什么?主流的解决办法是什么? 以上问题答案参见:原创 2014-07-15 22:54:48 · 752 阅读 · 0 评论 -
2014-6-23任务完成情况
(1)建立10万次的词典,单词长度5-30原创 2014-06-23 09:55:31 · 550 阅读 · 0 评论 -
2014-6-4任务完成情况
(1)理解最优子结构的概念,并能反面举例“哪些case不具备最优子结构”; (2)理解子问题的重叠性,并能说明“动态规划是如何避免重复子问题的重复计算”; (3)从理论上证明“动态规划”算法的正确性; (4)将空间复杂度优化至O(n); (5)程序的写作水平,要达到随时可以作为库函数,供他人使用原创 2014-06-04 21:55:18 · 461 阅读 · 0 评论 -
2014-7-16任务完成情况
1.抽样300个错误case进行分析,并对错误归类;原创 2014-07-16 21:07:36 · 505 阅读 · 0 评论 -
2014-6-5任务完成情况
1.理解最小编辑距离的概念;原创 2014-06-05 18:37:32 · 459 阅读 · 0 评论 -
2014-7-18任务完成情况
1.最大概率法使分词结果中的交集型歧义数量降低,对组合型歧义和未登录词有什么影响?会不会使这些错误增多? 2.最大概率法中求每个词语的费用时,如果对词频都乘以一个惩罚系数,观察这个系数对整体准确率和召回率的影响,并分析原因。 3.对于未登录词,调研主流的解决方法,并确定一种可行的方法进行实践。原创 2014-07-19 01:01:22 · 837 阅读 · 0 评论 -
2014-6-25任务完成情况
(1)继续阅读C++ Primer。原创 2014-06-27 22:22:06 · 458 阅读 · 0 评论 -
2014-6-26任务完成情况
(1)用另一种方法完成原创 2014-06-27 22:24:36 · 527 阅读 · 0 评论 -
2014-6-6任务完成情况
(1)实现字符串的find函数; (2)研究动态规划的证明方法(可以前面几天的问题做实例); (3)c++ primer,继续向前读原创 2014-06-06 20:21:52 · 490 阅读 · 0 评论 -
2014-6-27任务完成情况
(1)继续完成昨天的撤原创 2014-06-27 22:26:47 · 474 阅读 · 0 评论 -
2014-6-9任务完成情况
(1)继续读C++ Primer (2)将求字符串的最小原创 2014-06-09 17:26:09 · 570 阅读 · 0 评论 -
2014-7-13任务完成情况
1.设置linux系统编码,使之支持中文。原创 2014-07-14 21:55:40 · 483 阅读 · 0 评论