
点滴如风
sharpdew
这个作者很懒,什么都没留下…
展开
-
如此开源
听说哈工大和计算所有句法分析开源,满怀欣喜地想借鉴一下研究之作,却没想其层层设限,根本无从下载。大悟,原来这就是他们所谓的开源!揣想我们中文自然语言处理的举步不前,难道和这些可笑的“敝帚自珍”之举毫无关系吗?其实即算能够付诸实用的句法分析器也不过是个小的cookie而已,谈何以怕人商用而徒加屏障呢,须知商用的东西比之高校个人之作而言要有太多的讲究,真是可笑。愤怒之余,亦是无奈,只得愈加努力,希原创 2006-03-09 18:16:00 · 12792 阅读 · 46 评论 -
无论如何,还是应该感激
毕业时,凭借在一家顶级软件企业面试中积累的经验(虽经历了漫长的面试,最后惨遭淘汰,但是还是获得了不少面试的经验),顺利地进入了N公司,一家知名的网络公司的研发部门。怀着孩子般的感激,在进入公司的最初的日子,过得相当幸福,做着自己擅长和喜欢的东西,纯粹而又高效。 在很短的时间内通过试用期后,取得了稍高于预期的薪水,自然而然又增加了自己工作的动力。由于研究生阶段在专业上有了比较多的积累,并一直原创 2007-04-28 08:23:00 · 3694 阅读 · 1 评论 -
两狗(sogou & google)相争,必有一伤
sogou输入法推出不到一年,号称以词库之技领先,虽市场未有盛气凌人之势,却在网络大亨google仓促推出的输入法下,名声大噪(这样说有点夸张,不过“抄袭”事件的确在无意中让更多人知道了sogou输入法),同时也让google中国陷入难以脱困的“词库门”事件,估计自称深谙中国文化的google中国高层也没有想到自己竟然让“有意栽花花不放,无心插柳柳成阴”的中国贤文成了诅咒! 输入法绝原创 2007-04-09 23:19:00 · 3756 阅读 · 2 评论 -
工作取向
昨天在电视中听闻某IT知名人士再次强调年轻人对待工作或者事业的态度:一是要做自己喜欢的事情,二是要做自己擅长的事情。碰巧又听到理财专家的忠告:不熟不做,不懂不做。对比这两种言论,想想,其实道理如出一辙,也就是专著于自己喜欢的事情,而因为喜欢,有兴趣,所以才能擅长。回观自己的工作,我正从事的是自己在高校时选择的专业方向(据同学聚会时讨论的结论,工作后仍旧从事读研时研究方向的很少),做的是自己熟悉和热原创 2007-01-23 12:24:00 · 4014 阅读 · 0 评论 -
感悟生活之-工作
我选择了自己喜欢专业方向,也从事了自己爱好的职业,并且获得了刚踏入IT业界学生所渴求的还算不错的薪酬,可工作一年后,我却发现理想越来越遥遥无期。 几日前,和几个亦身处名企的老同学聚会,谈及工作,竟然发现大家都如此地相似。缺乏激励的开发,没有思想交流的团队,没有加薪的动力,甚至连一个渴望的郊游活动都是奢望。我不想谈加班的事情,毕竟每个人对加班的看法不一,我也不想落个愤青的名声。所谓的高原创 2006-06-26 15:06:00 · 4113 阅读 · 4 评论 -
灵感就是灵感
面对分词系统中的命名实体识别已经很难下手提高精度,中断了一段时间去做完了一个有趣的拼音输入法,在快撰写完相关专利申请文稿的时候,又有些百无聊赖了,想想下面又要回去面对那个代码似乎已经很漂亮而精度却难于提升的分词标注系统,一片空白。自然语言处理行当就是如此,总会遇上难题,很愁,又难以绕过,只能冥思苦想。好多天来,我都近乎无可奈何,这种状态会让我觉得空虚度日。昨天博士问我下面NER怎么进行,我敷衍说先原创 2006-03-08 12:52:00 · 1591 阅读 · 0 评论 -
松驰之道
前些日子下班时候,在一处拥挤难行的街道因为用力过猛,竟然把自行车链条给扯断了,最后只好拾起链条推着车回去。周末去修车,师傅说链条太短,估计是断了一截,当时我就耐闷,难道我骑车都用这么大力吗?不过链条看来明显是短了,就只好使用后齿轮的最小圈,不过这样也只是比以前降低了一个档位而已。按照我的计划是,刚开始时前齿轮使用中间档位,后齿轮使用中间档位,2个月后把后面的换为次小档位,然后又过了2个月后前面开始原创 2006-03-02 18:22:00 · 1638 阅读 · 0 评论 -
思索中
为了做出好的音字转化程序,最近又开始研究k shortest paths算法了,搜刮了10多篇各个年代的论文,一路啃过来,几天后终于有所收获。接下来就是要实现一个高效的算法版本咯,不过30年来,此算法的改进版本为数不少,看来又要仔细阅读和对比一段时间,没办法,关于此算法的论文翻译和编辑看来又要拖到3月份才能完成了。原创 2006-02-15 10:03:00 · 1427 阅读 · 0 评论 -
努力中
快乐的春节假期开始的前段日子,出于兴趣,花了一天时间完成了第一个版本的音字转换,功能和现在baidu或者sogou上的拼音输入相同,只有简单的音词转化提示,对于一长串的拼音流我也只是稍微作了最大匹配,求取基于一元概率最大值的汉字序列,小小的程序很流畅,寥以自娱而已。假期过后,偶然发现google针对个性用户的拼音输入可以处理连续的长串拼音,而且效果好得很,于是乎我又开始改用多元概率模型,求取多个音原创 2006-02-16 14:41:00 · 1466 阅读 · 0 评论 -
谷歌退出之事
不谈意识形态,也不谈政府意识。 谷歌退出中国市场,无疑将造成百度的一家独大,当然想想阿里在电子商务的一家独大,以及腾迅在即时通讯领域的一家独大,似乎也没什么。但是百度是一家技术起家和驱动的公司,如果在其市场上缺少一个直接的竞争对手,或者说像Google这种技术上力求创新的公司作为对手的话,真的不是一件好事。 抛开中国互联网广告市场份额不谈,百度在技术上也无疑将面临更大的挑战,开始要原创 2010-01-16 21:52:00 · 2949 阅读 · 1 评论