
算法数学
码农CGGG
现在是一个游戏开发者
展开
-
过滤及提取电影资源名小算法(初级方案)
这两天干了件自己觉得很有意思的事情—— 互联网上各个视频网站,对电影资源的命名千奇百怪,比如 《阿凡达》高清版在线观看、西游记新版中文字幕(暑期必看!)、阿里巴巴与四十大盗拍摄花絮 …… 如果我们要将这些信息“数字化”,提取到我们的数据库中,则这样的垃圾命名会给我们带来很大的麻烦。 于是,我写了一个程序,简单的对这些垃圾信息进行处理。尽量提取出正确的电影名,并且在之...原创 2010-08-27 12:47:28 · 620 阅读 · 0 评论 -
TF/IDF概念学习笔记
今天晚上加班开发一套程序界面,等回到家已经11点30了。本来打算继续写我的GDE-X引擎,时间已经不够了。那么就学习一点东西吧,打开放在桌面上的吴军老师的《数学之美》,顿时发现一片新的天地。 —— TF/IDF概念。(turn frequency/Inverse document frequency)也称为词汇频率/逆向文本频率。 该技术是信息检索领域最重要的思想,用于确定检索关键...2010-08-27 12:52:26 · 101 阅读 · 0 评论 -
一个纠结了我N久的 数集划分问题
记得在TOJ上曾经有一道题,大致意思如下: 将2N个整数平均分为两堆,每堆N个,使得两堆和的差值最小,求这个差值。 当时自己很自豪的用“随机贪心”的思想写出来的程序在OJ上居top1,(44K 0MS)看着一大堆用DP AC的选手们几百K的内存使用量+几十毫秒的计算速度,小得意了一把。 该随机贪心思想如下: 1 将2N个数随意分为两堆,称为A、B。2 若存在...2010-08-27 12:54:12 · 106 阅读 · 0 评论 -
随机贪心算法简介(搜出一个自己高中的时候写的程序)
高三的时候准备信息学奥赛,到处做编程题。。 当时自己为AC了这道题得意了好一阵子…… 是TOJ上的一道题目,其解题思路涉及到 随机贪心。。 什么是随机贪心?这里用我自己的话给个简单的介绍吧。贪心算法就是根据问题的本质,给出一个最优解导向,然后不断的去迭代进而求出最优解。而在很多时候,未必能准确的找到这个最优解导向(或者根本不存在,比如NP问题),但却可以找到一个近似的导...原创 2010-08-27 13:02:55 · 408 阅读 · 0 评论