
python
Garvin Li
Dancing with data
展开
-
pydev-python 链接mysql数据库(mac系统)
1.首先实现命令行下可运行mysql 这一部分网上有一位大神说的已经很清楚了,直接引用过来,多谢哈。引用:http://www.lihui.info/mac-pydev-mysqldb/ 在mac os上安装MySQLdb,遇到了很多问题,总结一下: 首先,如果用sudo easy_install mysql-python命令安装,原创 2014-06-23 19:55:58 · 2787 阅读 · 0 评论 -
unittest单元测试
1.背景 到了公司发现,ut(单元测试)是非常重要的一部分,ut并不是完全是测试的同学完成,很多时候ut是需要开发的同学自己来做。研究了下python脚本下unittest包的用法。使用的时候要import unittest包,函数的传入参数unittest.TestCase,主要结构包括:setUp():初始化测试函数tearDown():测试结束后的清理工作若干测试函数以test为开头2.代码原创 2015-07-21 14:46:09 · 2308 阅读 · 0 评论 -
微信QQ聊天记录分析工具-微Q
1.背景 忙了一周,从设计算法到编程,到部署服务器,到最后的UI实现,终于我的微Q诞生了。 用起来非常的简洁,只要把微信或者qq的聊天记录导出来,是个txt文件,导入微Q,手机端也能用,它就能帮你分析谁是话唠,谁是话题终结者/开启者,谁是表情帝,热词,还有活跃时段。我自己用着还挺爽了。美中不足:服务器比较慢,UI做的比较繁重,刷不出来得多刷新几次。秀下界面吧:分析结原创 2014-12-11 16:29:42 · 8363 阅读 · 3 评论 -
python 中文乱码问题解决方案
最近在项目中部署结巴分词的时候遇到了乱码情况,明明是中文,确显示不出来或者显示乱码。解决方案如下。利用isinstance 来判断是否已经编码,s是出问题的字符串。unicode是没编码isinstance(s, unicode): 用print 打印,如果结果是true说明没编码。如果是false说明编码了,但是编的码不对print isinstance(s,unicode)如果没编码,加入编码原创 2014-12-09 13:59:48 · 3649 阅读 · 1 评论 -
用python+flask自己制作api(教程附源码)
1.背景 ok,可能很多朋友跟我一样经常使用各种api,比如facebook的,github的,甚至是微信的api。所以很多人也想制作自己的api。网上关于这方面的教程实在是很少,今天我就顺手做了一个,把方法公布下。首先秀一下效果:用“curl”方法,返回一个json,大家也可以试下:curl -i http://ospafzone.duapp.com/ospaf2.代码首先说下环原创 2014-11-06 11:17:52 · 13404 阅读 · 2 评论 -
sublime插件开发教程(附源码)
1.背景 虽然可能大神门在编辑器方面都比较偏向于vim之类的自由度更高的工具,但是从我个人来讲sublime这样的插件安装更方便的工具还是比较得心应手的。之前用sublime写英语作文,但是没有一个比较好用的timer,Package_Control里面的track_timer不能实时显示时间,所以博主就自己动手,写了这个插件,可以实时timer,记录时间。效果如下图,2.使原创 2014-10-13 09:16:33 · 4703 阅读 · 3 评论 -
python+flask+html/css+mysql+BAE 打造优快云简历自动生成系统(附网站完全源码)
1.背景 一直想自己动手x原创 2014-10-29 09:21:14 · 12252 阅读 · 6 评论 -
新闻个性化推荐系统(python)-(附源码 数据集)
1.背景 最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。2.数据集一共五个字段,以tab隔开。分别是user编号,news编...原创 2014-09-25 08:32:55 · 45284 阅读 · 43 评论 -
Ospaf项目-commits词频统计模块
1.背景 最近在搞得ospaf项目(可以移步ospaf中期报告来了解),对于commits数据进行特征提取的时候发现,因为开源项目的commits的特点有以下两个主要放面:1.动词往往出现在第一个字,例如add、revert之类的。2.动词相对固定,主要也就是那几种,add、revert、update、merge、remove之类的。 所以要做的工作就比较清晰了。原创 2014-08-15 18:41:44 · 1766 阅读 · 3 评论 -
【机器学习算法-python实现】矩阵去噪以及归一化
/********************************* 本文来自博客 “李博Garvin“* 转载请标明出处:http://blog.youkuaiyun.com/buptgshengod******************************************/原创 2014-07-08 10:46:36 · 10844 阅读 · 6 评论 -
【机器学习算法-python实现】K-means无监督学习实现分类
1.背景 无监督学习的定义就不多说了,不懂得可以google。因为项目需要,需要进行无监督的分类学习。 K-means里面的K指的是将数据分成的份数,基本上用的就是算距离的方法。 大致的思路就是给定一个矩阵,假设K的值是2,也就是分成两个部分,那么我们首先确定两个质心。一开始是找矩阵每一列的最大值max,最小值min,算出range=max-min,然后设原创 2014-07-11 08:30:15 · 9116 阅读 · 3 评论 -
【机器学习算法-python实现】最大似然估计(Maximum Likelihood)
1.背景 最大似然估计是概率论中常常涉及到的一种统计方法。大体的思想是,在知道概率密度f的前提下,我们进行一次采样,就可以根据f来计算这个采样实现的可能性。当然最大似然可以有很多变化,这里实现一种简单的,实际项目需要的时候可以再更改。 博主是参照wiki来学习的,地址请点击我 这里实现的是特别简单的例子如下(摘自wiki的最大似然)离散分布,离散原创 2014-08-25 11:09:02 · 27382 阅读 · 2 评论 -
【机器学习算法-python实现】采样算法的简单实现
1.背景 采样算法是机器学习中比较常用,也比较容易实现的(出去分层采样)。常用的采样算法有以下几种(来自百度知道): 一、单纯随机抽样(simple random sampling)将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。优点:操作简单,均数、率及相应的标准误计算简单。 缺点:总体较大时,难以一一编号。二、系统抽样(systemat原创 2014-07-14 16:05:43 · 9655 阅读 · 3 评论 -
csdn开源夏令营-ospaf中期报告
1.背景 随着将中期的代码托管到优快云的平台上,ospaf(开源项目成熟度分析工具)已经有了小小的雏形,当然还远远不够。 首先还是要感谢这次活动组织方优快云,感觉挺有Google Summer Code 中国版的味道。还有就是我的夏令营导师David,给了我很多指导和帮助,线下的交流也很让我长见识。 接着来说ospaf这个项目(有兴趣的tx可以去看题案,地址)。原创 2014-07-25 15:32:07 · 2389 阅读 · 1 评论 -
【机器学习算法-python实现】PCA 主成分分析、降维
1.背景 PCA原创 2014-07-17 09:40:47 · 10425 阅读 · 4 评论 -
如何用PYTHON代码写出音乐
如何用PYTHON代码写出音乐什么是MIDI博主本人虽然五音不全,而且唱歌还很难听,但是还是非常喜欢听歌的。我一直在做这样的尝试,就是通过人工智能算法实现机器自动的作词和编曲(在这里预告下,通过深度学习写歌词已经实现了,之后会分享给大家),本文我们主要聊下如何写曲。 说到用代码写曲子,有一个东西大家一定要了解就是MIDI。MIDI是一种乐器数字接口,是编曲界最广泛的音乐标准格式。MIDI并不是真正原创 2017-06-15 09:31:43 · 36618 阅读 · 11 评论