
算法
Istaroth
这个作者很懒,什么都没留下…
展开
-
python处理下载的天气数据
import csvfrom matplotlib import pyplot as plt原创 2017-08-03 20:56:46 · 2054 阅读 · 0 评论 -
用python写网络爬虫-下载百思不得姐视频
跟着哔哩哔哩视频开始写爬虫啦,目标:下载白死不得姐的视频原创 2017-08-07 16:50:51 · 722 阅读 · 0 评论 -
matplot.pyplot 绘图学习
学习画图了原创 2017-08-02 23:34:11 · 1345 阅读 · 0 评论 -
用python写网络爬虫-下载网页
开始学写爬虫啦,但是刚看书开头说本书以python2.7为案例讲解,很多模块未适配到python3.x,不过我看这本书的时候发现他说的很多没适配的模块基本都适配过来了,所以就决定用python3.6来写,正好体会下3和2的差别原创 2017-08-05 21:49:04 · 2357 阅读 · 0 评论 -
python3中使用builtwith以及各种疑难问题的方法
python3中使用builtwith以及各种疑难问题的方法转载 2017-08-05 21:04:36 · 1322 阅读 · 1 评论 -
python实现随机掷色子并统计绘图
python实现随机掷色子并统计绘图原创 2017-08-03 15:49:12 · 1438 阅读 · 0 评论 -
python基础学习
python基础学习代码原创 2017-08-02 21:14:56 · 369 阅读 · 0 评论 -
python实现随机漫步
随机漫步原创 2017-08-03 11:52:37 · 4673 阅读 · 5 评论 -
解决线性回归算法的过拟合问题-----LARS算法
上一次写的机器学习算法是使用线性回归算法实现的,但是线性回归算法不可避免的会出现过拟合问题,训练的越多你的模型就越匹配你的训练数据而逐渐丧失了对新数据的“预测性”,为了解决这个问题提出了岭回归,lars算法,惩罚线性回归等方案。原创 2017-09-24 16:07:29 · 2224 阅读 · 0 评论 -
用python写网络爬虫-爬取新浪微博评论
新浪微博需要登录才能爬取,这里使用m.weibo.cn这个移动端网站即可实现简化操作,用这个访问可以直接得到的微博id。分析新浪微博的评论获取方式得知,其采用动态加载。所以使用json模块解析json代码单独编写了字符优化函数,解决微博评论中的嘈杂干扰字符本函数是用python写网络爬虫的终极目的,所以采用函数化方式编写,方便后期优化和添加各种功能原创 2017-08-17 16:04:15 · 7844 阅读 · 3 评论 -
python机器学习-数据类型统计
统计数据类型翻译 2017-09-06 22:30:36 · 381 阅读 · 0 评论 -
构建我的第一个机器学习----岩石水雷声呐分类器
终于要构建机器学习分类器啦,激动,学玩这个才发现,python实在是会让人便懒得,构建分类器竟然不用写线性回归学习过程…..直接用sklearn包就可以了原创 2017-09-16 00:24:06 · 962 阅读 · 2 评论 -
用python写网络爬虫-提取我的博客内容
基本和上次写的爬取不得姐视频差不太多,也是正则表达式方法,所以这次就直接贴代码了原创 2017-08-08 16:35:59 · 435 阅读 · 0 评论 -
使用sklearn包构建二元决策树预测红酒口感
前面用惩罚线性回归模型构建过红酒口感预测模型,探索对红酒口感贡献最大属性排行,这里使用sklearn包的二元决策树来解决这个问题原创 2017-10-04 16:35:26 · 1331 阅读 · 0 评论 -
用python写网络爬虫-英文翻译
今天学模拟登陆结果发现微博这个鬼东西登陆有点复杂,用户名base64加密不说,密码rsa加密。。。。。。搞得我头晕死了。实在没办法,5分钟写个英文翻译休息下。用的是百度翻译原创 2017-08-18 23:01:34 · 4620 阅读 · 0 评论 -
LARS算法---十折交叉验证
参考:《python机器学习预测分析核心算法》4-2 & llx1026同学的修改代码十折交叉验证整体采用上节的lars算法框架,加入了十折验证,十个β系数,每个β系数进行350次迭代。原创 2017-09-27 22:21:30 · 2803 阅读 · 0 评论 -
用python写网络爬虫-使用xpath代替正则表达式
学习使用xpath代替正则表达式,首先得了解xpath语法原创 2017-08-09 18:10:55 · 1266 阅读 · 0 评论 -
投票决策系统的理论基础
如果多模型之间是近似独立的,则多个模型的联合性能会显著优于单个模型这是投票决策系统的理论基础,上次看了一直不太理解,刚好被惩罚线性回归搞混了来算算这个清醒下。。。原创 2017-10-01 17:42:45 · 642 阅读 · 0 评论 -
python机器学习-异常数据分析
画出数据图,找异常数据翻译 2017-09-06 22:31:33 · 524 阅读 · 0 评论 -
python机器学习-数据规模统计
开始学用python搞机器学习啦,用的是uc irvine数据仓库的“”岩石 vs 水雷“”数据,线做这个数据的获取与规模统计翻译 2017-09-06 22:29:44 · 489 阅读 · 0 评论 -
随机森林算法构建岩石水雷分类器
第一个机器学习算法用了线性回归方法构建了岩石水雷分类器:构建我的第一个机器学习—-岩石水雷声呐分类器原创 2017-10-09 21:10:39 · 768 阅读 · 1 评论 -
tensorflow构建手写数字图像识别---softmax算法
tensorflow构建手写数字图像识别—softmax算法,摘自tensorflow中文社区转载 2017-10-11 21:40:54 · 733 阅读 · 0 评论 -
交叉验证获得最佳二元决策树深度
10折交叉验证各个深度下的平均误差然后看看哪个深度会对预测产生明显的优翻译 2017-10-04 16:58:49 · 1463 阅读 · 0 评论 -
LARS算法探究LOL比赛各数据对胜负的影响
昨天搞完二叉决策树刷了一会儿玩加赛事,发现他们给出了lck,eu,na和入围赛的数据,刚好最近刚学完惩罚线性回归机器学习模型,就着手打算一边学着书上的模型一边用这个职业赛场的数据看看lol比赛背后的输赢定理原创 2017-10-05 11:54:19 · 1563 阅读 · 2 评论 -
windbg实验1
沙老师的作业,,, 1.启动本地内核调试模式:file—kernel dbg—-local 2.查看加载的驱动模块—–lm 3.显示调试器当前运行进程信息—-!process 4.dd xxx 进xxx看内容 5.dds xxx 打印内存地址上的二进制值同时自动搜索二进制值对应的符号 6.ssdt表是包含R3和R0层的api函...原创 2017-10-14 16:25:02 · 371 阅读 · 0 评论 -
莫烦tensorflow系列教程学习
fsdfsdfsdfsdfsd翻译 2017-10-15 23:08:02 · 1493 阅读 · 0 评论 -
神经网络提升mnist识别率
跟着tensorflow入门学习构建一个神经网络提升mnist识别率,最终提升到接近1的正确率了,基本参考网站代码,自己打上去顺便理解下过程,不懂得地方做了中文标注转载 2017-10-13 23:27:17 · 1419 阅读 · 0 评论 -
tensorflow基础语法
上手试试原创 2017-10-11 12:32:38 · 395 阅读 · 0 评论 -
解决mnist各种错误,优化提升
上次写的mnist神经网络cnn预测只能输出训练数据,测试数据没有,百度发现是资源耗尽问题原创 2017-10-16 23:21:37 · 1617 阅读 · 1 评论 -
梯度提升&随机森林混杂算法预测红酒口感
使用sklearn包实现底层二叉决策树随机森林生成,迭代过程使用梯度提升法,最后结果bagging投票决定,下面是算法实现过程原创 2017-10-08 22:31:10 · 804 阅读 · 0 评论 -
理解神经网络与卷积神经网络区别
看书看了神经网络的原理和学习方式,感觉蛮简单的。实际应用中却基本舍弃了这种模型了,卷积神经网络转载 2017-10-12 23:47:29 · 7511 阅读 · 1 评论 -
使用训练的mnist识别自己写的数字
用我上次写的mnist1024层全连接层模型,训练了20000次,在测试集上的正确率为99.3%,这次打算写一个直接使用训练模型进行图片识别的python程序,第一步是自己手动构建个测试矩阵测试,因为第一次尝试这种东西所以遇到了好多问题。。。,现附上代码吧,测试了几下没问题原创 2017-10-18 21:09:34 · 1398 阅读 · 1 评论 -
探究二元决策树训练原理和过拟合问题
《python机器学习预测分析核心算法》第六章 刚刚看书看一半的时候突然有个想法,看了这么久机器学习,机器学习模型到现在要解决的最大的问题就是过拟合和欠拟合的问题,然后联想到以前经常听各种“专家”说童年是最有创造力的时期,中国孩子教书太死,小孩的创造力没了。那机器学习模型如果和人类大脑近似的话那么所谓的过拟合是不是就是学习过多之后丧失了创造力呢,欠拟合是否就是童年时期不会做题的状态呢,有点意思原创 2017-10-04 16:55:39 · 643 阅读 · 0 评论 -
随机森林算法构建红酒口感预测模型
随机森林原创 2017-10-08 14:59:30 · 2836 阅读 · 0 评论 -
Inception V3 迁移学习 训练 Fate stay night 人物识别
1.本来想训练LOL人物识别的,但是各种英雄皮肤一换人都认不出来,所以就选用 Fate 动漫人物的识别 2.图片收集工具:fatkun 说实话有这个工具方便多了,但是收集的还是很累,好多无关图片还要手动去除,害怕影响训练 3. 思考这个迁移学习方式的时候有点疑惑,Google设计这个神经网络结构的时候为了降低计算量和参数量,在最后也并未使用全连接层,但是几乎所有的Inception V3原创 2018-01-31 17:33:57 · 657 阅读 · 0 评论 -
tensorflow实现自编码器
学习tensflow自编码的相关知识tensorflow学习相关代码仓库: https://github.com/joliph/tensorflow 本节代码: https://github.com/joliph/tensorflow/blob/master/autoencoder.py自编码是一种无监督式机器学习,相比于含有label的训练,自编码技术所需的数据要求更低 例如:原创 2018-01-23 16:21:17 · 711 阅读 · 0 评论 -
Word2Vec原理解析
终于彻底搞懂word2vec是什么了………….其实很简单,理解了之后再看之前写的稀里糊涂的代码有种豁然开朗的感觉。。先转载一篇给我Word2Vec解惑的文章:http://blog.youkuaiyun.com/mylove0414/article/details/61616617 word2vec也叫word embeddings,中文名“词向量”,作用就是将自然语言中的字词转为计算机可以理解的原创 2018-02-05 00:14:01 · 1755 阅读 · 0 评论 -
中文词向量
模仿英文词向量,样本是我随便在网上下的小说,经过测试中文的速度比英文慢很多。。。主要时间消耗在data,dictionary的生成那里,所以把程序分成两个部分,一个是完成data,dictionary的生成然后保存为文件,另一个直接读取然后训练。tensorflow系列代码仓库:https://github.com/joliph/字典生成:import jiebaimport r原创 2018-02-07 21:54:21 · 2589 阅读 · 0 评论 -
自然语言处理简洁自用代码合集
记录文字处理的各种简介的代码表示1.快速去除中文标点(read的时候要以utf8格式)def clean_str(string): string = re.sub("[^\u4e00-\u9fff]", " ", string) string = re.sub(r"\s{2,}", " ", string)#合并多个空格为一个 return string.str...原创 2018-02-11 16:31:43 · 2965 阅读 · 0 评论 -
tensorflow复现google的inception v3神经网络
卷积神经网络图片识别关键发展 2012年alexnet:relu激活函数,lrn层,dropdout,重叠最大池化,数据增强 2014年vggnet:两个3x3卷积代替一个5x5卷积,lrn层用处不大,卷积层越深效果基本越好,1x1卷积核性价比很高 2014年的Inception net v1:全局平均池化层+维度变换代替最后一个全链接层,多分支小神经网络结构堆叠成大网络,辅助分类节点 2原创 2018-01-29 16:45:20 · 683 阅读 · 0 评论