
data mining
IT界的小小小学生
写文章的目标不仅是解决问题,更是帮助阅读的人或企业实现商业价值。秉持 “从解决问题出发、在实践中学习,最终创造价值”的信念,予人玫瑰手留余香!
展开
-
基于R语言利用QQ群进行数据挖掘案例整理
利用QQ群进行数据挖掘案例,数据源来源于2016年12-2017年大致一个月的QQ群基本数据,通过对聊天内容的分析,了解QQ聊天群资料了解时间,人群以及关键词,并构建相应图表、云图等,下图为本人所在提取的QQ群: 以下是R代码部分:file.data<-scan("C:/Users/admin/Desktop/数据挖掘机器学习R-hive.txt",what="",sep=...原创 2017-01-19 14:13:49 · 5012 阅读 · 0 评论 -
R语言读CSV、txt文件方式以及read.table read.csv 和readr(大数据读取包)
首先准备测试数据*(mtcars)分别为CSV. TXTread.table 默认形式读取CSV(×)与TXT(效果理想) ①> test<-read.table("C:/Users/admin/Desktop/test.txt",header = F)Error in scan(file = file, what = what, sep = sep, quote = quote, d原创 2017-07-18 15:35:43 · 13613 阅读 · 0 评论 -
python 网页特征提取XPATH(两天玩转) 第一天
XPath 是一门在 XML 文档中查找信息的语言。XPath 用来在 XML 文档中对元素和属性进行遍历。关于xpath的说明文档可以参照:XPATH基础说明lxml用法源自 lxml python 官方文档,更多内容请直接参阅官方文档,本文对其进行翻译与整理。 官方英文版(lxml说明) 安装方法: pip install lxml 案例:百度百科词条为案例:明月镇词条 https:/原创 2017-08-23 18:42:36 · 10437 阅读 · 0 评论 -
python django整理(二)路由设置(URLS)
3步初识ursl与views之间的作用原理视图函数相关的URL(网址) (访问啥网址对应啥内容)1、打开app01/views.py文件,输入下列代码: 2、针对bbs中urls进行编辑访问地址 3、结果展示 以上为最基础基本流程展示调用数据库中数据以及html文件原创 2017-11-11 20:09:40 · 1270 阅读 · 1 评论 -
神经网络中的学习速率如何理解
特征缩放实际当我们在计算线性回归模型的时候,会发现特征变量x,不同维度之间的取值范围差异很大。这就造成了我们在使用梯度下降算法的时候,由于维度之间的差异使得Jθ的值收敛的很慢。我们还是以房价预测为例子,我们使用2个特征。房子的尺寸(1~2000),房间的数量(1-5)。以这两个参数为横纵坐标,绘制代价函数的等高线图能看出整个图显得很扁,假如红色的轨迹即为函数收敛的过程,会发现此时函数收敛的非常慢。原创 2017-12-05 18:37:44 · 18138 阅读 · 0 评论 -
GBDT与xgb区别,以及梯度下降法和牛顿法的数学推导
为什么要介绍梯度下降法和牛顿法那?这里提及两个算法模型GBDT和XGBoost,两个都是boosting模型。GBDT和xgb的目标函数是不同的,同时针对其目标函数中的误差函数 L(θ) 的拟合方式也有差异:GBDT利用一阶泰勒展开两项,做一个近似xgboost利用二阶泰勒展开三项,做一个近似言为之意,GBDT在函数空间中利用梯度下降法进行优化XGBoost在函数空间中用牛顿法进行...原创 2019-01-05 15:48:32 · 2563 阅读 · 0 评论