
数据挖掘
文章平均质量分 85
又见智能商业
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于Pyspark进行PCA主成分分析
了解更多内容,欢迎关注公众号:livandataPyspark是近段时间笔者接触到的比较高效的大数据处理工具,他的亮点是整理出了数据分析过程中两个最高频应用的工具:pandas的DataFrame包和sklearn包,能够方便的完成数据处理及模型构建两块内容,上一篇笔者整理了Pyspark的常规用法,本篇以一个案例的形式串联一下pyspark的内容:在小数据集中构建一个PCA模型是非常方便的,DataFrame构建完成后直接调用sklearn的PCA包即可,那么,在大数据集中是否也是这样方便呢?原创 2021-01-21 10:05:55 · 2040 阅读 · 0 评论 -
数据处理奇技巧——hive篇
1、pmod(int a, int b):返回a除以b的余数的绝对值;cast(aaa as int):将string转化成int;cast(aaa as decimal(10, 2)):将string转化成float,保留两位小数;2、trim(String A):去除A两侧的空格;ltrim(String A):去除左边空格;rtrim(String A):去除右边空格...原创 2020-01-04 20:45:12 · 3606 阅读 · 0 评论 -
网站分析08——使用student’s T检验的未必是学生
笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中有趣的事情。我的公众号为:livandata一直想整理一下统计方法在网站分析中的应用,刚好前几天遇到类似的问题,借这个机会整理一下网站分析中T检验的思路。在统计面前我们并没有生产方法,我们只是方法的搬运工,希望能用的恰到好处而已...原创 2019-07-08 23:54:50 · 2509 阅读 · 0 评论 -
实战演习(十三)——遍历文件夹中的所有内容
笔者希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata在数据收集过程中,会有各种各样的格式,同时这些文件也存储在不同的文件夹中,为了方便起见,此处整理出一个可以遍历各个文件...原创 2019-06-22 13:16:01 · 383 阅读 · 3 评论 -
实战演习(十二)——基于关联规则分析用户行为频繁项集的关键页面
笔者希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata啤酒尿布的案例是引发大数据思考的一个非常重要的案例,自从这个案例出现之后,对其进行深度研究的人员不计其数,本文是基于网...原创 2019-06-12 20:47:58 · 1007 阅读 · 1 评论 -
实战演习(十一)——使用LSTM构建文本分类模型
笔者希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata由于工作中应用,需要对文本进行分类,主要是对客户的反馈信息进行分类,确定客户的反馈投诉是指的哪个部门的问题,然后自动的...原创 2019-06-12 20:29:19 · 2703 阅读 · 0 评论 -
挖掘用户反馈中的宝藏——NLP文本标签化解密
笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,一起讨论数据中有趣的事情~个人公众号为:livandata一.用户反馈闭环梳理公司与用户的交互过程中,用户的投诉是获取到用户诉求点最直接的方法,但是这一途径由于其过高的成本,公司往往希望越少越好,处理起来也是慎之又慎。在用户的反馈信息中,有很...原创 2019-05-06 10:11:47 · 3072 阅读 · 1 评论 -
实战演习(十)——2019年电影地域python分析读后感
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原文:https://mp.weixin.qq.com/s/8gQzzjvA4_...原创 2019-03-04 23:06:21 · 421 阅读 · 0 评论 -
专题07-python使用urllib.request爬取图片
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandatapython在爬虫方面的应用非常灵活,几乎可以解决大部分数据获取问题,笔者在之前...原创 2019-02-14 14:10:45 · 2610 阅读 · 0 评论 -
专题05-python操作微信(wxpy)
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2019-01-31 15:12:20 · 1685 阅读 · 0 评论 -
专题04-python操作PDF文件
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2019-01-30 21:30:21 · 966 阅读 · 0 评论 -
专题06-python操作email
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2019-02-01 15:22:40 · 1372 阅读 · 0 评论 -
专题01-python文件的读写功能(Excel与txt)
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2019-01-15 15:35:01 · 507 阅读 · 0 评论 -
专题03-python操作MySQL数据库
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2019-01-18 18:18:45 · 312 阅读 · 0 评论 -
专题02-python操作excel文件案例
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2019-01-17 16:55:39 · 867 阅读 · 0 评论 -
数据挖掘学习(四)——常见案例总结
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2018-06-29 01:32:51 · 18489 阅读 · 2 评论 -
数据挖掘学习(三)——文本挖掘
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2018-06-29 01:18:57 · 18118 阅读 · 6 评论 -
数据挖掘学习(二)——数据探索与清洗
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2018-06-29 01:02:46 · 3274 阅读 · 0 评论 -
数据挖掘学习(一)——常用的python包
笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata原创 2018-06-29 00:51:34 · 20970 阅读 · 0 评论