- 博客(10)
- 收藏
- 关注
转载 数据仓库学习笔记 --- 拉链表详解
定义:拉链表 - 维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录而已,通过拉链表可以很方便的还原出拉链时点的客户记录。拉链表通常是对账户信息的历史变动进行处理保留的结果。需求:1. 数据量比较大;2. 表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等;3. 需要查看某一...
2019-10-17 15:14:12
537
原创 Kaggle选手调查问卷分析(用户画像分析)
Kaggle是众所周知的数据竞赛平台,为社区用户举办了一次问卷调查,调查内容涉及人工智能领域的不同维度,收集到16000份关于从业者的人员属性、工作背景,学习特征和技能特征等方面的信息,帮助打算进入人工智能领域的有识之士更好的了解行业现状,做到有的放矢,不走弯路。 数据来源::https://pan.baidu.com/s/1o7BFzFO用户画像分析一 ...
2018-09-12 22:37:27
4119
2
原创 利用时间序列ARMA模型和LSTM算法分析并预测pm2.5值
数据来源于 UC Irvine Machine Learning Repository网站中的Beijing PM2.5 Data Data Set,数据文件类型为CSV。一、利用ARMA模型数据平稳性分析还是以天为单位分析这五年之内的pm2.5值,并绘制曲线ARIMA 模型对时间序列的要求是平稳型,观察图标能看出其没有固定的上升或下降的趋势,粗略判断是平稳序列。不进行差分操作...
2018-09-07 19:14:06
13915
2
转载 机器学习算法简述 与 代码实现
机器学习(一)——K-近邻(KNN)算法机器学习(二)——K-均值聚类(K-means)算法机器学习(三)—支持向量机机器学习(四)—决策树机器学习(五)—朴素贝叶斯机器学习(六)— logistic回归机器学习(七)—回归机器学习(八)—Apriori算法 各种算法的优缺点及适用范围 优点 缺点 适用数据类型 KNN 精度高、...
2018-09-06 16:36:30
745
转载 基于内容推荐算法详解
Collaborative Filtering Recommendations (协同过滤,简称CF) 是目前最流行的推荐方法,在研究界和工业界得到大量使用。但是,工业界真正使用的系统一般都不会只有CF推荐算法,Content-based Recommendations (CB) 基本也会是其中的一部分。“基于物品的协同过滤算法:理论说明,代码实现及应用http://blog.youkuaiyun.com...
2018-09-06 11:56:02
612
原创 北京PM2.5情况分析(2010-2014)
利用网上搜集到的CSV数据,对北京市2010年至2014年的PM2.5情况进行分析。数据获取数据来源于 UC Irvine Machine Learning Repository网站中的Beijing PM2.5 Data Data Set,数据文件类型为CSV。数据清洗预览:数据共43824条,13个维度,其中部分字段代表含义如下TEMP:温度PRES:大气压力c...
2018-08-26 11:55:42
12942
15
转载 enumurate()
python其实提供了内置的enumerate函数可以同时获得索引和值,可以这样实现:[python] view plain copyfor index, key in enumerate(sequence): process(index, key) 如果你想对sequence中的元素作逆置后处理,可以:
2017-12-18 20:55:22
341
转载 Python函数式编程之map()
Python中map()、filter()、reduce()这三个都是应用于序列的内置函数。 格式: map(func, seq1[, seq2,…]) 第一个参数接受一个函数名,后面的参数接受一个或多个可迭代的序列,返回的是一个集合。 Python函数编程中的map()函数是将func作用于seq中的每一个元素,并将所有的调用的结果作为一个list返回。如果func为None
2017-12-17 20:13:13
332
转载 collections.defaultdict() 与 dict的使用和区别
import collectionss = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]# defaultdictd = collections.defaultdict(list)for k, v in s: d[k].append(v)# Use dict a
2017-12-17 12:45:02
923
转载 Python的zip函数
zip函数接受任意多个(包括0个和1个)序列作为参数,返回一个tuple列表。具体意思不好用文字来表述,直接看示例:1.示例1:x = [1, 2, 3]y = [4, 5, 6]z = [7, 8, 9]xyz = zip(x, y, z)print xyz运行的结果是:[(1, 4, 7), (2, 5, 8), (3, 6, 9)]
2017-12-17 12:43:18
265
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人