- 博客(11)
- 收藏
- 关注
原创 数据挖掘项目-资金流入流出预测(特征工程)
特征工程 基于数据分析与探索提取潜在有价值的特征 特征工程重要性 特征越好,模型的性能越出色 特征越好,构建的模型越简单 特征越好,模型的灵活性越强 特征提取与特征组合
2020-08-25 00:29:47
344
原创 数据挖掘项目-资金流入流出预测(时间序列模型)
这部分之前有学过一点。 1. 时间序列预测模型 1.1 时间序列分解 后续再补了。。实在没时间 1.2 ARIMA模型
2020-08-23 09:42:21
555
原创 数据挖掘项目-资金流入流出预测(时间序列规则)
1.基于周期因子的时间序列预测 1.提取时间序列的周期周期性特征进行预测 两种方式 方式(1):除以周均值 ,然后按列取中位数 方式(2):季节指数的计算方式;获得每日(工作日或周末)均值,再除以整体均值 2.观察序列,当序列呈现周期性变化的时候,可以使用周期因子法作为baseline 如何预测下个月每天的情况 获得每日(1-31号)的均值 统计(周一到周日)每日的频次 基于星期周期因子获取加权均值 根据因子和每日均值预测 2.代码实现 import pandas as pd import sklear
2020-08-23 09:30:52
357
原创 数据挖掘项目-资金流入流出预测
记录一下我参加DataWhale的数据挖掘实战项目的学习过程。 时间是从2020年8月18号—2020年8月25号晚11:59分截止; 项目来源自天池大赛-资金流入流出预测。 赛题简介 蚂蚁金服拥有上亿会员并且业务场景中每天都涉及大量的资金流入和流出,面对如此庞大的用户群,资金管理压力会非常大。在既保证资金流动性风险最小,又满足日常业务运转的情况下,精准地预测资金的流入流出情况变得尤为重要。此届大赛以《资金流入流出预测》为题,期望参赛者能够通过对例如余额宝用户的申购赎回数据的把握,精准预测未来每日的资金流入
2020-08-18 15:56:47
688
原创 SQL练习记录(经典50题)
这个记录一下我练习经典50题的code。 题目来源是这个:图解SQL面试题:经典50题 代码练习的环境是NAVICAT,版本是MySQL8.0的,因为有窗口函数。 还有几个在做题过程中现学的教程,例如窗口函数(????终于学窗口函数了): 窗口函数教程看这里!简洁易懂 如何进行行列互换呢(case when方法学习) 给自己提个醒: 22、27、28、30、40、43和窗口函数那部分比较难,要回顾一下,还有那几道有注释的题。 43题非常难,case when 的用法超级不熟练!!!! 文章目录1.简单查询2
2020-08-13 14:46:58
746
1
原创 SQL ZOO练习记录(Using Null)
这一篇主要练习的内容是is null、left/right join的区别,case when 的用法,和第一次看见的coalesce(x,y,z)的函数用法。 练习入口 coalesce(x,y,z)的用法讲解在这个网址 表格字段: NULL, INNER JOIN, LEFT JOIN, RIGHT JOIN 题1:List the teachers who have NULL for their department. select t.name from teacher t left join d
2020-08-04 21:46:27
180
原创 SQL ZOO练习记录(More JOIN operations/zh)
電影數據庫 此教程練習表格合拼。數據庫有三個表格 movie電影(id編號, title電影名稱, yr首影年份, director導演, budget製作費, gross票房收入) actor演員(id編號, name姓名) casting角色(movieid電影編號, actorid演員編號, ord角色次序) 角色次序代表第1主角是1, 第2主角是2…如此類推. 练习入口 热身???? 题1:列出1962年首影的電影, [顯示 id, title] SELECT id, title FROM mov
2020-08-04 20:56:13
289
原创 SQL ZOO练习记录(The JOIN operation/zh)
练习入口 题1:以列出 賽事編號matchid 和球員名 player ,該球員代表德國隊Germany入球的。要找出德國隊球員,要檢查: teamid = 'GER' 第一個例子列出球員姓氏為’Bender’的入球數據。 * 表示列出表格的全部欄位,簡化了寫matchid, teamid, player, gtime語句。 SELECT matchid, player FROM goal WHERE teamid = 'GER'; 题2:只顯示賽事1012的 id, stadium, team1,
2020-08-03 17:04:00
341
原创 SQL ZOO练习记录( SUM and COUNT/zh )
字段: world(name, continent, area, population, gdp) name:國家名稱 continent:洲份 area:面積 population:人口 gdp:國內生產總值 练习入口 练习使用 SUM, Count, MAX, DISTINCT 和 ORDER BY. 展示世界的總人口。 SELECT sum(population) FROM world; 列出所有的洲份, 每個只有一次。 select distinct continent from worl
2020-07-31 21:53:14
219
原创 SQL ZOO练习记录(SELECT within SELECT Tutorial/zh)
第5题:Germany德國(人口8000萬),在Europe歐洲國家的人口最多。Austria奧地利(人口850萬)擁有德國總人口的11%。 顯示歐洲的國家名稱name和每個國家的人口population。以德國的人口的百分比作人口顯示。 第一种想法是直接用8000万人,但显然是不对滴。 select name, concat(round((population/80000000)*100,2),'%') as population from world where continent ='Europe';
2020-07-27 21:29:00
310
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人