- 博客(14)
- 收藏
- 关注
原创 回归分析之汽车保险数据分析
本文以某财产保险公司的汽车保险数据为样本,包括了保单类型、车辆驾驶人性别、年龄、车龄、驾驶人年龄分组、车辆所属地区、车年数、索赔次数和保险期间的累计赔付总额。随着汽车行业的发展,汽车保险公司的业务也在不断发展,现阶段汽车保险公司通过对保险索赔数据的收集分析,数据挖掘能够找到影响索赔的因素,从而帮助保险公司规避风险。但对字段特征进行分析后发现,年龄和年龄分组存在严重的多重共线性问题,车年数和索赔次数存在较强的多重共线性问题,在后续的逻辑回归建模中会删掉年龄和车年数这两个特征。其中包括性别,地区,保单类型。
2023-03-09 18:01:23
3255
9
原创 tableau public 数据分析仪表板
https://public.tableau.com/app/profile/zhuyuqiao/viz/ZYQ/1
2022-02-08 17:11:02
547
原创 tableau public 商品订单可视化仪表板
https://public.tableau.com/app/profile/zhuyuqiao/viz/_16311809765880/sheet9
2022-02-08 17:07:57
381
原创 mysql开窗函数笔记记录
#开窗函数练习SUM(expr) over()SELECTROW_NUMBER() OVER (ORDER BY milk_tea.sale_price DESC) AS [RANK],*FROM milk_tea;select prod_name,net_w,count(*)over(partition by net_w) from milk_tea ;select prod_name,net_w,count(*)over(partition by net_w) as t from ..
2022-02-08 17:01:04
1388
原创 SQL查询语句多表连接笔记记录
#左外联结SELECT *from vendorsleft join productson vendors.ID=products.VID ;# 右外链接SELECT *from vendorsRIGHT join productson vendors.ID=products.VID ;#同上SELECT *from productsleft join vendorson vendors.ID=products.VID ;#内连接 joi...
2022-02-08 16:57:13
570
原创 SQL-聚合函数结果作为筛选条件时where与having用法的区别
牛客网题目:表user_profile,查看每个学校用户的平均发贴和回帖情况,寻找低活跃度学校进行重点运营,请取出平均发贴数低于5的学校或平均回帖数小于20的学校。如果用where,则需要用到子查询语句:select *from(selectuniversity,avg(question_cnt) as avg_question_cnt,avg(answer_cnt) as avg_answer_cntfrom user_profilegroup by uni...
2021-12-16 17:50:33
2338
原创 SQL - 多字段组合升序ASC降序DESC
在SQL语言中,字段的排序默认是升序所以以下数据表的升序查找可以有三种写法:(取出用户信息表中的年龄和gpa数据,并先按照gpa升序排序,再按照年龄升序排序输出)(1)SELECT device_id,gpa,age from user_profile order by gpa,age;(2)SELECT device_id,gpa,age from user_profile order by gpa,age asc;(3)SELECT device_id,gpa,age fro..
2021-12-14 17:13:04
4741
原创 Python之DataFrame表格型数据结构
对于dataframe 表格型数据结构 当只传入单一个列表时,该列表会显示成一列df0=pd.DataFrame(['aa','ab','ac','bb','bc'])print(df0)>> 00 aa1 ab2 ac3 bb4 bc如果要显示为一行,可以进行T转置操作df01=pd.DataFrame(['aa','ab','ac','bb','bc']).Tprint(df01)>> 0 1 2 3 4...
2021-11-29 17:05:40
1116
原创 python之创建dataframe表格型数据结构
对于dataframe 表格型数据结构 当只传入单一个列表时,该列表会显示成一列 df0=pd.DataFrame(['aa','ab','ac','bb','bc'])print(df0)>> 00 aa1 ab2 ac3 bb4 bc如果要显示为一行,可以进行转置操作df01=pd.DataFrame(['aa','ab','ac','bb','bc']).Tprint(df01)>> 0 1 ...
2021-11-29 16:56:36
1908
原创 python数据结构之字典
字典的创建有两种:第一种,创建空字典然后赋值test_dict={}test_dict['a']=1001test_dict['b']=1002打印test_dict,结果为:>>{'a': 1001, 'b': 1002}第二种:直接以键值对的形式传入字典test_dict={'c':1003,'d':1004}print(test_dict)>>{'c': 1003, 'd': 1004}这里需要注意的是,将这两种方法混合起来一起用,会出
2021-11-29 15:41:22
130
原创 SQL- join 表连接、内连接和外连接
(一)、内连接,JOIN 或者INNER JOIN,可以省略 INNER 直接使用 JOIN。在SQL语法中:select * from A,B where A.id=B.id等效于:select * from A JOIN B on A.id=B.id例子一:查找所有已经分配部门的员工的last_name和first_name以及dept_no,未分配的部门的员工不显示员工表:employees4部门表:dept_emp4法一:法二:使用内连接joi...
2021-11-25 17:28:37
2001
原创 SQL语句limit和offset的应用:查找员工排名信息和分页查询
题目描述一:查找employees里最晚入职员工的所有信息解题思路:将表按照员工的入职时间做一个降序排序DESC(从A到Z)(从高到低) 检索最前面的一行数据,只取前一行,limit 1表示返回不超过1行的数据·也可以用limit offset 组合使用,limit 1 表示只取1行,offset表示从第0行后开始取这道题也可以直接用max()取时间最大值判断入职时间:select * from employeeswhere hire_date =(SELECT m..
2021-11-25 15:24:19
857
原创 Java算法:经纬度转换 将百度转为高德经纬度
百度坐标系 (BD-09)与 (高德地图)火星坐标系 (GCJ-02) 的转换算法 ,将 BD-09 坐标转换成GCJ-02 坐标, 基本没有误差。 #声明π值 public static double pi = 3.1415926535897932384626; #经纬度转换的核心算法 public static Gps bd09_To_Gcj02(double bd_lat, double bd_lon) { double x = bd_lon - 0...
2021-11-16 19:55:11
1947
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人