
小练习
文章平均质量分 60
数星星的小贝壳
这个作者很懒,什么都没留下…
展开
-
【小练习】SQL-查重
查出重复的学生名NO name 1 JONE 2 LILY 3 TOM 4 LILY 5 TOM 方法一:SELECT nameFROM(SELECT name, count(name) numFROM table) tWHERE num &...原创 2019-10-25 11:52:03 · 254 阅读 · 0 评论 -
【小练习】SQL_OR
Find list ofordersids where eithergloss_qtyorposter_qtyis greater than 4000. Only include theidfield in the resulting table. Write a query that returns a list oforderswhere thesta...原创 2018-07-14 23:41:34 · 226 阅读 · 0 评论 -
【小练习】SQL_AND&BETWEEN
Write a query that returns all the orders where the standard_qty is over 1000, the poster_qty is 0, and the gloss_qty is 0.Using the accounts table find all the companies whose names do not start with...原创 2018-07-14 23:29:25 · 225 阅读 · 0 评论 -
【小练习】SQL_HAVING
HAVING 有多少位销售代表需要管理超过 5 个客户? SELECT s.id, s.name, COUNT(*) num_accountsFROM accounts aJOIN sales_reps sON s.id = a.sales_rep_idGROUP BY s.id, s.nameHAVING COUNT(*) > 5ORDER BY num_...原创 2018-05-08 15:47:15 · 390 阅读 · 0 评论 -
【小练习】SQL_DISTINCT
DISTINCT 使用DISTINCT检查是否有任何客户与多个区域相关联? 下面的两个查询产生了相同的行数(351 行),因此我们知道每个客户仅与一个区域相关联。如果每个客户与多个区域相关联,则第一个查询返回的行数应该比第二个查询的多。 SELECT DISTINCT a.id, r.id, a.name, r.nameFROM accounts aJOIN sales_...原创 2018-05-08 00:26:23 · 229 阅读 · 0 评论 -
【小练习】SQL_GROUP BY
哪个客户(按照名称)下的订单最早?你的答案应该包含订单的客户名称和日期。 SELECT a.name, o.occurred_atFROM accounts aJOIN orders oON a.id = o.account_idORDER BY occurred_atLIMIT 1; 算出每个客户的总销售额(单位是美元)。答案应该包括两列:每个公司的订单总...原创 2018-05-07 23:40:47 · 339 阅读 · 0 评论 -
【小练习】SQL_JOIN
为与客户名称Walmart相关的所有web_events创建一个表格。表格应该包含三列:primary_poc、事件时间和每个事件的渠道。此外,你可以选择添加第四列,确保仅选中了Walmart事件。 SELECT a.primary_poc, w.occurred_at, w.channel, a.nameFROM web_events wJOIN accounts...原创 2018-05-06 23:34:53 · 261 阅读 · 0 评论 -
【小练习】红白葡萄酒案例3_通过查询进行数据分组
问题 :酒精含量越高的葡萄酒获得的评级更高吗?要回答这个问题,请使用 query 创建两组葡萄酒样本:低酒精(酒精含量低于中值的样本)高酒精(酒精含量高于或等于中值的样本)然后,找到每组的平均质量评级。代码:# 加载 `winequality_edited.csv`import pandas as pddf = pd.read_csv('winequality_edited.csv')# 获取酒精...原创 2018-05-05 16:14:59 · 679 阅读 · 0 评论 -
【小练习】红白葡萄酒案例2_数据分组聚合
红白葡萄酒问题 :哪个水平的酸度(pH 值)获得的平均评级最高?思路:先用pd.cut() 对酸度进行划分,再用pd.groupby()对划分好的区间进行分组求评分的平均值。import pandas as pddf = pd.read_csv('winequality_edited.csv') #'winequality_edited.csv'这是合并后的数据# 用 Pandas 描述功能查看...原创 2018-05-05 14:25:36 · 1077 阅读 · 0 评论 -
【小练习】红白葡萄酒案例1_合并数据集
问题:合并红葡萄酒和白葡萄酒数据集(winequality-red.csv, winequality-white.csv),新增一列表示颜色,用以区分是红还是白葡萄酒思路:分别给红葡萄酒和白葡萄酒数据集新增一列表示颜色,再合并评估数据:import pandas as pdpd_red = pd.read_csv('winequality-red.csv', s...原创 2018-05-04 23:42:56 · 4628 阅读 · 4 评论 -
【小练习】Pandas Series apply()——交换first name 和 last name位置
有如下一个名字序列,需要交换first name 和 last name的位置。names = pd.Series([ 'Andre Agassi', 'Barry Bonds', 'Christopher Columbus', 'Daniel Defoe', 'Emilio Estevez', 'Fred Flintstone', 'Greta Garb...原创 2018-05-04 00:48:14 · 519 阅读 · 0 评论 -
【小练习】SQL_子查询
一 返回的是一个table:问题:find the average number of events for each day for each channel.The first table will provide us the number of events for each day and channel, and then we will need to averag...原创 2018-05-09 21:20:40 · 583 阅读 · 0 评论 -
【小练习】SQL_CASE
CASE我们想要根据相关的购买量了解三组不同的客户。最高的一组是终身价值(所有订单的总销售额)大于 200,000 美元的客户。第二组是在 200,000 到 100,000 美元之间的客户。最低的一组是低于 under 100,000 美元的客户。请提供一个表格,其中包含与每个客户相关的级别。你应该提供客户的名称、所有订单的总销售额和级别。消费最高的客户列在最上面。SELECT a.name, ...原创 2018-05-09 16:20:58 · 229 阅读 · 0 评论 -
【小练习】SQL_DATE
处理日期Parch & Posey 在哪一年的总销售额最高?数据集中的所有年份保持均匀分布吗?SELECT DATE_PART('year', occurred_at) ord_year, SUM(total_amt_usd) total_spentFROM ordersGROUP BY 1ORDER BY 2 DESC;对于 2013 年和 2017 年来说,每一年只有一个月的...原创 2018-05-08 23:56:57 · 263 阅读 · 0 评论