- 博客(154)
- 资源 (12)
- 收藏
- 关注
转载 pandas中concat、merge、append的用法和区别
pandas中concat(), append(), merge()的区别和用法 - 知乎
2022-07-06 16:18:32
675
原创 判断dataframe中是否有重复行,去除重复行
是否有重复行any(df.duplicated())去除重复行df.drop_duplicats(subset = ['price','cnt'],keep='last',inplace=True)drop_duplicats参数说明:subset subset用来指定特定的列,默认所有列keep keep可以为first和last,表示是选择最前一项还是最后一项保留,默认firstinplace inplace是直接在原来数据上修改还是保留一个副本,默认为False...
2022-03-23 17:14:32
2000
原创 <笔试>小团的旅行线路 字典的用法
链接:小团的旅行线路_美团笔试题_牛客网来源:牛客网小团是一个旅游爱好者,快要过春节了,他想统计一下,在过去的一年中他进行过几次旅行,于是他打开了美团app的订单记录,记录显示了他的购买车票的记录。记录是按时间顺序给出的,已知一次旅行的线路一定是一个闭环,即起点和终点是同一个地点。因此当每找到一段闭合的行程,即认为完成了一次旅行。数据保证不会出现不在闭环路径中的数据。请你在小团的购票记录中统计出他全年共进行了多少次旅行?这道题我以为是考的图,没写,其实是考的字典,题解如下..
2022-03-15 11:17:54
491
原创 <笔试> 小美的跑腿代购 堆排序heapq的使用
链接:小美的跑腿代购_美团笔试题_牛客网来源:牛客网小美有n个订单可以接,订单编号是1~n,但是因为订单的时效性,他只能选择其中m个订单接取,精明的小美希望自己获利是最大,已知,一份订单会提供以下信息,跑腿价格v,商品重量w kg,商品每重1kg,代购费用要加2元,而一份订单可以赚到的钱是跑腿价格和重量加价之和。小美应该选择哪些订单,获得的钱最多。请你按照选择的订单编号的从小到大顺序,如果存在多种方案,输出订单编号字典序较小的方案。我的代码没法按照字典序排序:n,m..
2022-03-14 14:58:21
647
原创 <笔试> 式子求值
题目分析:这个题目一开始拿到的时候以为很难,但是根据给出的例子,就能够理解题目意思。我的代码只通过了4条,超出时间复杂度:# 输入n=int(input())a=list(map(int,input().split()))# 初始化ans=0t=0tmp=[0]*(n+1)# 得到输入数字的异或值 a1-an的异或值for i in range(n): ans=ans^a[i]# 得到剩下部分的异或值# 用tmp记录需要异或...
2022-03-12 16:22:13
307
原创 <笔试> 六位数 集合判断
六位数_美团笔试题_牛客网我的代码超出时间限制:m,n=map(int,input().split())ans=0def same(nums): nums.sort() for i in range(1,len(nums)): if nums[i]==nums[i-1]: return False return Truefor i in range(m,n+1): nums=[] while ..
2022-03-10 17:14:17
196
原创 <笔试> 搭配出售服饰 二维数组的排序
链接:搭配出售_美团笔试题_牛客网来源:牛客网服装店新进了a条领带,b条裤子,c个帽子,d件衬衫,现在要把这些搭配起来售卖。有三种搭配方式,一条领带和一件衬衫,一条裤子和一件衬衫,一个帽子和一件衬衫。卖出一套领带加衬衫可以得到e元,卖出一套裤子加衬衫可以得到f元,卖出一套帽子加衬衫可以得到g元。现在你需要输出最大的获利方式我的代码:a,b,c,d,e,f,g=map(int,input().split())ans=0while d>0 and a+b+c>0:..
2022-03-10 14:22:28
237
原创 <笔试> 回转寿司题解 动态规划
回转寿司链接:回转寿司_美团笔试题_牛客网小美请小团吃回转寿司。转盘上有N盘寿司围成一圈,第1盘与第2盘相邻,第2盘与第3盘相邻,…,第N-1盘与第N盘相邻,第N盘与第1盘相邻。小团认为第i盘寿司的美味值为A[i](可能是负值,如果小团讨厌这盘寿司)。现在,小团要在转盘上选出连续的若干盘寿司,使得这些寿司的美味值之和最大(允许不选任何寿司,此时美味值总和为0)题解思路:题目要求环形数组的连续子数组的最大和,我们先不要去管数组是环形的情况,利用动态规划求解连续子数组的最大和以及.
2022-03-05 17:03:18
564
原创 <数据库> WITH RECURSIVE递归
计算1到100的累加的结果:WITH RECURSIVE t(n) AS ( VALUES (1) UNION ALL SELECT n+1 FROM t WHERE n < 100)SELECT sum(n) FROM t;例题:力扣https://leetcode-cn.com/problems/find-the-missing-ids/
2022-03-05 11:40:14
497
原创 <数据库> LEAD函数的用法 Leetcode 1709. 访问日期之间最大的空档期
对于一张表的一行数据而言,在其之上的是Lag, 在其之下的是Lead+---------+------------+ LAG()------------------------ current_row------------------------ LEAD()+-----------------------+LEAD函数用法:LEAD(col, offset, default)col - 指你要操作的那一列offset - ...
2022-03-04 20:35:45
661
原创 <笔试> 淘汰分数 python题解
我把题目想复杂了,分成了很多种情况讨论,实际非常简单,直接从头到尾扫描,判断是否满足条件即可。题解:n,a,b= map(int,input().split())nums=list(map(int,input().split()))nums.sort()left=a # left用来记录被淘汰的人数i=left-1m=-1while left<=b: right=n-left # right用来记录被录取的人数 if left>=a ...
2022-03-02 21:15:45
649
原创 python set函数 集合的操作
dic=set() # 定义集合dic.add( 1) # 加上1dic.remove( 1) # 移除13. 无重复字符的最长子串https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/
2022-03-01 21:13:59
457
原创 <数据库> Leetcode1511. 消费者下单频率
写一个 SQL 查询,报告在 2020 年 6 月和 7 月 每个月至少花费 $100 的客户的 customer_id 和 customer_name 。以任意顺序返回结果表.查询结果格式如下例所示。# 2020 年 6 月和 7 月 # 每个月至少花费 $100 的客户的 customer_id 和 customer_name select c.customer_id,c.namefrom customers cjoin orders o o...
2022-02-28 21:28:00
541
原创 <数据库> 查找连续登录的用户
MySQL DATE_SUB() 函数 | 菜鸟教MySQL DATE_SUB() 函数 MySQL Date 函数 定义和用法 DATE_SUB() 函数从日期减去指定的时间间隔。 语法 DATE_SUB(date,INTERVAL expr type) date 参数是合法的日期表达式。expr 参数是您希望添加的时间间隔。 type 参数可以是下列值: Type 值 MICROSECOND SECOND MINUTE HOUR DAY WEEK MONTH QUAR..https://..
2022-02-27 19:10:56
314
原创 <数据库> datediff、timestampdiff函数的区别
对日期范围搜索的大致有三种方式:1、between and2、datediff3、timestampdiffbetween andselect * from dat_document where commit_date between '2018-07-01' and '2018-07-04' 结果是1号到3号的数据,因为时间范围显示的实际上只是‘2018-07-01 00:00:00’到'2018-07-04 00:00:00'之间的数据,而'2018-07-04'的数据无
2022-02-26 21:06:19
853
原创 <数据库> last_day() 函数. 返回月份中的最后一天
select last_day('2008-02-01') 返回 2008-02-29select last_day('2008-08-08') 返回2008-08-31得到当前月份中有多少天,可以这样计算:select now(), day(last_day(now()))
2022-02-26 19:49:06
916
原创 <数据库> date_format()转换日期格式
Date_Format()函数用于以不同的格式显示日期时间数据DATE_FORMAT(date,format)中的format参数%a 缩写星期名%b 缩写月名%c 月,数值%D 带有英文前缀的月中的天%d 月的天,数值(00-31)%e 月的天,数值(0-31)%f 微秒%H 小时 (00-23)%h 小时 (01-12)%I 小时 (01-12)%i 分钟,数值(00-59)%j 年的天 (001-366)%k 小时 (0-23...
2022-02-21 19:30:12
1917
原创 <数据库> with as 的用法
WITH AS短语,也叫做子查询部分,是用来定义一个SQL片断,该SQL片断会被整个SQL语句所用到。例子:with A as (select * from class)先执行select * from class 得到一个结果,将这个结果记录为A ,再执行select *from A 语句。A 表只是一个别名。也就是将重复用到的大批量 的SQL语句,放到with as 中,加一个别名,在后面用到的时候就可以直接用。对于大批量的SQL数据,起到优化的作用。...
2022-02-20 19:34:43
2234
原创 python散列表 collections.Counter用法
获得nums的散列表ct = collections.Counter(nums)for key in ct:print(key) #key是元素print(ct[key]) #ct[key]是频率
2022-02-11 15:40:29
687
原创 <数据库> 牛客SQL35 浙大不同难度题目的正确率
描述题目:现在运营想要了解浙江大学的用户在不同难度题目下答题的正确率情况,请取出相应数据,并按照准确率升序输出。示例:user_profile示例: question_practice_detail示例:question_detail根据示例,你的查询应返回以下结果:我的代码:题解代码:...
2022-01-27 11:45:45
542
原创 <数据库> 牛客SQL34 统计复旦用户8月练题情况
描述题目: 现在运营想要了解复旦大学的每个用户在8月份练习的总题目数和回答正确的题目数情况,请取出相应明细数据,对于在8月份没有练习过的用户,答题数结果返回0.示例:用户信息表user_profile根据示例,你的查询应返回以下结果:SELECT u.device_id, university, SUM(IF(result IS NOT NULL, 1, 0)) AS questino_cnt, SUM(IF(result = "...
2022-01-27 11:12:14
1232
原创 <数据库> 牛客SQL29 计算用户的平均次日留存率
描述题目:现在运营想要查看用户在某天刷题后第二天还会再来刷题的平均概率。请你取出相应数据。示例:question_practice_detail根据示例,你的查询应返回以下结果:思路是:1. 需要知道两天都上线的人数2. 需要知道第一天上线的人数做法:1. 用datediff区分第一天和第二天在线的device_id2. 用left outer join做自表联结3. 用distinct q2.device_id,q2.date做双重去重,找到
2022-01-27 10:21:30
1334
原创 <数据库> 牛客SQL28 对日期的处理
SQL28计算用户8月每天的练题数量描述题目:现在运营想要计算出2021年8月每天用户练习题目的数量,请取出相应数据。示例:question_practice_detail根据示例,你的查询应返回以下结果:select day(date) as day, count(question_id) as question_cntfrom question_practice_detailwhere date>='2021-08-01' ...
2022-01-26 22:40:53
336
原创 <数据库> 牛客SQL25 union all的使用
描述题目:现在运营想要分别查看学校为山东大学或者性别为男性的用户的device_id、gender、age和gpa数据,请取出相应结果,结果不去重。示例:user_profile根据示例,你的查询应返回以下结果(注意输出的顺序,先输出学校为山东大学再输出性别为男生的信息):错误写法:SELECT device_id,gender,age,gpafrom user_profilewhere university='山东大学' or gender='male'
2022-01-26 22:21:26
833
原创 python for循环实现从大到小
大的数字要写在小的数字前面,并且在后面加上-1for i in range(大的数字,小的数字,-1)例如:for i in range(5,1,-1): print(i)输出的是:5 4 3 2
2022-01-23 13:26:28
8671
原创 在ipython notebook中使用argparse方式
https://www.jb51.net/article/185044.htmparser = argparse.ArgumentParser()parser.add_argument("--verbosity", help="increase output verbosity")args = parser.parse_args(args=[])print(args)
2022-01-05 19:33:30
576
原创 c++ 类成员函数&全局函数的区别和转化
区别:类成员函数 :面向对象全局函数 :面向过程转换:类成员函数 ——> 全局函数 :增加一个参数,增加的这个参数是代替this指针的全局函数 ——> 类成员函数 :减少一个参数,减少的这个参数通过this指针隐藏原文链接:类成员函数和全局函数_洋羽翔_hisen-优快云博客_成员函数和全局函数的区别...
2021-12-24 21:23:56
976
原创 C++ 内存分区
C++程序在执行时,将内存大方向划分为4个区域代码区:存放函数体的二进制代码,由操作系统进行管理的 全局区:存放全局变量和静态变量以及常量 栈区:由编译器自动分配释放, 存放函数的参数值,局部变量等 堆区:由程序员分配和释放,若程序员不释放,程序结束时由操作系统回收内存四区意义:不同区域存放的数据,赋予不同的生命周期, 给我们更大的灵活编程1程序运行前 在程序编译后,生成了exe可执行程序,未执行该程序前分为两个区域 代码区: 存放 CPU 执行的机器指令.
2021-12-24 09:48:02
103
原创 Mac用Visual Studio Code编写C/C++安装配置教程
【文字版】Mac用Visual Studio Code编写C/C++教程 - 哔哩哔哩Mac用Visual Studio Code编写C/C++ 苹果电脑VS Code快速编写C/C++教程_哔哩哔哩_bilibili
2021-12-20 19:19:44
3715
原创 Python numpy.prod()函数
numpy.prod( )是连乘操作,将里面所有的元素相乘。import numpy as npa = np.array([1,2,3,4])# 将a中的所有元素进行连乘np.prod(a) = 24# 取出a[2] 也就是3ny.prod(a[2:3]) = 3# 取出 a[1]和 a[2]进行连乘 也就是2*3ny.prod(a[1:3]) = 6...
2021-12-14 16:54:25
5275
原创 Kaggle API下载与安装
1.下载pip install kaggle2.下载api码account中找到api,点这个下载kaggle.json3.将kaggle.json放在 .kaggle 目录下cp kaggle.json /Users/用户名/.kaggle4.列出关于xxx的所有比赛kaggle competitions list -s xxx5.下载 比赛名称 下的Data中所有文件,并指定下载路径kaggle competitions download.
2021-12-08 11:27:13
1408
原创 按照条件筛选DataFrame的某一列,对另一列赋值
条件:a>0 or b>0 and c=='1'将满足条件的d列赋值为1df.loc[((df.a>0) | (df.b> 0)) & (df.c == '1'), 'd'] = 1
2021-11-30 10:48:39
2969
原创 <爬虫> 通过selenium爬取历史电力数据
网址:Sonnagh, Ireland Weather History | Weather Underground观察通过观察发现,不同日期的数据网址的末尾有差别。例如,2019年11月1号和2号的数据网址分别如下:https://www.wunderground.com/history/daily/ie/sonnagh/EIKN/date/2019-11-1https://www.wunderground.com/history/daily/ie/sonnagh/EIKN/date/
2021-11-24 14:26:57
1538
原创 <爬虫> requests和selenium的区别 / 为什么有的网站数据requests爬不下来
有的网页中的信息需要执行js才能显现通过requests只能爬取原网页代码 通过selenium才可以爬取执行 js后的网页数据,实现“所见即所得”注意:要等网页加载完selenium才能爬取成功 否则也无法爬出数据Selenium 的缺点:速度慢。每次运行爬虫都打开一个浏览器,如果没有设置,还会加载图片、JS等等一大堆东西。 占用资源太多。 对网络的要求会更高。 Selenium 加载了很多可能对您没有价值的补充文件(如css,js和图像文件)。 与仅仅请求您真正需.
2021-11-24 14:11:42
3453
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人