自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(306)
  • 收藏
  • 关注

原创 metabase权限管理

需求:基于DA、PM、SEM进行分组权限管理,涉及的管理对象有两个方面:DATA。

2025-08-27 09:57:13 207

原创 用户人群属性标签创建

【代码】用户人群属性标签创建。

2025-08-25 11:31:59 303

原创 如何每日动态获取沉默流失名单

参考:deepseek:https://chat.deepseek.com/a/chat/s/5eef5a36-5aab-490b-a1b2-58c2329d61bb。

2025-08-18 16:52:46 200

原创 生成日期范围内的日期列表

【代码】生成日期范围内的日期列表。

2025-08-06 12:19:27 210

原创 mysql终止当前正在执行的sql语句

【代码】mysql终止当前正在执行的sql语句。

2025-08-01 15:36:48 183

原创 SQL多字段排序,你学废了吗

【代码】SQL多字段排序,你学废了吗。

2025-04-23 15:43:32 139

原创 数据开发-字段加工 202503

【代码】数据开发-字段加工 202503。

2025-03-12 18:09:40 196

原创 sql模糊关联匹配

注意事项:性能影响:使用 REGEXP 通常会比 LIKE 产生更大的性能开销,特别是在处理大数据集时。因为 REGEXP 需要更复杂的模式匹配,而 MySQL 对 REGEXP 的优化能力相对较弱,可能无法像 LIKE 那样利用索引进行优化。

2025-01-13 17:28:27 452

原创 截止到上个季度的时间范围的两种写法

【代码】截止到上个季度的时间范围的两种写法。

2024-11-08 16:38:45 455

原创 时间段切块算法

根据给定的开始时间、结束时间和时间间隔,生成一系列时间周期,每个时间周期由开始时间和结束时间组成,这些时间周期可以用于在特定时间段内进行按一定间隔的任务划分或数据处。时间区间的切分,可以用于循环获取数据;

2024-09-03 14:41:14 416

原创 Python变量未赋值错误之程序优化示例

将可能出现异常的部分单独封装成一个函数,在这个函数中处理异常并返回合适的值,然后在main函数中调用这个函数来获取结果,这样可以使代码结构更清晰,也更容易处理错误情况。在except块中,可以给respon1赋一个默认值,比如None,这样在出现异常时,函数也能有一个明确的返回值,而不会因为找不到respon1的赋值而报错。

2024-09-02 15:36:46 468

原创 当待合并的两个字段出现缺失的时候,如何构建新字段

【代码】当待合并的两个字段出现缺失的时候,如何构建新字段。

2024-08-23 16:07:12 165

原创 np.where 结合pandas使用

需求:test数据框中的广告来源和媒介两列的值来生成新的列来源媒介。如果广告来源为NaN,则新列也为NaN;如果媒介为NaN,新列的值为广告来源加上/;如果两列都有值,新列的值为广告来源加上/再加上媒介。结合pandas使用:np.where可以方便地在pandas数据框中进行条件判断和值的赋值操作,根据不同的条件生成新的列值或修改现有列的值。np.where函数在数据分析和处理中非常有用,可以快速地根据条件进行数据的筛选和转换。

2024-08-23 15:39:49 536

原创 解决DatabaseError 错误

报错:DatabaseError: Execution failed on sql ‘SELECT name FROM sqlite_master WHERE type=‘table’ AND name=?使用to_sql方法,需要用create_engine, 而不是pymysql.connect,否则就会报如下错误DatabaseError,

2024-08-23 15:21:23 813

原创 ProgrammingError: nan can not be used with MySQL,怎么处理?

NSERT INTO 解决一切格式数据库入库问题, 但是np.NAN 不行,所以考虑可以将 np.NAN,替换成别的值,比如999,‘’, ‘nan’, ‘none’ 都可以,如果想输入到mysql仍然为 (NULL)显示,则需要先将df 转成列表,将值替换成 none。

2024-08-23 15:15:53 955

原创 python 操作gsheet 实现读写操作脚本实战

【代码】python 操作gsheet 实现读写操作脚本实战。

2024-07-13 01:32:55 465

原创 连接mysql数据库-plus

【代码】连接mysql数据库-plus。

2024-07-12 16:15:59 224

原创 下午报数PLUS版本-2024-07-12

【代码】下午报数PLUS版本-2024-07-12。

2024-07-12 15:00:26 225

原创 cookies放请求头还是请求体?

【代码】cookies放请求头还是请求体?

2024-04-25 16:43:00 634

原创 json.dumps: dict ——> str

STEP2 : 参数提取,给我全部整成斜杠了,我去。STEP3 : 构建时间变量参数。STEP4 : 正确示范。

2024-04-24 19:28:13 339

原创 红包参与领取、活跃用户等相关9题

(为什么会出现“已领取红包,但未登录的情况”,因为在现实的数据中,数据上报无法做到十分准确,这种其实是BUG数据。备注:日志流水表,每一行为领取1次红包。无特殊说明,一般不考虑领取红包但当日未登录的情况。备注:一个用户1天只出现1次,出现即表示当日登陆。

2024-02-19 17:33:22 616 1

原创 Mysql构造临时维度表

解决方案:构建双维度。

2024-01-29 15:00:11 599

原创 使用Matplotlib绘制双柱状图

【代码】使用Matplotlib绘制双柱状图。

2024-01-24 15:29:22 890

原创 格式化日期表头

原理:函数内部使用datetime.strptime()将日期表头字符串转换为日期对象,然后使用date_obj.strftime()将日期对象格式化为指定格式的字符串。

2024-01-24 14:21:16 438

原创 metabase filter

除“字段过滤器”之外的所有变量类型都会自动导致在此问题上放置过滤器小部件;然后,您可以选择在您的问题上显示过滤器小部件,但即使不这样做,您现在也可以在将此问题添加到仪表板时将字段过滤器变量映射到仪表板过滤器。为变量提供“字段过滤器”类型允许您将问题链接到仪表板过滤器小部件或在 SQL 问题上使用更多类型的过滤器小部件。字段过滤器变量插入的 SQL 类似于在现有列上添加过滤器时由 GUI 查询生成器生成的 SQL。本机查询中的变量允许您使用过滤器小部件或通过 URL 动态替换查询中的值。

2023-12-19 12:29:41 996

原创 对于技术人员实力的判断

俗话说“文无第一,武无第二”,技术就是一种“文”的能力,很多时候我们很难直观看出一个技术人员的实力,但不管是公司招聘的面试,还是公司内部的晋升面评,都需要在较短时间内快速判断一个技术人员的实力。得益于工作岗位的关系,我在考核技术人员的实力时积累了较丰富的经验(包括踩坑的经验)。首先是招聘,前后面试了几百个人吧,技术范围包括服务器、android、iOS、前端,既包括初出茅庐的应届生,也包括腾讯的 T4 大牛;

2023-12-07 17:44:18 327

原创 pymysql.err.InternalError: (1054, “Unknown column ‘nan‘ in ‘field list‘“

记录在本地环境通过,然后在云环境,解决问题的过程;

2023-12-06 19:14:23 759

原创 ProgrammingError: nan can not be used with MySQL

【代码】ProgrammingError: nan can not be used with MySQL。

2023-11-30 16:25:04 1735

原创 DataFrame.empty 与 DataFrame is None 的区别是?

总结来说,DataFrame.empty用于检查DataFrame对象是否为空,而DataFrame is None用于检查DataFrame对象是否为None对象。在上述示例中,由于DataFrame对象df被显式设置为None,因此df is None为True,输出结果为"DataFrame为None"。在上述示例中,由于DataFrame对象df不包含任何数据,因此df.empty为True,输出结果为"DataFrame为空"。请注意,empty 与 None 是不同的概念,这个要注意。

2023-11-17 11:05:40 1475

原创 傻傻分不清 “json.dump()、 json.dumps()、 json.loads() 、 json.load()“的区别?

json.dump():将Python对象序列化为JSON格式的数据并将其写入文件。它接受两个参数:要序列化的Python对象和要写入的文件对象。示例用法:json.dump(obj, file)。json.dumps():将Python对象序列化为JSON格式的字符串。它接受一个参数:要序列化的Python对象。示例用法:json.dumps(obj)。json.load():从文件中读取JSON格式的数据并将其反序列化为Python对象。它接受一个参数:要读取的文件对象。

2023-11-09 15:19:23 1007

原创 【常用总结】用Python对数据结构进行个性化过滤操作

【代码】【常用总结】用Python对数据结构进行个性化过滤操作。

2023-11-08 15:28:42 197

原创 【重磅】Cookies、headers、Session规律总结,搞定卡点

【重磅】Cookies规律总结,搞定卡点。放在请求头headers中。

2023-11-04 22:43:39 973

原创 【实用】得到三个动态时间点作为分界点

因为周报需要对比上周,所以现在有一个需求,动态生成上周周一的时间点,类似 ‘2023-10-23 00:00:00’ 并将值赋予给time2变量,将time2 减去7天,得到的时间点赋值给time1,将time2 减去7天,得到的时间点赋值给time3,得到三个动态时间点作为分界点;

2023-11-03 15:53:13 169

原创 ConnectionError: HTTPSConnectionPool

连接不上url ,chatcpt 第一步就告诉我了,折腾了大半个下午,惭愧!

2023-11-02 18:24:25 1768

原创 Xpath定位元素(3)

【代码】Xpath定位元素(3)

2023-11-01 18:24:50 180

原创 通过Xpath解析尝试多种方法提取文本

【代码】通过Xpath解析尝试多种方法提取文本。

2023-11-01 17:38:51 1980

原创 Xpath解析小案例

【代码】Xpath解析小案例。

2023-11-01 17:00:33 119

原创 Xpath解析实战

【代码】Xpath解析实战。

2023-11-01 16:47:45 140

原创 教你用BeautifulSoup实现数据解析,并爬取豆瓣TOP250电影榜

这三个库的详细用法,请看我的其他视频课程。

2023-10-31 11:39:14 805

原创 索引切片复习

【代码】索引切片复习。

2023-10-31 11:14:08 109

5分钟使用Python爬取豆瓣TOP250电影榜

使用requests爬取网页 使用BeautifulSoup实现数据解析 借助pandas将数据写出到Excel

2023-10-31

PART5 机器学习分类算法之决策树.ipynb

PART5 机器学习分类算法之决策树.ipynb

2022-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除