
python
刘娟娟❤PRESSone
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
如何批量添加中文和英文数字之间的空格?用正则表达式吧
1、中文与英文数字混合使用,排版有规范写作中,我们经常遇到以下中文与英文、数字混用的情况。我自学python编程,是在xue.cn上进行的。时耗方面,基础功仅需50多小时,加上很多实战,包括初步运用pandas和爬虫处理业务需求,加在一起也才200多小时而已。其实,中文和数字、英文之间有一个空格会更美观。我自学 python 编程,是在 xue.cn 上进行的。时耗方面,基础功仅需 ...原创 2019-11-27 20:12:14 · 3651 阅读 · 1 评论 -
grafana 连接mysql 和 postgresql,如何查看数据库所有表格及表格字段?
以 grafana 连接以上不同数据源,mysql 和 postgresql 的处理不同。这是基础操作,简单整理如下。查看数据库的所有表格:--mysqlshow tables;--postgresqlselect * from pg_tables;查看某个表格的所有字段:--mysqldescribe tablename;--postgresqlselect * fro...原创 2019-11-20 10:53:12 · 3125 阅读 · 0 评论 -
刷题翻车:python 布尔运算操作符的优先级
前两天在 xue.cn 体验答题挑战,我有道题做错了,却不明白错在哪里。题目大概如下,代码运行后将打印什么?if True or False and False: print('1')else: print('2')这个题目考察两个简单的知识点,一个是布尔运算,另一个是流程控制语句。结果是 1,我则选了2。复盘我的解题思路。先是布尔运算部分,我把 True or Fals...原创 2019-11-10 15:16:43 · 1182 阅读 · 0 评论 -
和35岁刘阿姨一起自测 Python 流程控制基本功
0、突然降临的困惑流程控制语句、布尔值、布尔值操作符都属于 python 的基础功。大好周末我写这篇笔记,不是为了整理这些基础知识点,而是记录几个令我突然迷惑的代码段。——代码本身很简单,但即便已经掌握了基础功,陡然看到其中某个代码段,编程初学者还是容易困惑!你,要不要随我一起读完全文,检查下自己是否牢牢掌握了 python 的流程控制语句?现在开始吧。1、流程控制语句之 if 分支控制1...原创 2019-11-10 13:29:26 · 255 阅读 · 0 评论 -
闯缸鱼:看懂python如何实现整数加和,再决定是否自学编程
玩鱼缸的新手都知道有一种鱼叫“闯缸鱼”,皮实好养,帮助新手判断鱼缸环境是否准备好。这篇笔记,最初用来解答一个编程新手的疑问,后来我发现,整理一下也可当做有兴趣自学python 编程朋友们的“闯缸鱼”。看懂本文,再决定要不要自学 python 编程吧!想要实现需求与写代码的环境你想用 python 实现整数加和。这个需求是如何产生的,已经不再重要。你只想知道 python 代码是如何实现这个需...原创 2019-11-09 18:04:58 · 352 阅读 · 0 评论 -
Github进行fork后如何与原仓库同步
实在是……有太多人同时在帮忙修订错别字或优化 xiaolai 的 the-craft-of-selfteaching 了。如果你提交的 pull request 未被接受且得到回复说:“重新fork”,其实是你遇到一个问题:在你 fork 之后, xiaolai 的仓库又更新了;但 github 不会自动帮你把 xiaolai 的仓库 同步给你 fork 后的仓库;导致你提交 pull ...原创 2019-11-01 11:03:51 · 492 阅读 · 0 评论 -
告别硬编码,mysql 如何实现按某字段的不同取值进行统计
上周我突然意识到,我在grafana上写的 sql 语句存在多处硬编码。这篇笔记将记录如何实现没有硬编码的sql语句,以及自学编程过程中如何应对自己的笨拙代码和难题不断的状况。1、有效但粗笨的硬编码所谓硬编码,大意是指代码中出现很多具体的取值,每个取值都是手动赋值的。比如:-- 达成某个成就的用户数select count(user_id) as 用户数from ach...原创 2019-10-24 21:33:05 · 410 阅读 · 1 评论 -
mysql 数据分析如何实现日报、周报、月报和年报?
以天为统计周期,是常见需求。周报、月报更是常见需求。长周期项目,甚至有年报需求。我已经掌握了mysql中按天统计,如何实现按年、按月、按周统计呢?1、已掌握的技能:按天统计实现以天为统计周期很简单。具体来说,date() 函数可返回时间数据的日期,即仅有年月日,没有时分秒信息。结合 group by 可实现按天统计。以天为统计周期的数据指标非常多,随便举例,比如每日新增注册用户数。sele...原创 2019-10-24 12:18:00 · 3122 阅读 · 0 评论 -
数据分析师如何自力更生统计用户行为频次?
不懂数据分析的 growth hacker 不是好运营。近日我想要统计我家产品 xue.cn 用户的编程自学行为的频次,且在不给技术开发部门带来任何新需求的情况下自力更生。那么,我该如何定义并统计这个数据指标呢?1、定义学习这个行为。某些行为是单个事件,某些行为是多种事件的组合。xue.cn 用户的编程自学行为包括:完成某书一个章节的阅读、完成一道习题、获得一个成就、提交一次评论,完成一次心...原创 2019-10-24 09:00:02 · 463 阅读 · 0 评论 -
小结 python 实战中遇到的几种需要化名的情境
笑来在《自学是门手艺》的《2.4.3 化名与匿名》中,讲到了函数的化名。经过几个月的实战,我发现,实际上化名无处不在。我有时也会称之为“别称”,意思一样。函数化名只是化名的一种应用场景,还有好几种使用化名的地方,本篇笔记将整理小结我所遇到的各种化名。情境A:导入时化名导入其它模块时,直接化名为简约版,是我相当常用的,甚至有一些业界约定俗成的化名。无论是模块,模块中的函数或变量,都可以此种方式化...原创 2019-10-16 17:07:10 · 222 阅读 · 0 评论 -
能写数据后台,需要掌握哪些进阶的sql语句?
国庆假期花了一些时间,首次尝试并玩转 grafana,这几天继续不断优化和完善,如今看着自己的成果,相当满意。——逐步接近我想要的理想后台啦。需求是不停歇的。今天我又给自己发掘了一些新需求,比如变量、筛选框之类,都收集下来等有空继续玩。编程学习的过程中,对于自己尚未尝试的新技能点,本能直觉会感到困难,但动手经验告诉我:莫慌,用起来就懂了,瞧我自己每次都能很快上手吖。——善于让自己在学习的过程中感...原创 2019-10-15 17:07:28 · 592 阅读 · 0 评论 -
24H玩转 Grafana 被工程师称相当专业,如何做到?
国庆假期发生了两件小事,其一是我默默度过 35 周岁生日,其二是玩了下grafana `并在节后第一天被工程师 M 称赞:相当专业。1、我为什么要玩 grafana 呢?数月前我提交了一份数据后台需求给工程师 M,他选用和部署了 grafana 这个第三方开源的工具,仅用两三天就完成了这份需求。这效率相当快,令我对 M 和 grafana 印象深刻。但我仍不满足,M提交的成品所有数据都图形化的...原创 2019-10-09 12:25:30 · 237 阅读 · 0 评论 -
整理总结 python 中时间日期类数据处理与类型转换(含 pandas)
我自学 python 编程并付诸实战,迄今三个月。 pandas可能是我最高频使用的库,基于它的易学、实用,我也非常建议朋友们去尝试它。——尤其当你本身不是程序员,但多少跟表格或数据打点交道时,pandas 比 excel 的 VBA 简单优雅多了。pandas 善于处理表格类数据,而我日常接触的数据天然带有时间日期属性,比如用户行为日志、爬虫爬取到的内容文本等。于是,使用 pandas 也就意...原创 2019-09-28 16:25:45 · 3414 阅读 · 0 评论 -
【呕心总结】python如何与mysql实现交互及常用sql语句
【呕心总结】python如何与mysql实现交互及常用sql语句9 月初,我对 python 爬虫 燃起兴趣,但爬取到的数据多通道实时同步读写用文件并不方便,于是开始用起mysql。这篇笔记,我将整理近一个月的实战中最常用到的 mysql 语句,同时也将涉及到如何在python3中与 mysql 实现数据交换。关于工具/库,特别说明下:1、我安装了 mysql ,并直接采用管理员身份运行命令...原创 2019-09-27 21:37:38 · 608 阅读 · 0 评论 -
python 字符串替换功能 string.replace()可以用正则表达式,更优雅
说起来不怕人笑话,我今天才发现,python 中的字符串替换操作,也就是 string.replace() 是可以用正则表达式的。之前,我的代码写法如下,粗笨:自从发现了正则表达式也生效后,代码变得优雅简洁:备注:上图中的base_info 是 pandas 里的 dataframe 数据结构,可以用上述方法使用 string 的 replace 方法。...原创 2019-09-12 17:39:58 · 20342 阅读 · 3 评论 -
用 python 写个小爬虫监控某人的 优快云 文章数据
用 python / pandas + mysql 写了一个简单的小爬虫,用来爬取 我的 csdn 文章基本数据。python代码如下。如果不用 mysql,把文件读写的部分改成 pandas 的 read_csv / to_csv 也OK。如果想监控某大佬,或某一组 csdn id 的数据,也可以这么干。不过需要在此基础上简单加工下。如果想要持续采集数据,定时执行,可以用到操作系统自带的计划...原创 2019-09-11 15:18:32 · 322 阅读 · 1 评论 -
pandas.to_sql()失败,遇到 pandas.io.sql.DatabaseError:1146 提示表格不存在的解决办法
在写我的爬虫脚本 csdn_my_article 时,遇到一处报错:pandas.io.sql.DatabaseError: Execution failed on sql ‘select * from csdn_my_article;’: (1146, “Table ‘zhihuclawer.csdn_my_article’ doesn’t exist”)相关的代码是:pd.io....原创 2019-09-11 14:54:00 · 8849 阅读 · 0 评论 -
windows 10 如何设定计划任务自动执行 python 脚本?
我用 python 写了一些脚本,有一些是爬虫脚本,比如爬取知乎特定话题的热门问题,有一些是定期的统计分析脚本,输出统计结果到文档中。之前我都是手动执行这些脚本,现在我希望如何这些脚本能自动定时执行。那么,windows 10 操作系统如何定时自动执行 python 脚本?我的设备是 windows 10操作系统,自带的“计划任务”可以满足我的需求,具体操作步骤,整理如下。步骤1:打开 “计算...原创 2019-09-11 12:28:23 · 1627 阅读 · 0 评论 -
pandas数据分析输出excel产生文本形式存储的百分比数据,如何处理?
关键词:python、pandas、to_excel、文本形式存储的数据需求描述:我用 python pandas 写了数据统计与分析脚本,并把计算结果用 pandas 的 to_excel() 存入到 excel 表格提交给团队。但遇到一个问题:当我的老板和同事们打开 excel 文件时,发现百分比数值无法正常显示,提示为“文本形式存储的数据”。想让此类百分比数值正常显示,我该怎么办呢...原创 2019-09-10 18:33:33 · 3890 阅读 · 2 评论