- 博客(37)
- 收藏
- 关注
原创 Python自动化:打工人黑科技,无需代码无需编程,EXE软件轻松搞定文件管理难题,自动化文件管理系统,速来解锁高效办公新姿势!
这个开源的资料管理软件EXE功能强大,界面简洁,操作方便。以下是它的主要功能:项目管理:可以轻松创建新项目,并为每个项目设置独立的文件存放位置。文件分类:支持自定义文件夹,方便对文件进行分类管理。快速搜索:强大的搜索功能,能快速找到所需的文件。一键恢复默认:如果文件管理变得混乱,可以一键恢复到默认设置。多平台支持:适用于Windows、Mac和Linux等多个操作系统。
2025-03-29 15:32:03
355
原创 Python自动化:Excel表格一对多匹配终极解决方案,从多个表找到匹配数据写到一个表中,30秒完成人工3天的工作量!
通过以上步骤,我们成功地用Python解决了小李的Excel表格匹配难题。Python的强大之处在于,它能够快速地处理复杂的数据匹配和提取任务,不仅效率高,而且准确率也高。相比手工操作,Python自动化办公让小李的工作变得轻松又高效。如果你也在工作中遇到了类似的Excel难题,不妨试试用Python来解决。关注我们的微信公众号,我们将为你带来更多实用的Python自动化办公技巧,让你的工作事半功倍!
2025-03-27 13:47:06
907
原创 Python自动化:轻松解决Excel表格差异对比难题,告别手工核对的烦恼!
我们有一个专门的技术社区群,在这个群里有很多像这样热心的技术大佬,大家分享着各种实用的Python自动化办公代码和技巧。如果你也想让自己的办公变得更加轻松高效,欢迎加入我们的社区群,和其他打工人一起探索Python自动化办公的奇妙世界。
2025-03-15 14:40:37
486
原创 Python自动化:几分钟搞定数万张图片处理,完成美工一周工作量
Python作为一种强大的编程语言,在自动化办公领域有着广泛的应用。无论是数据处理、文件操作还是图像处理,Python都能轻松应对。在这个信息爆炸的时代,掌握Python自动化办公技能,无疑会让我们在工作中更加得心应手,事半功倍。
2025-03-13 11:51:00
253
原创 四步成诗:搭建数据运营指标体系
“数据”本身只是工具,而运营和业务才是重点。“数据化运营”能力,就像逻辑思考与沟通表达一样,是当下每个互联网人都应当具备的思维能力,帮助我们摒弃“拍脑袋”做决策的习惯,能够有理有据地去解决业务问题。不同岗位职责不同,但万变不离其宗,本质上大家关注的都是获客、留存、营收,围绕数据观测指标,然后进行业务分析,再以此完成各种运营动作,其核心路径可总结为:设定指标 → 分析洞察 → 运营策略,其中指标体系就是业务的逻辑框架也是思考业务逻辑的第一步。
2025-03-13 11:43:56
916
原创 大数据——何谓“大”
“互联网”“大数据”“人工智能”你可能在无数篇文献中都看到过这三个词,这三个词的顺序其实是不能颠倒的。互联网、大数据、人工智能的关系:互联网产生了大量数据,使用大数据技术进行存储+计算,并对人工智能提供支撑。在互联网时代,我们都能上网,而只要上网就会产生大量数据。
2025-03-13 11:28:24
416
原创 如何用“金字塔原理”撰写数据运营分析报告
数据分析报告,顾名思义是将运营过程中发生的各种业务场景合理地组织起来,合理的呈现出来。根据业务发生的时间又可以分为总结型、决策型、规划型。数据分析报告是根据数据分析原理和方法,运用数据来反映、研究和分析事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体。
2025-03-12 16:53:51
695
原创 业务数据分析极简通用方法论
看完本篇文章,相信你现在遇到问题,很快就能组织出分析思路。简单来说,你只要解决以下 5 个问题就可以了,它们分别是:要解决的问题是什么?为什么要分析这个问题?问题的表面原因是什么?问题的根本原因是什么?要解决问题该怎么办?
2025-03-12 16:30:43
996
原创 从0到1构建业务分析模型
众所周知,数据分析是一门注重业务经验的学科,数据分析师的最核心能力是如何将业务问题转化为数据分析问题,本篇文章从实际业务出发,立足具体案例,总结一些实用的数据分析模型
2025-03-12 14:31:53
352
原创 目标思维——数据分析源自问题,高于问题
最重要的,目标思维还能让你更有钱。哈佛大学曾做过一次研究,毕业生中只有不到百分之三的学生对未来有清楚明确的目标。二十年后,这百分之三的学生更成功,也更快乐。而且,这百分之三的人的财富总和,居然大于另外百分之九十七的所有学生的财富总和,而这就是目标的力量。几乎所有的事,搞清楚目标之后,做起来的难度就会直线下降。
2025-03-12 14:28:26
803
原创 数据运营:如何从零搭建数据运营体系
数据运营从传统运营发展而来的,主要的区别在于数据运营是利用数据驱动,通过数据做好运营监控、原因排查、策略执行等一系列的运营动作,响应速度和迭代效率相比传统运营更高。数据化运营体系就是做数据化运营的数据支持和流程方法。不同的运营方向都可以做数据化运营,比如渠道运营可以建设渠道运营的数据运营体系,用户运营可以建设用户运营的数据运营体系。
2025-03-12 14:13:38
543
原创 一文搞定推荐系统及算法
近年来,深度学习技术的快速发展,大大加速了人工智能在传统和互联网领域的商业化落地。现如今,人工智能的应用已如雨后春笋般渗透到我们衣食住行的方方面面。比如无人超市的面世、无人驾驶汽车的正式上路、智能手机刷脸识别模式、医疗图像技术等。与此同时,面对时间的碎片化、信息的同质化/海量化、用户选择项的增多和用户耐心的减退,如何满足用户需求、拓展用户需求、驱动业务增长、优化行业生态等,成了各个行业亟待解决的问题。因此,个性化推荐系统便应运而生了。
2025-03-12 14:08:45
1391
原创 Python自动化:批量提取PDF中的表格到Excel,代码几秒钟等于手动劳动3000分钟
这个案例展示了Python自动化办公技术的强大潜力。它不仅能够解决特定的问题,还能够广泛应用于各种办公自动化场景,提升工作效率,释放人力。拥抱Python自动化办公,让我们的工作更加智能、高效。
2025-03-12 13:54:27
237
原创 Python自动化:一键截图Excel全表,告别屏幕限制,秒杀微信截图,几秒钟完成数周工作量,效率飙升的秘密武器!汇报总结的利器
随着微信的普及,越来越多的工作汇报被转移到微信上来,但是微信对文件的支持相对较差,尤其是手机微信很难完成Excel表格的编辑的完整查看,而工作中Excel表格的分享与汇报尤为重要和频繁,为了解决这一矛盾微信截图成为重要手段。然而,传统的截图方式在处理大型表格或多工作表时显得力不从心。本文将介绍如何利用Python自动化技术,轻松实现Excel表格整表截图,彻底告别繁琐的手动截图,让工作效率飙升!
2025-03-08 09:20:06
385
原创 AI降维打击!PPT界王炸,DeepSeek+Kimi3分钟出百页神稿,菜鸟也能做出百万级提案,炸裂职场圈!摸鱼时间暴涨300%
在这个快节奏的职场中,时间就是金钱。制作一份高质量的PPT往往需要耗费大量的时间和精力,但有了DeepSeek和Kimi的“王炸组合”,这一切都变得轻松起来。从明确需求到生成大纲,再到一键生成高颜值PPT,整个过程只需一杯咖啡的时间。如果你还在为制作PPT而烦恼,不妨试试这个“王炸组合”。它不仅能节省你的时间,还能提升你的工作效率,让你在职场中脱颖而出。别再让PPT成为你的负担,用对工具,轻松搞定!
2025-03-08 09:13:29
695
原创 HR是如何提前预知我的离职倾向的——UEBA,基于Python实现的行为异常检测
UEBA是大数据分析、机器学习、人工智能技术在网络安全和内部管理方面应用的典型体现,本文用python实现其中基线分析与对等组分析这两大最核心的技术,当然这只是UEBA的冰山一角。
2025-03-06 17:12:22
420
原创 遗传算法解决最优化问题——基于python实现
最优化理论与算法是一个重要的数据分支,也可以认为是运筹学。涵盖线性规划、非线性规划、整数规划、组合规划、图论、网络流、决策分析、排队论、可靠性数学理论、仓储库存论、物流论、博弈论、搜索论和模拟等分支,它所解决的问题是如何在众多的方案中找出最优方案。比如:工业设计中如何选择设计参数,使得设计方案既能满足要求又能降低成本;资源分配中,如何分配有限资源,既能满足需求又能得到最大的经济效益。
2025-03-06 17:08:39
383
原创 Easy ABTest
原则二:在做实验的时候要选择不同类型城市(一般公司都会有一个城市分级,会依据城市的不同属性分为一级二级三级城市等等,不同的公司分级标准不同,使用自己公司的分级标准即可),实验策略可能对不同类型的城市有不同效果,需要通过选择不同类城市,使实验具有普适性。在样本量足够大的,p 值就会趋近于0,任何策略都在统计学意义上是显著的。通过计算得出,z=1.34,小于图中的 1.96,没有落到拒绝域中,因此我们不能拒绝原假设,那么我们可以得出结论,这个产品经理的功能改版 95% 的可能性来说,是没有提升 DAU 的。
2025-03-06 17:00:38
684
原创 什么是大数据——史上最全大数据理论解析
在大数据、云计算、移动互联网、物联网、人工智能大行其道的当下,街头巷尾听到最多的名词就是大数据了,但你真的理解大数据吗?大数据到底是什么?如果此时你心里只有“量大”这一个答案,那请耐心读完本文,我将用一张技能图谱、两个基础条件、三个工作方向、四个基本特点、五个里程碑、六个工作环节以及大数据时代需要具备的思维方式,让你能在别人面前高逼格的谈大数据
2025-03-05 11:28:51
538
原创 一套实用的时间序列数据异常检测算法
异常检测的场景很多,例如:硬件的故障检测、流量的异常点的检测等场景。针对时间序列类数据的异常检测算法也有很多,业界比较流行的比如普通的统计学习方法--3σ原则和箱线图识别数据离群点,它利用检测点偏移量来检测出异常。比如普通的回归方法,用曲线拟合方法来检测新的节点和拟合曲线的偏离程度,还有人将CNN 和 RNN 技术应用到异常点的检测,但笔者通过大量的实践经验发现以上做法要么识别效果较差【比如:统计学习方法、回归方法】,要么部署难度较大【比如:RNN、CNN等】。
2025-03-05 10:38:45
750
原创 DeepSeek爆火背后,你得了解的深度学习NLP预处理技术-WordEmbeding,Elmo,transform,GPT,BERT
自然语言处理一直被誉为人工智能皇冠上的明珠。一方面,实现语言智能十分艰难。尽管机器人在电竞、围棋等方面频频超越人类,但目前的系统仍无法达到三、四岁孩童的语言和理解能力。另一方面在于自然语言处理本身对实现智能的重要性。在自然语言处理中最基础、最核心的就是预处理技术,本文将各个阶段最具代表性的词嵌入预处理技术进行了一个简单概述和总结。
2025-03-05 10:34:53
979
原创 深度学习在时间序列数据预测中的应用
目前,时序类数据预测算法经过多年来的研究和实践,常用算法主要有以下几类:简单平均数、移动平均数、指数平滑法、霍尔特线性趋势预测、Holt-Winters季节性预测模型、自回归差分移动平均模型(ARIMA模型)、转化为监督学习数据集,使用xgboot/LSTM模型/时间卷积网络/seq2seq(attention_based_model)、Facebook-prophet【类似于STL分解思路】、深度学习网络(LSTM)等。
2025-03-05 10:24:09
600
原创 算法面试小抄——通俗易懂的排序算法,如果把算法想象成打扑克牌
数据结构和算法,相信是每个技术从业者都绕不过去的坎,每次技术面都逃不过的虐。但在实际工作中,很少会真正用到自己实现底层的数据结构和底层的算法实现。各类编程语言都已经进行了高级的封装,只需调用诸如sort/rank函数就可以实现排序算法,利用诸如array/arrayList等容器就可实现数组存储与引用,那为什么数据结构和算法还要学?面试中还会被大量提问呢?
2025-03-05 10:04:52
427
原创 机器学习基础——数值计算
数值计算是机器学习领域的三驾马车之一,另外两个是线性代数和概率论,这三门数学基础性学科既是入门数据挖掘行业的门槛也是机器学习从业人员技术能力提升的阶梯。之前的文章已经介绍了线性代数和概率论相关的内容,今天本数据分析狮就分享一下机器学习中用到的数值计算。再次声明,小狮分享的这三篇只是基础性的理论知识,期望对大家入门机器学习有帮助。
2025-03-05 09:55:02
599
原创 一套有效应对技术面算法题的方法论
复杂度分析。估算问题中复杂度的上限和下限。定位问题。根据问题类型【查找、排序、最优化】,确定采用何种算法思维。数据操作分析。根据增、删、查和数据顺序关系去选择合适的数据结构,利用空间换取时间。编码实现。
2025-03-05 09:46:09
427
原创 指标权重计算的几种常用方法及Python代码
在统计理论和实践中,权重是表明各个评价指标(或者评价项目)重要性的权数,表示各个评价指标在总体中所起的不同作用。在具体业务场景中,最常见的评价指标类型分为:单层指标体系和双层指标体系。
2025-03-05 09:39:11
153
原创 一文读懂“数据化运营”
一本好书会让人有读时恍然大悟,读后茅塞顿开的赶脚,最近我读了《数据化运营:系统方法与实践案例》这本书后就是这种感受,要是能合着《精益数据分析》一起“内服”,效果更佳,瞬间打通任督二脉,忍无可忍只好把读书笔记分享一波。提前预警!!!本文很干,请自备茶水!
2025-03-05 09:31:31
864
原创 DeepSeekR1本地化部署+个人知识库搭建,老旧笔记本也能跑出企业级AI!3步让人人都能拥有最强办公助手
然而,随着用户量的激增,DeepSeek的服务器频繁出现“服务器繁忙”的问题,这让很多用户感到困扰,这不仅影响了使用体验,还限制了AI的普及和应用。如果你也遇到过这样的问题,那么今天的内容绝对能帮到你!今天,我将手把手教你如何在本地电脑上部署DeepSeek R1模型,并搭建个人知识库,让你的老旧笔记本也能跑出企业级AI!每位打工人都应该拥有的AI智能办公助手
2025-03-04 10:30:10
989
原创 被全网疯传DeepSeek调参笔记,35岁程序员靠微调逆袭,国内大厂疯抢微调工程师,算法岗薪资核爆:大语言模型调参竟成印钞机?
2025年,随着DeepSeek的持续火爆,AI行业人才市场持续升温,尤其是大语言模型微调算法工程师的薪资水平一路飙升。根据科锐国际发布的《2025人才市场洞察及薪酬指南》报告,大模型算法工程师的年薪已经高达50万至200万人民币。这一薪资水平不仅反映了市场对高端AI人才的迫切需求,也预示着大语言模型微调技术在行业中的重要性。
2025-03-04 09:18:59
656
原创 比深度学习还强的算法:算法大赛中的冠军算法,结构化数据挖掘中的最优算法,从决策树到随机森林、CBDT、XGBOOST、LightGBM、CATBOOT原理解析
在结构化数据的挖掘领域,以决策树为基石,一个古老而强大的家族——“树族”,仍然以其无与伦比的实力,统治着这片领域。如同司马家族在三国时代一样,树族在传统机器学习的舞台上展现着无可匹敌的威势,左右着传统机器学习算法的命运。
2025-03-03 15:14:25
879
原创 还在被正则表达式摩擦吗?一文搞定正则表达式,极简正则表达式学习笔记
一文搞定正则表达式,极简正则表达式学习笔记,通过五类元字符,两种量词匹配方式,四种匹配模式,小括号的作用,四类正则转义场景,一个方法论,搞定正则表达式的全面知识
2025-03-03 13:43:02
544
原创 美工失业预警:DeepSeek+PS王炸组合,今天学不会明天被淘汰!别再求设计部了!100张产品图1小时处理完毕,小白封神!
上面这张图片展示了一个名为“DeepSeek”的工具组合,它被誉为2025年“赚取收入的秘密武器”。这套工具集成了多种功能,旨在提升工作效率和创造力。关注我的公众号,我将持续为大家带来DeepSeek与每个工具的联合使用。轻松实现副业变现。
2025-03-01 15:40:30
879
原创 爆肝整理全网最全最新AI生成算法【Stable Diffusion|Diffusion Model|DallE2|CLIP|VAE|VQGAN】原理解析
AIGC已经成为AI领域最爆火的应用,尤其是随着Diffusion Model的提出,以及Dalle系列和Stable Diffusion的发布,Diffusion的火爆程度大有曾经Transformer的势头,也逐渐替代了GANs模型,本文系统的介绍了AI生成算法的背后逻辑和相关技术
2022-10-29 09:12:15
4907
2
原创 安装pyspider步骤及遇到的坑和解决方案
pyspider安装步骤及问题解决1、 在anaconda prompt中输入pip install --user pyspider2、 下载phantomjs(对应系统版本)##用户界面localhost:50003、 解压后将phantomjs.exe复制到python的Scripts文件夹下4、 在cmd中启动pyspider all坑一:python3.7不兼容pyspider问...
2020-04-17 15:09:30
745
原创 相似地址识别算法
读取文档对要计算的多篇文档进行分词对文档进行整理成指定格式,方便后续进行计算计算出词语的词频【可选】对词频低的词语进行过滤建立语料库词典加载要对比的文档将要对比的文档通过doc2bow转化为词袋模型对词袋模型进行进一步处理,得到新语料库将新语料库通过tfidfmodel进行处理,得到tfidf通过token2id得到特征数稀疏矩阵相似度,从而建立索引得到最终相似度结果im...
2019-05-14 14:06:38
6752
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人