- 博客(75)
- 资源 (1)
- 收藏
- 关注
原创 【python】python读取日志文件并将日志中json格式数据写入excel文件
2024-03-27 15:51:07,040 - [{‘name1’: ‘aaaa’, ‘name2’: ‘bbbb’, ‘name3’: ‘ttt’, ‘name4’: 2}, {‘name1’: ‘aaaa’, ‘name2’: ‘bbbb’, ‘name3’: ‘ttt’, ‘name4’: ‘2’}]
2024-03-28 08:25:20
714
原创 【python】深度学习中的激活函数(Sigmoid函数、tanh函数、ReLU函数、Softmax函数)
在深度学习中,激活函数用于对隐藏层与输出层的单元接收到的输入值进行处理。常用的激活函数有Sigmoid、tanh、ReLU、Softmax函数。Sigmoid(x) = 1/(1+exp(x))主要作用是将函数接收到的值映射到0~1一、tanh函数2.1 函数表达式为tanh(x) = (exp(x) - exp(-x)) /(exp(x) + exp(-x))tanh函数将接收到的值映射到-1~1。与Sigmoid函数相比,tanh函数的输出值更广泛。三、ReLU函数3.1 ReLU的函数表
2024-03-27 00:07:55
2024
原创 【hive】AnalysisException: operands of type STRING and TINYINT are not comparable:column_name = 1
这是因为column_name的类型为字符串,限制条件里面用的是数值型。把字符串通过cast转为数值型。
2024-03-21 20:45:00
729
原创 【python】写一个从指定路径读取xlsx的函数
定义了一个名为 read_xlsx 的函数,从指定的路径(如果提供了路径)读取一个 Excel 文件并将其内容转换为 pandas 的 DataFrame 对象。
2024-03-21 15:00:52
669
原创 【PyCharm】英文版PyCharm创建文件时在代码中自动添加作者、日期等信息
点击Editor–>File and Code Templates–>Python Script,填写以下信息。点击File–>Settings–>即可看到会自动生成设定的信息。新建Python File。
2024-03-20 15:48:42
656
原创 【python】Python实现梯度下降算法
(文末包含完整代码)定义函数计算梯度采用梯度下降计算函数最小值时自变量的值指定自变量更新的次数即迭代次数指定学习率定义自变量初始值获取最优值及梯度下降过程中的x走过的点位指定x的范围和间隔获取对应的y值画出函数图像画出更新过程中自变量及其对应的函数值运行结果完整代码如下
2024-03-20 15:15:32
1111
原创 【Python】‘utf-8‘ codec can‘t decode byte 0xb1 in position 4: invalid start byte
这个报错表示在尝试使用 UTF-8 解码方式读取文件时出现了问题,很可能是因为文件中包含了不被 UTF-8 编码所支持的字符。可以尝试使用其他编码方式读取文件,如使用 encoding=‘gbk’ 参数来指定文件编码为 GBK 编码。
2024-03-19 16:48:02
569
原创 【MySQL 】MySQL 里面的DATE_FORMAT怎么用?
其中 %Y 表示四位年份,%m 表示两位月份,%d 表示两位日期。%W:完整的星期几名称(Sunday - Saturday)%a:缩写的星期几名称(Sun - Sat)%b:缩写的月份名称(Jan - Dec)%H:24小时制的小时(00 - 23)%h:12小时制的小时(01 - 12)%Y:四位年份(例如:2024)%m:两位月份(01 - 12)%d:两位日期(01 - 31)%i:两位分钟(00 - 59)%s:两位秒数(00 - 59)%y:两位年份(例如:24)%c:月份(1 - 12)
2024-03-19 14:34:42
2699
原创 【stata】stata如何截取证券代码的数字部分?
如下图所示,证券代码由数字和小数点“.”及两位字母组合而成,为了方便数据合并,需统一提取里面的数值部分可以采用以下两种方式提取。
2024-03-19 12:11:13
3244
原创 TypeError: unhashable type: ‘numpy.ndarray‘
这是因为to_categorical 函数将整数标签转换为了 one-hot 编码,可以通过shape[1] 存储 one-hot 编码数组的第二个维度的大小,即类别数。TypeError: unhashable type: ‘numpy.ndarray‘报错是因为数据类型与操作的函数不匹配导致的。首先通过以下代码查看。
2024-03-18 18:02:22
274
原创 成功解决‘MaxRetryError(“HTTPSConnectionPool(host=‘huggingface.co‘, port=443): Max retries exceeded的问题
由于内网无法访问host=‘huggingface.co’,所以可以去官网https://huggingface.co/docs/transformers/installation#offline-mode把需要的文件下载下来,不能访问外网下载文件的同学可以在留言区找博主索要。然后可以把model_name 通过以下方式表示。不确定文件目录是否正确的话,可以用以下代码检查。然后再运行该代码就不会报错了。
2024-03-18 13:44:07
2632
1
原创 【市场】2024年销售市场上的事儿
现代管理学之父”彼得·德鲁克说,企业只有经历3轮以上周期才会成熟。关键点一是关注开创性技术。技术的商业化,会诞生特别的新商业模式。二是由技术创新衍生出前沿战略,从小的变革,洞悉深刻变化,然后根据第一性原理构建新商业体系。三是商业试探,只有商业探索才能确认商业是否成立,即实践出真知。
2024-03-17 17:18:20
750
原创 【财经】跟进政策动向,挖掘当前风口
今年政府工作报告提出5%的增长目标。广义财政扩张明显,中央层面赤子加专项债和超长期特别国债等,总计10万多亿元,提振了市场信心。
2024-03-17 16:26:21
324
原创 【成长】高效能人士的七个习惯
没有正确的生活,就没有真正卓越的人生。——戴维·斯塔·乔丹我们的思维方式,无论正确与否,使我们的态度与行为的根本,归根到底,是我们的人际关系的根本。——史蒂芬·柯维人的行为总是一再重复。因此卓越不是一时的行为,而是习惯。——亚里士多德。
2024-03-17 14:41:25
242
原创 【经济】股票价格指数
股票价格指数由证券交易所或金融服务机构编制的表明股票行市变动的参考性指标,是衡量股票市场总体价格水平及其变动趋势的尺度,是反映一个国家或地区政治、经济发展状态的灵敏信号。
2024-03-17 12:26:19
483
原创 【职业规划】人生职业规划的一些建议
卡耐基说:“一个人的成功,15%靠专业知识。85%靠人际关系与处世能力。苏格拉底说:“没有经过思考的人生是不值得过的。”有反思才有更好的人生。莎士比亚说:“抛弃时间的人,时间也将抛弃他。”把时间用在达成目标的路上不懈怠,才会得到相应的收获。乔布斯说:“人这辈子没法左太多的事情,你的时间有限,所以要把最重要的那件事做得精彩绝伦。西塞罗说:“再脆弱的人,只要把全部精力倾注在唯一的目标上,必能有所成就。袁隆平说:“人的一辈子做好一件事就足够了。
2024-03-17 11:51:01
385
原创 【游戏类】游戏公测期介绍
进入公测期的游戏版本完成度通常很高了,稳定性、游戏性、易用性、功能性和交互性达到了要求。公测主要是为了引导更多用户,获得更多收入。公测期的市场投放主要以预热期的用户分析为基础,选择好的投放策略精准投放。
2024-03-13 14:21:49
475
原创 【游戏类】游戏的封测期介绍
1.游戏封测期介绍游戏的测试节点,一般分为CB何OB两个阶段。CB(Close Bata)指游戏对外封闭测试期,是在小范围内的限量测试,主要目的是为了发现和解决问题,有发放激活码和不发放激活码两种测试方式,大部分封测都会在测试结束后删档。OB(Open Bata)游戏公开测试,是大规模不限量不删档测试,主要为了导入更多的用户,获取更多利润。2.封测目的(1)检验游戏版本质量、稳定性、游戏性、易用性、功能性、交互性和商业化系统。(2)测试游戏的关键数据指标,例如留存率、付费率、ARPPU和ARPU。并
2024-03-13 12:16:06
1579
原创 【游戏类】游戏发行预热期介绍
对于国内大多数游戏来说,推广阶段一般安排在游戏理想至封测期间。时间跨度通常在3-4个月。有经验的运营团队一般在游戏开发期间就开始大量宣传,营造气氛,提前聚集大量的潜在客户,从而降低短期的爆发推广压力,辅助市场投放达到最优化的投放效果,提高成功率。预热期一般会议以时间节点为轴线,市场预热方案一般包括:(1)确定该产品的传播定位;(2)确定分阶段、分轴线的宣传主题;(3)策划线上活动简案(时间、活动目的、对象、执行平台、策略);
2024-03-12 09:06:26
684
原创 【游戏类】手游和端游的区别有哪些?
手游是在手机和移动网络之下,端游是固化在PC段和宽带之下。手机的用户群体要大于PC端用户。端游相比手游来说较重度,花费时间较长,用户年龄段主要集中在18~25岁之间。手机游戏的用户群分布较为广泛。
2024-03-12 08:33:52
1033
原创 【游戏类】游戏关键数据指标
通常所说的手游的激活,是指用户安装好客户端以后联网打开客户端。手游的激活率则是用户安装好客户端后联网打开客户端的比例。激活率=激活量/安装量对于发放激活码进行激活的情况,计算公式如下:(激活码的)激活率=激活量/激活码发放量(激活码的)激活且登录率=激活且登录量/激活码激活量游戏运营的主要目标有4点:拉新、促活、留存、付费转化拉新指的是通过渠道合作和广告营销等方式,获得新用户;留存是将获得的用户能够尽量持久地留在产品上;促活即“促进用户活跃”,让用户愿意更频繁、更开心的游戏;
2024-03-12 00:14:09
1279
原创 【游戏类】数据分析的价值介绍
简历高价值用户的流失预警模型,挽留预流失用户,帮助提升游戏用户活跃度和收入,稽核用户质量,提早发现异常用户,避免造成损失。(7)通过崩溃数据、用户不正常行为等因素定位bug和分析原因,帮助测试人员发现问题,通过数据定位问题发生的具体场景,进行有目的的测试,帮助开发人员发现问题。(4)分析用户流失原因、流失用户行为特征,提出版本修正建议,让用户更好的体验游戏,配合运营活动减少用户流失并提升收入。(5)通过文本挖掘,分析用户反馈和舆情数据,解决产品问题和分析竞品数据。
2024-03-11 23:24:47
257
原创 【游戏类】数据来源
游戏行为数据和问卷调查数据,其中游戏行为数据主要来源于游戏数据库,问卷调查数据来源于问卷后台数据库。数据同步工作主要有BI部门实现。当需要做舆情监控、竞品分析是,需要从新闻、论坛、贴吧、QQ群等渠道手机数据,可以通过爬虫工具爬取,或手工导出本地。
2024-03-11 23:15:42
300
原创 【模型】什么是RFM模型?
RFM模型是衡量客户价值和客户潜在价值的重要工具和手段。是国际上最成熟、最为容易得客户价值分析方法。R(Recency最近消费时间间隔)、F(Frequency消费频率)、M(Monetary消费金额)。
2024-03-11 21:20:15
477
原创 【SSH-Spark】ssh命令如何查看电脑上是否安装了spark?
如果 Spark 已经安装在计算机上,这些命令将显示安装的 Spark 的版本信息。如果未安装 Spark,可能会提示找不到命令或程序。其中 username 是你的用户名,hostname 是目标计算机的主机名或 IP 地址。
2024-03-11 18:08:57
391
原创 【python】numpy中的数据类型
adarray对象是numpy的基础对象,用于存放同类型元素的多维数组。ndarray每个元素在内存中都有相同存储大小的区域,每个ndarray只有一种dtype类型。
2024-03-11 11:19:21
457
原创 【理论】数据处理的方法
数据处理是从大量的、杂乱无章、难以理解的、确实的数据中,抽取并推导出对解决问题有价值、有意义的数据。主要包括数据规约、数据清洗、数据加工等处理方法。
2024-03-11 08:58:48
413
原创 【数据采集】数据获取的方式有哪些?
获取数据的方式有很多,如公开的数据集、爬虫、数据采集工具、付费API等。下面解药介绍几个常用的数据网站和获取数据的几种方式。
2024-03-11 08:42:58
1996
原创 【理论】什么是数据分析以及常用的数据分析方法
数据分析是将数学、统计学理论结合科学的统计分析方法,对数据库、excel、网页抓取的数据以及采集的大量数据等进行分析,从中提取有价值的信息形成理论并进行展示的过程。目的是将隐藏在一大堆看似杂乱无章的数据背后的有用信息提取出来,总结数据的内在规律,帮助在实际工作中的管理者做出决策和判断。
2024-03-11 08:28:43
500
原创 【心理学】MBTI人格16种人格类型
对概念存在偏好,会默默地在精神世界建构他们的理论框架。沉迷于理论和逻辑的推理中,高度重视依靠智力和运用理论推理来寻求解决方案。在说话时总是有所保留,但不意味着他们不诚实,只是他们喜欢分享自己尚未完善的想法。霸气、无所畏惧,是天生的领导者,是领导者中的领导者,拥有对权力的欲望,为达成某个目标,总能扮演协调者的角色,会不遗余力的让意向工作按最合理的流程推进。非常强势,说话的时候总给人搞搞在上的感觉。看不起胆小和怕事的人,热衷于用武力快速的决绝问题,可能有时常脾气暴躁,自尊心强,时常隐藏自己的真实情感。
2024-03-11 00:06:17
4796
原创 MBTI人格测试中字母基本含义
外向vs.内向E属性者:外向者,往往是大家关注的焦点。急切渴望传达自己的想法。能够通过和别人交流获得能量,擅于沟通,往往不擅长聆听I属性者:内向者,在角落里不怎么合群的人。不怎么擅长表达,能够从安静的活动中获取能量,是很好的倾诉对象。在独处的时候,会表现得焦躁不安,在喧闹的场合,能量会很快的消耗完。
2024-03-10 11:50:25
1242
原创 【SSH-python】在SSH终端中如何查看python安装了哪些插件?
在 SSH 终端中,可以使用以下命令来查看 Python 安装的插件列表。如果只想查看特定包,可以使用以下命令。例如1,:查看pandas包。
2024-03-06 18:12:59
312
原创 【python】SSH终端上如何安装python插件?
首先确保已经安装了 Python 和 pip。大多数情况下,Python 安装包会自带 pip。
2024-03-06 18:07:35
348
原创 ES(ElasticSearch)里面如何查询近一周或上周?
在es里面用“now-1w/d”表达从当前时间开始往前推一个星期(1 week),如果要查询近一周的数据可以用以下方式表达其中gte 代表 “greater than or equal to”,表示大于或等于指定的日期值。lte 代表 “less than or equal to”,表示小于等于指定的日期值。
2024-03-05 10:54:51
830
原创 ES(ElasticSearch)里面如何设置模糊查询?
在Elasticsearch中进行模糊查询通常使用模糊搜索功能,可以使用通配符或模糊查询来实现。
2024-03-05 10:06:28
3597
原创 ES(ElasticSearch)里面如何查询昨日?
在es里面用“now-1d/d”表达昨天,如果要查询昨天至今天的数据可以用以下方式表达其中gte 代表 “greater than or equal to”,表示大于或等于指定的日期值。lt 代表 “less than”,表示小于指定的日期值。
2024-03-05 09:51:05
634
原创 【指标】电力行业关键指标
指电力系统实际安装的发电机组额定有功功率的总和。火电厂每生产1千瓦小时的电能所消耗标准煤的数量。正平衡供电煤耗=统计期内发电用总煤量(折算标煤后)/统计期内总供电量反平衡供电煤耗=汽轮机热耗率/[锅炉效率管道效率(1-发电厂用电率)标煤发热量]1000管道效率通常用0.99,标煤发热量通常按照29308KJ/Kg=7000Kcal,因此将卡换算成焦耳时,行标和国标的换算公式如下:电力企业行标=7000Kcal/Kg=7000现行国标:7000Kcal/kg=7000。
2024-03-01 10:06:37
956
2024年全年的日期表、重要节假日、周数、星期几综合日历文件
2024-03-17
国内博士研究计划书模板
2024-03-06
博士申请专家推荐信模板
2024-03-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人