- 博客(11)
- 收藏
- 关注
原创 推特情感分析
本报告介绍了两种传统分类器——MaxEnt 和 SVM,以及基于 RNN 架构的 LSTM 分类器和基于 Transformer 框架的 BERT 分类器。此外,由于深度学习模型(如 LSTM 和 BERT)在运行中具有固有的随机性,例如权重初始化、dropout、训练轮数、Adam 优化器以及 GPU 执行等,其结果在不同运行间可能会有所差异。由于推文文本具有独特特征,如表情符号、话题标签和网络俚语(包括缩写),在情感分类中,与其进行统一标准化处理,不如针对性保留这些特征,这对传统模型更为有利。
2025-09-30 01:45:56
956
原创 归因异常数据的可视化应用:以澳大利亚火灾数据为例
可视化在数据分析中的重要性不言而喻。无论是用于数据探索还是展示数据洞察,良好的可视化都能帮助分析师看到“数据背后的真相”,从而发现潜在的机会和挑战。本报告将以为例,分析可视化在对进行时所扮演的角色。本报告不仅适用于专业数据分析师,对于需要在日常生活中查看图像的每个人也会有所帮助,因为其中涵盖的设计理念,包括颜色、模式等,都将是很有用的。在分析这组数据集时,一个有趣的发现是。因此,我绘制了,以说明通过可视化如何以高度信息密度如此清晰地描述这一现象。
2025-09-30 01:30:27
997
原创 基于Agent-Based Systems的拍卖博弈Bot设计与优化
拍卖场景:四位艺术家(Picasso、Van Gogh、Rembrandt、Da Vinci)的画作被逐轮拍卖。规则:每个Bot初始预算1001;每轮所有Bot密封出价,最高者得标并支付出价;获胜条件为获得 10-3-2-1 组合画作;最多进行200轮,首个满足条件者获胜。
2025-09-30 01:12:37
826
原创 数据挖掘实战 —— 图像分类与蛋白质表达预测
输入:28×28 灰度图(展开为 784 维向量)。标签:+1 或 -1。X_test。数据:4 个组织切片(A1, B1, C1, D1)。每个 spot 对应一张 RGB 图像和 38 个蛋白质表达值。任务:预测CD11b 蛋白水平。👉 如果你也在学习数据挖掘,希望这篇文章能帮到你。
2025-09-30 00:47:43
797
原创 基于 K-Means 的客户细分与营销策略 —— 珠宝电商案例研究
本文基于珠宝电商真实交易数据,采用K-Means聚类和RFM模型进行客户细分研究。通过数据清洗、特征工程(构建RFM指标及多维行为特征)和PCA降维处理后,确定3个最优客户群:高潜力客户、流失风险客户和价格敏感型客户,并针对每类群体提出差异化营销策略。研究展示了从数据处理到商业落地的完整流程,同时指出数据代表性等局限性,建议未来结合深度学习方法提升营销精度。该案例为电商客户细分提供了可借鉴的实施框架。
2025-09-30 00:08:50
525
原创 HTML knowledge (learned through crawlers)
HTML knowledge (learned through crawlers)
2023-01-06 23:17:13
168
原创 matplotlib 直方图添加数据标签
matplotlib 直方图添加数据标签matplotlib绘制直方图,一直没搜到怎么添加数据标签,很多以此为名的贴子实际放的都是条形图的,所以写了个循环放这里,方便有需要的同学取,自己以后也可以直接贴了。population_ages = [22,55,62,45,21,22,34,42,42,3,99,55]bins = [0,10,20,30,40,50,60,70,80,90,100]plt.hist(population_ages, bins, rwidth=0.8, histty
2021-08-07 17:15:08
2940
原创 电商寻求市场增长点
项目背景&产品架构客户需求:拜耳官方旗舰店寻求市场增长点产品架构:数据说明“驱虫剂市场”文件子文件:top100品牌数据、灭鼠杀虫剂、电蚊香套装、盘香灭蟑香蚊香盘、蚊香加热器、蚊香液、蚊香片、防霉防蛀片灭鼠杀虫剂细分市场子文件:杀虫、灭鼠、虱子、螨、蟑螂竞争数据子文件:商品销售数据、商品交易数据、流量渠道数据、评论舆情数据驱虫市场的潜力分析...
2019-11-27 00:36:50
1583
原创 信用风险识别评分卡
信用风险识别评分卡思维导图:前期数据准备工作:数据形态:data.shape发现只有两个缺失值,用众数----'bachelor’填充:data.info()data[data.最高学历.isnull()] data.最高学历.value_counts()data['最高学历']=data.最高学历.fillna('bachelor')查看样本是否均衡:data.pe...
2019-11-16 22:09:58
286
转载 Markdown快捷键
撤销:Ctrl/Command + Z重做:Ctrl/Command + Y加粗:Ctrl/Command + B斜体:Ctrl/Command + I标题:Ctrl/Command + Shift + H无序列表:Ctrl/Command + Shift + U有序列表:Ctrl/Command + Shift + O检查列表:Ctrl/Command + Shift + C插入...
2019-05-25 15:16:39
1741
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅