- 博客(18)
- 收藏
- 关注
原创 CS224n:Introduction and Word Vectors(一)
这个我们之前在自然语言处理概论的blog中有所提及,这个想法很自然,但缺点也很明显——所有的词向量都是正交的,会造成向量维度过大,这一特性使其无法捕捉词语间的语义关联。(word representations),即将单词映射到低维稠密向量,向量中的每个值表示某种潜在语义特征。的核心优势就在于打破正交性 ,通过低维连续向量让语义相近的词在向量空间中距离更近(内积或余弦相似度更高)。本质上是对数导数基本功,大体上计算过程是平凡的,如有疑问可在评论区留言。是:一个单词的意思是由经常出现在它附近的单词给出的。
2025-07-22 10:30:00
588
原创 微分流形(一):什么是微分流形
是数学中描述“弯曲空间”的概念:它在局部(每一点附近)看起来像平坦的欧几里得空间,但整体上可能弯曲或复杂。按我的理解就是流形是一种工具,是光滑曲面的一系列局部映射簇,而且满足以下性质:单射满射且光滑,反函数同理。
2025-07-21 18:07:19
267
原创 2025 iFLYTEK AI开发者大赛&Datawhale AI夏令营:新增用户预测挑战赛
参与算法赛事,一定要仔细理解赛事的输入-输出究竟是什么,尤其是提交的格式。三、baseline以及优化baseline# 1. 数据加载# 2. 时间特征工程# 转换为时间戳# 提取时间特征# 删除原始时间列# =================== 后续所有操作放在 for 循环外 ===================############################### 简单分析# 获取 train 和 test 中唯一的 did# 计算交集# 数量统计# 占比。
2025-07-15 23:50:23
203
原创 2025 iFLYTEK AI开发者大赛&Datawhale AI夏令营:基于带货视频评论的用户洞察挑战赛
一开始的源码import osos.makedirs("submit", exist_ok=True) # 关键:这行必须在保存文件之前执行# 2. 再保存CSV文件(此时目录已存在,不会报错)# 3. 最后压缩目录(可选)print("操作完成:submit目录已创建,CSV文件已保存,压缩包已生成!")Baseline的比较简要的设计思路是下图原baseline没做数据预处理的清洗,我们可以增强一手;商品识别用了jieba分词,
2025-07-13 23:51:58
637
原创 MPCE: A Maximum Probability Based Cross Entropy Loss Function for Neural Network Classification
MPCE在相同周期内损失下降更快(FIGURE 3. Convergence of Bayesian, SVM, CE, TCE, ACE and MPCE, i.e. the decrease trend of cross entropy loss from one epoch to ten epoch),尤其在复杂数据集(如sector)上优势显著。:将真实类别的目标概率设为预测中的最大值。:真实类别的目标概率固定为1,损失为。,从而减少冗余梯度,提升训练效率。是当前预测概率的最大值,
2025-05-25 18:14:53
563
原创 Bert实战-酒店评价情感分类(八)
该项目预训练模型源自huggingface官网google-bert/bert-base-chinese,在本地计算机上我们只进行下游任务,通过微调预训练模型实现基于 BERT 的酒店评价情感分类。这篇博客概括得很好。
2025-05-23 20:47:42
413
原创 自然语言处理概论(七)
注意力机制可以类比为图书馆的智能推荐系统:当你想找一本关于“如何暴富”的书(Query),图书管理员会将你的需求与所有书的标题(Key)逐一比对,计算匹配度(如《致富思维》得90分),并通过除以书名长度(本质上就是可以利用“传家宝”处理词性不同的问题,但RNN有个弊端就是在处理长距离依赖时,因记忆传递不畅而容易丢失关键信息的缺陷,无法很好地捕捉和利用远距离的上下文关联。,其中只有对应类别的位置为1,其余为0,但缺点也是显而易见的,如图。第二种方法是本节的核心之处,动态分配权重,自注意力机制。
2025-05-12 14:04:48
661
原创 电视产品个性化推荐模型分析
论文研究电视产品的个性化推荐系统,通过融合多种推荐模型(基于物品/用户的协同过滤、流行度推荐、内容推荐),解决用户因内容过载导致的选择困难问题。其意义在于提升推荐精准度,帮助平台提高用户粘性和商业价值。:依赖物品特征(如类型、导演),增强可解释性。提出混合推荐框架,结合协同过滤与内容特征;:前K个推荐中用户实际感兴趣的比例。:用户感兴趣的物品有多少被成功推荐。:利用物品相似度推荐,适合长尾挖掘。:推荐系统能覆盖的电视产品比例。1.基于物品的协同过滤推荐模型。3.基于用户的协同过滤推荐模型。
2025-03-16 16:53:31
937
原创 特征提取与无监督学习(六)
深度学习, 就是把我们的输入转换成一个高维的向量,这个向量就是被提取出的特征。一定程度上,可以理解这个提取的过程为编码或者压缩。然后,我们才可以用这个特征去分类,回归或者其他任务。你的模型朝着哪个方向压缩特征,由你的标签(颜色或形状)来决定。
2025-03-04 09:30:00
863
原创 分类理论基础(五)
MNIST数据集,最入门的手写数字识别项目Cifar10数据集--10分类ImageNET--上百万张及要求分成1024类的一个比赛,很多著名的模型在此诞生,比如接下来要说的AlexNetCoCo数据集名词解释&问题示例1.卷积,卷积核,感受野3.如果要把特征图变小,为什么通常不采用扩大卷积步长的方法?4.Sota模型X_%7B11%7DX_%7Bij%7DSoftmaxy_%7B1%7D。
2025-03-04 00:36:32
176
原创 Modeling of Marine Solid Oxide Fuel Cell Based on Artificial Neural Network
前期的实验数据收集及分析(getdata),文献搜集,论文撰写,文献综述,模型构建,算法实现,结果对比,论文修订,论文投稿,团队成员分工,财务报销,参加相关的国际会议。老师提供idea和财务支持,其他作者修改论文排版和算法的原理。
2025-02-27 00:42:53
719
原创 Python中字典的简单应用
创建一个名为”城市“的字典,将伦敦、北京、纽约作为键;对于每座城市,都创建一个字典,并在其中包含该城市所属国家、地理位置和著名景点。
2022-10-19 00:43:12
690
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人