- 博客(8)
- 收藏
- 关注
原创 【论文简读】CLEAR: Can Language Models Really Understand Causal Graphs?
作者综合了哲学和心理学领域概念,对模型的“理解力”提出了几个内涵:(1)不仅仅是知道单独的事实,而是能够把一个主体的各种元素串联在一起;(2)不仅掌握概念或公式,而且还能在实际环境中熟练地应用它们的能力;(3)理解力不是二元的,它的完整性取决于个人的概念语境和背景知识;(我的理解是:理解力不是简单的理解或者不理解,而是根据背景知识的增加而逐渐变化)
2024-11-18 23:18:11
634
原创 本地加载大模型出现OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or ……
尝试本地加载yi1.5-6b模型,报错 OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_model.msgpack。附一个其他错误:ImportError: cannot import name 'split_torch_state_dict_into_shards' from 'huggingface_hub' (……使用模型前还是要多看看官方给的配置需求 (˘•ω•˘)
2024-07-08 17:30:03
14018
5
原创 Financial Sentiment Analysis: An Investigation into Common Mistakes and Silver Bullets
Title: Financial Sentiment Analysis: An Investigation into Common Mistakes and Silver BulletsConference: COLING 2020一、背景与研究问题近年来,自然语言处理在金融领域得到了广泛的应用,包括股票市场/外汇市场预测、波动率建模、资产配置、业务分类构建、信用评分、首次公开发行估值(IPO)等。处理文本输入的方法主要有两种思路:第一种是通过神经网络直接编码金融文本,并使用高维空间表征学习下游任务(
2022-04-01 15:45:47
849
原创 Open Aspect Target Sentiment Classification with Natural Language Prompts
Title: Open Aspect Target Sentiment Classificationwith Natural Language PromptsConference: EMNLP2021
2022-03-24 19:45:25
2170
原创 BERT4GCN: Using BERT Intermediate Layers to Augment GCN for Aspect-based Sentiment Classification
论文内容整理(自用)BERT4GCN标题:BERT4GCN: Using BERT Intermediate Layers to Augment GCN for Aspect-based Sentiment Classification摘要: 基于图的基于方面的情感分类(ABSC)方法已经取得了最先进的结果,特别是当使用了从训练前语言模型(PLMs)得到的上下文词嵌入时。然而,它们忽略了上下文的顺序特性,并没有充分利用PLMs。在本文中,我们提出了一个新的模型,它集成了来自BERT的PLM的语法顺序特
2021-10-28 16:53:12
1798
原创 ABSA 综述整理
一、Aspect-based Sentiment Analysis 基本任务(一)各个资料给出的关键子任务《Issues and Challenges of Aspect-based Sentiment Analysis: A Comprehensive Survey》把ABSA的任务分为Aspect Extraction (AE),Aspect Sentiment Analysis (ASA) 和 Sentiment Evolution (SE)AE:方面提取,包括显式方面explicit a
2021-10-20 21:45:54
4341
原创 Understanding self-supervised learning with dual deep networks
Facebook AI Research & Stanford University 带来的自监督学习相关研究『 ML时代的机器学习模型一般只做最后的分类聚类回归,深度学习时代的模型把特征提取的工作一并做了,可以预见,未来我们需要更复杂的模型自动收集和筛选数据。』—— 查资料发现的一句话主要内容SimCLR框架介绍 BYOL(Bootstrap Your Own Latent)框架介绍 本文内容SimCLR简单有效的对比学习框架主要成果:自监督 76.5% t
2021-07-08 14:53:08
570
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅