
NLP
文章平均质量分 54
znsoft
人工智能博士/教授级高级工程师/博士研究生导师
展开
-
prompt learning 一个空格引发的血案
使用清华的prompt learning 框架,openprompt 中发行一个奇怪的现象: 使用官方的测试程序可以在某数据集上达到65.98%的 准确率,但是我自己写的程序只有56%,相差仅10个百分点。检查了一圈数据及代码,没有发现差异点。经过两天的排查,查输入数据异同,查代码,最后发现:openprompt的模板要求第一个字符必须是空格才可以,否则准确率显著下降。 注意图中A前面有一个字空格。如果没有,刚问题显然。这应该是openprompt中的处理程序bug或逻辑缺陷导致的。.........原创 2022-06-26 14:33:32 · 473 阅读 · 0 评论 -
BartModel 输出变量解释(来自hugging face 网站)
last_hidden_state (torch.FloatTensor of shape (batch_size, sequence_length, hidden_size)) - 模型的最后一层解码器输出的隐藏状态序列。如果使用past_key_values,则只输出形状(batch_size, 1, hidden_size)序列的最后一个隐藏状态。past_key_values (tuple(tuple(torch.FloatTensor)), optional, 当use_cache=Tru原创 2022-03-22 16:20:32 · 2462 阅读 · 0 评论 -
解决rocm amd显卡 在非root下不能运行的办法,pytorch 运行时找不到显卡的问题
line=47 error=100 : hipErrorNoDevice这种错误出现的原因是安装其它软件导致冲突,解决办法是卸载pytorch后,再安装一次。pip uninstall torchpip install /path/tor/your/whl将后面的替换为你的pytorch的轮子的路径即可。...原创 2020-10-19 07:36:44 · 2499 阅读 · 1 评论 -
百度百科 9百万条数据处理程序及数据
本仓库包括百度百科960条百科数据以及处理程序,可以将数据处理成结构化信息保存到sqlite ,方便处理。百度百科中文语料,包括 9147759 条词条 下载地址:链接:https://pan.baidu.com/s/1trpfFEbw094jJkQ2GxiHfA提取码:conf下载好的文件需要解压后成为一个独立的txt本库包括处理程序,可以将原始数据处理成json 形式。使用时,需要自己用dbeaver 创建一个新的sqlite 表,包括两个字段:term 和 json ..原创 2020-11-16 07:22:30 · 3235 阅读 · 0 评论