- 博客(8)
- 收藏
- 关注
原创 Datawhale AI夏令营第三期 :基于论文摘要的文本分类与关键词抽取挑战赛——学习记录(3)
-model_name_or_path chatglm2-6b \ 本地模型的目录--stage sft \ 微调方法--use_v2 \ 使用glm2模型微调,默认值true--do_train \ 是否训练,默认值true--dataset paper_label \ 数据集名字--lora_rank 8 \ LoRA 微调中的秩大小--output_dir ./output/label_xfg \ 输出lora权重存放目录。
2023-08-25 23:23:53
211
1
原创 Datawhale AI夏令营第三期 :基于论文摘要的文本分类与关键词抽取挑战赛——学习记录(2)
主题:NLP上分思路与技巧分享时间:2023年8月21日20:00地点:线上直播(B站、微信视频号)策划/分享人:司玉鑫、潘笃驿学习资料:Docs直播回放:【NLP上分思路与技巧 - Bert Topline】 https://www.bilibili.com/video/BV1Wu4y1i72q/?BERT,是一个经典的深度学习、预训练模型。
2023-08-22 23:00:51
173
1
原创 Datawhale AI夏令营第三期 :基于论文摘要的文本分类与关键词抽取挑战赛——学习记录(1)
自然语言处理(Natural Language Processing,NLP)是人工智能(AI)领域的技术之一,其目标是赋予计算机理解、解释、处理和生成人类日常语言(例如英语、中文等)的能力。通过实现这一目标,NLP致力于让计算机能够模仿人类一样的语言处理能力,从而实现更加自然、智能的人机交互。该领域的任务范围广泛,其中包括文本分类,自动将文本分配到预先定义的类别中,例如垃圾邮件分类和情感分析;还有信息抽取,从文本中提取特定信息,如新闻报道中的重要事件。:基于论文摘要的文本分类与关键词抽取挑战赛。
2023-08-18 23:29:02
174
1
转载 YOLOv5的置信度阀值与iou阀值及P R详解
P值如果设为100,即要求被标记出来的区域一定属于A类,这种概率非常低,所以可能一个A类都识别不出来,进而导致R值为0。而若P值设为0.1,则要求被标记出来的区域只要有百分十的概率属于A类即可,那么将有很多A类被标记,R值也进一步提高。可以看出,随R值的升高,A被预测到的数量也会增加,即那些可能性较低的A类也逐渐被预测出来。以此类推,当A类的R值设为1时,表示以某精确度P11计算,检测到了所有的A类标签。预测出了400份被认为是猫,其中,正确的有300份,错误的有100份。
2023-01-17 14:48:09
5053
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人