自然语言处理
文章平均质量分 91
NLP相关知识的工作总结、学习、经验、项目以及debug
算法驯化师
1. 多年面试官经验、欢迎咨询各类简历修改、面试经验、求职准备、项目包装、项目指导(算法代码方向);
2. 混迹多个大厂搜索、推荐、广告、内容、数据挖掘、数据分析等多个岗位工作,目前大模型算法驯化师;
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【NLP实战-BERT文本分类】一文搞懂基于BERT进行文本分类并定制化评估指标
文本分类任务的目标是将文本数据分配到预定义的类别中。在本次项目中,我们使用了一个包含用户评论和评价维度的数据集。数据集中的每条评论都对应一个评价维度(如“服务态度”、“产品质量”等),我们的目标是训练一个模型,能够自动根据评论内容预测其对应的评价维度。原创 2025-02-07 17:09:32 · 1212 阅读 · 0 评论 -
【Transforms-驯化】一个通过seq2seq和Transforms实现文本生成的例子
文本生成目前都是通过gpt等大模型进行完成,本次介绍一下通过seq2sep以及Transforms来实现。原创 2024-12-17 11:43:53 · 533 阅读 · 0 评论 -
【大模型-驯化】一文教会qwen-vl、qwen系列通过Prompt输出json格式为非markdown格式问题
【大模型-驯化】一文教会qwen-vl、qwen系列通过zero-shot输出json格式为非markdown格式问题 本次修炼方法请往下查看 在企业的工程工作中,有时候由于没有想过的训练数据,需要通过zero-shot的方式调用大模型进行推理预测,目前来说比较好的模型中文解释模型为qwen系列的单模和多模模型,通常来说算法和工程进行对接时,我们需要将结果处理成json格式给后原创 2024-11-21 14:52:15 · 2990 阅读 · 0 评论 -
【大模型-驯化】一文教会你bert、qwen、llama等模型对结果进行概率控制问题
【大模型-驯化】一文教会你bert、qwen、llama等模型对结果进行概率控制问题 本次修炼方法请往下查看 大模型的发展使得之前的nlp相关任务:文本分类、实体抽取、文本生成、文本理解等任务都在由bert预训练模型向gpt模型进行过渡,具体的之前用bert进行文本分类的任务都可以通过gpt进行sft来得到微调的最终结果,在通过bert进行文本分类的过程中,我们可以对bert的原创 2024-11-20 11:08:19 · 1500 阅读 · 2 评论 -
【大模型驯化-gradio】成功解决gradio出现httpcore.ReadTimeout: timed out问题
【大模型驯化-gradio】成功解决gradio出现httpcore.ReadTimeout: timed out问题 本次修炼方法请往下查看 在实际的工作中,我们经常会启用一个docker来管理自己的环境隔离问题,在使用对大模型进行可视化接口调用时,我们使用如下命令安装gradio: 从上述的结果可以看出我们已经在一个conda环境中安装成功了gradio,我们通过gra原创 2024-06-21 11:05:25 · 3170 阅读 · 0 评论 -
【NLP基础知识-bert向量化】BERT模型输出pooler_output和last_hidden_state详解和用法
是一种预训练语言表示模型,由Google在2018年提出。它通过使用Transformer架构的编码器部分,能够捕捉到文本的双向上下文信息。BERT模型在自然语言处理(NLP)领域取得了革命性的进展,为各种下游任务提供了强大的基础。# 加载BertTokenizer和BertModel# 定义输入文本text = '这是一个测试句子'# 对输入文本进行分词和填充# 获取Bert模型的embedding结果# 输出结果。原创 2023-10-09 10:56:11 · 6746 阅读 · 0 评论 -
使用SRILM 工具对n-gram建模实战
n-gram模型是一种统计语言模型,用于预测给定一个文本序列中下一个词或单词序列的概率。本文通过srilm工具对n-gram模型进行建模实战原创 2023-09-26 13:35:10 · 364 阅读 · 0 评论
分享