一支王同学-优快云博客

本文首先介绍了AuroraCap，一种基于大型多模态模型的高效视频细节描述器。通过利用tokens合并策略，在不影响性能的情况下显著降低了计算开销。本文还提出了VDC，一个新的视频详细描述基准，旨在评估视频内容的全面和连贯的文本描述。为了更好地评估，本文提出VDCscore，一种新的基于分而治之策略的LLMs辅助评价指标。对各种视频和图像描述基准的广泛评估表明，AuroraCap取得了有竞争力的结果，甚至在某些任务中超过了最先进的模型。

2025-03-11 21:15:11 610

原创 DeepSeek 系列模型：论文精读《A Survey of DeepSeek Models》

这篇文章概述了Deepseek 及其变体，包括 DeepSeek 7B、DeepSeek MoE-16B、DeepSeek V2、DeepSeek V3、DeepSeek R1-Zero 和 DeepSeek R1，还概述了相关的大语言模型，包括 OpenAI GPT、Claude 3.5、LLama 3.1、Qwen 2.5、Gemini 2.0，并将它们进行了系统的比较。

2025-03-04 21:29:34 718

原创【DeepSeek部署经验】Ollama(运行平台)+DeekSeek(对话模型)+Cherry Studio(可视化对话界面)

超级简单的傻瓜式部署贴子，包括 Ollama、DeekSeek、Cherry Studio 的下载和安装，并有详细的步骤。

2025-02-24 20:05:25 902

原创提升大语言模型(LLMs)阅读理解能力的经验技巧【增强数据集的方法】

该文分享了如何对中英文问答题进行数据增强的方法【数据预处理工作】，提升了LLMs的推理能力，模型使用的是Llama3-8B。

2025-01-16 20:22:49 719

原创大语言模型(LLMs)数学推理的经验技巧【思维链CoT的应用方法】

该文分享了如何对数学推理运算进行思维链(CoT)的应用【数据预处理工作】，模型使用的是Llama3-8B。

2024-12-31 15:49:05 1410

原创论文解读《LiveChat：A Large-Scale Personalized Dialogue Dataset Automatically Constructed from 在线直播》

本文提出了 LiveChat，一个来自直播领域的中文视频个性化对话数据集，包含详细的人物画像。它保持着最大的每个角色的平均会话数，也是用于收件人识别的最大的MPC数据集，因为直播是一种自然的 MPC 场景。这是由于 reply-to-whom 匹配方法能够从实时视频中自动提取对话会话，而大多数视频提取方法不能。在两个基准任务上的实验结果表明，选择的角色轮廓和每个角色的平均会话次数有利于学习说话人的个性化回复和收件人确认。

2024-12-03 13:36:28 1011

原创论文解读《Recent Trends in Personalized Dialogue Generation: A Review of 数据集, 方法, 和评估》

论文的完整标题为：《Recent Trends in Personalized Dialogue Generation：A Review of Datasets, Methodologies, and Evaluations》。本文深入研究了个性化对话生成，涵盖数据集、方法和评估技术。

2024-11-21 23:04:49 900

原创论文解读《Towards Lifelong Dialogue Agents via Relation-aware Memory Construction and ......》

论文完整标题：《Towards Lifelong Dialogue Agents via Relation-aware Memory Construction and Timeline-augmented Response Generation》。本文提出了一个基于时间轴的长期对话记忆增强对话代理框架。综合评估表明，THEANINE有助于更有益的增强，使回复更接近真实情况，更符合说话人过去的互动。其有效性在TeaFarm中得到了进一步证实。

2024-11-21 00:25:47 903

原创论文解读《Personalized LoRA for Human-Centered Text Understanding》

本文提出了 PLoRA，一种以人为中心的 PEFT 方法，成功证明了在增强 PLMs 从预训练到下游任务的迁移学习方面的有效性。通过采用 PnP 框架，PLoRA 显著提高了对实际应用冷启动问题的适应能力。在多种个性化情感分析任务上的实验验证了该方法的有效性和高效性。

2024-11-17 23:12:32 758

原创论文解读《Tell Me More! Towards Implicit User Intention Understanding of Language Model Driven Agents》

本文研究了智能体设计中隐式意图理解的增强和评估。引入了交互意图（IN3）基准，以评估智能体从模糊指令中理解隐含意图的能力。本文还开发了 Mistral-Interact，一个开源模型，可以精确识别任务模糊性，寻求澄清并捕获用户意图。将其应用到 XAgent 中，证明了其在代理指令理解和执行方面的有效性。本文工作开创了在智能体设计中整合用户参与和隐式意图理解的先行者，为更强大的交互基准和系统铺平了道路。

2024-11-14 12:02:09 1220

原创论文解读《CTRLsum: Towards Generic Controllable Text Summarization》

当前的摘要系统产生的一般摘要与用户的偏好和期望脱节。为了解决这一限制，论文提出了 CTRLSUM，这是一个通过一组关键字（keywords）控制生成摘要的通用框架。在训练过程中，自动提取关键字，而不需要额外的人工注释。在测试时，CTRLSUM 具有将控制信号映射到关键字的控制函数；通过对控制函数的工程化（engineering），可以将同一个训练好的模型应用于各个维度的可控摘要，同时不影响模型的训练过程，也不影响预训练模型。

2024-11-13 11:39:42 596

原创一文贯通RAG的技术介绍和构建（简易版+附详细代码）

本文主要分为以下几个部分： 1.为什么产生RAG技术？【计算资源问题、提示依赖问题、模型幻觉问题、时效性问题、数据安全问题】2. RAG技术的简要介绍【RAG是一种结合了信息检索、模型能力和文本生成的新型自然语言处理技术框架】；3. RAG技术和SFT技术的对比【RAG 在利用最新信息、提高可解释性和适应性方面具有明显优势。相比之下，微调模型（SFT）可能更适合那些对特定任务有明确优化需求】；4. RAG技术的实现流程【问题理解、信息检索和LLMs调用】；5. 代码实现。

2024-10-28 19:37:39 2919 2

原创 EMNLP 2024 个性化/风格化文本生成论文汇总（19篇主会论文）

摘要：简单翻译了一下 19 篇 EMNLP2024 上的个性化/风格化文本生成相关论文的标题、摘要，并给出了整体框架图和原文链接。

2024-10-23 00:00:42 1900

原创 2022年十九届中国研究生数学建模竞赛C题——优秀论文分析

本文的赛题来自 2022 年 C 题的《汽车制造涂装-总装缓存调序区调度优化问题》，对应的优秀论文来自当年的 “数模之星”。文中稍微结合了一点本人的分析和见解，写了这篇博客。

2024-09-18 19:43:13 1541 2

原创论文解读《NewsBench：一个评估中文新闻大型语言模型编辑能力的系统评估框架》

论文的题目叫 NewsBench：A Systematic Evaluation Framework for Assessing Editorial Capabilities of Large Language Models in Chinese Journalism。它提出 NewsBench，一个新的评估框架，系统地评估大型语言模型(LLMs)在中文新闻编辑能力方面的能力。

2024-09-14 15:38:03 1403 1

原创论文解读《LaMP: When Large Language Models Meet Personalization》

本文强调了大型语言模型中个性化的重要性，并介绍了 LaMP 基准(benchmark)——一个用于训练和评估语言模型以产生个性化输出的新基准。LaMP 提供了一个全面的评估框架，具有不同的语言任务和每个用户画像(user profile) 的多个条目(entries)。它由 7 项个性化任务组成，跨越 3 个文本分类和 4 个文本生成任务。本文还提出 2 种检索增强方法，从每个用户画像(user profile) 中检索个人事项(personal items)，以个性化语言模型输出。为此，研究了各种检

2024-09-13 08:55:01 1904

原创论文解读《Personal LLM Agents: Insights and Survey about the Capability, Efficiency and Security》

关键词：智能个性化助理 · 大型语言模型 · 大型语言模型代理 · 移动设备 · 智能水平 · 任务自动化 · 感知 · 记忆 · 效率 · 安全与隐私

2024-09-05 14:00:24 1439

原创 pyrouge(ROUGE-1.5.5)的安装步骤和使用说明（适用于Linux 系统）

摘要：本文详细讲解了如何配置和使用文本摘要的评价指标ROUGE(linux 系统)。总共八个步骤分为：检查 perl 版本、安装 XML::Parser、安装 XML::RegExp、安装 LWP::UserAgent、安装 XML::Parser::PerlSAX、安装 XML::DOM、安装 DB_File、安装并测试 ROUGE-1.5.5。

2024-06-10 15:41:21 1247 3

原创对Transformer中的Attention(注意力机制)的一点点探索

摘要：本文试图对 Transformer 中的 Attention 机制进行一点点探索。并就 6 个问题深入展开。1. Attention 的输入是什么？输出是什么？2. Attention 中的输入(input)与 “Q、K、V” 是啥关系？3. Attention 中的 Q、K、V 分别有什么含义？4. Attention 的计算流程是怎么样的？5. 多头 Attention 有什么用？6. 请介绍一下 Cross-Attention？

2023-09-09 16:24:33 1168

原创如何用pytorch做文本摘要生成任务(加载数据集、T5 模型参数、微调、保存和测试模型，以及ROUGE分数计算)

摘要：如何使用 Pytorch(或Pytorchlightning) 和 huggingface Transformers 做文本摘要生成任务，包括数据集的加载、模型的加载、模型的微调、模型的验证、模型的保存、ROUGE指标分数的计算、loss的可视化。

2023-03-15 21:42:06 9109 37

原创基于区域生长和形态学处理的图像融合方法——Matlab图像处理

关键词：区域生长法、形态学处理、HSV模型、边缘融合、RGB图像、图像融合。

2023-03-06 16:13:57 2010

原创 NLP冻手之路(5)——中文情感分类(以BERT为基础，由Hugging Face库支持，代码实践)

关键字：NLP、情感分析、bert-base-chinese。

2022-10-27 16:25:43 4295 1

原创 NLP冻手之路(4)——pipeline管道函数的使用

关键词：pipeline简介、pipeline的使用、【pipeline简单应用于情感分类、完形填空、文本生成、命名实体识别、摘要生成、文本翻译、阅读理解】

2022-10-26 16:23:22 1982

原创 NLP冻手之路(3)——评价及指标函数的使用(Metric，以 BLEU和GLUE 为例)

关键字：自然语言处理、metric的使用、Hugging Face。

2022-10-25 16:16:00 4315 3

原创 NLP冻手之路(2)——文本数据集的下载与各种操作(Datasets)

关键词：中文文本数据集的下载、数据集的获取【直接调用函数获取、官网下载获取】、数据集的操作【排序与打乱、选择和过滤、切分和分桶、列的新增/删除和重命名、map 函数、保存与加载】

2022-10-22 11:38:58 6990 3

原创 NLP冻手之路(1)——中文/英文字典与分词操作(Tokenizer)

关键字：NLP、代码实战、中文分词、中文字典、Tokenizer。

2022-10-17 14:34:20 5195

原创简单优先分析法演示系统——C/C++/Qt实现

关键字：该系统支持通过友好的界面展示 L 关系、R 关系、L+ 关系、R+ 关系、等于关系、小于关系、大于关系和简单优先关系矩阵，并利用堆栈算法思想来分析输入的符号串，判断通过该文法能否生成该符号串。

2022-09-01 18:49:50 1863

原创电脑死机，Word忘了保存怎么恢复？(编辑器是WPS)

关键字：Word忘了保存，怎么恢复？

2022-07-29 15:37:16 3106 3

原创数据结构与算法分析——数学基础(为之后的算法分析打基础)

关键词：数学知识复习、指数、对数、级数、模运算、证明方法、递归简论、练手习题(3道)

2022-07-01 15:55:54 1034

原创关于数据库设计的做题笔记——选择题+填空题+大题

关键词：数据库系统概论(第5版)第七章——数据库设计、一些做题笔记。

2022-05-11 21:27:55 2862 4

原创深入会用——关系数据理论 [包含详细例题+解析]

关键词：数据库系统概论(第5版)第六章——关系数据理论、1NF、2NF、3NF和BCNF、数据依赖的公理系统、算法6.1、最小依赖集的定义和求法、具有无损连接性的模式分解、具有函数依赖性的模式分解、转换为3NF的保持函数依赖的分解(算法6.3 合成法)、转换为3NF的即有无损连接又保持函数依赖的分解(算法6.4)、结果为BCNF的无损分解算法(算法6.5) ⭐️⭐️⭐️、补充的一些选择题。.........

2022-05-11 10:01:00 5113 1

原创怎么写解题步骤——FIRST集、FOLLOW集、LL(1)分析法【编译原理之语法分析】

关键字：编译原理、语法分析、LL(1)分析法、LL(1)分析表、FIRST集、FOLLOW集、LL(1)例题的详细求解。

2022-05-07 22:52:22 5516 1

图像处理中基于区域生长和形态学处理的图像融合算法的Matlab实现

内容概要：该系统采用了一种自动处理图像的方法，可以将拍摄于阴雨天的照片中灰蒙蒙的天空转换成蓝天白云、夕阳西下或者是彩虹以及其他想要的背景，并将整体的色调调整成更明亮的显示效果。这种技术的操作十分简单上手，处理速度较快，可以很成功地对照片进行背景转换，同时优化整合两部分内容，使得处理后的图片看起来更加和谐。适合人群： 1. 刚学习或熟悉 MATLAB 的人员 2. 正在用 MATLAB 做关于图像处理却无从下手的人员 3. 希望做一个小项目，但没有合适参考样例及代码的人员该资源包含： 1. 该系统能够分步演示说明图像融合的过程（例如灰度图、边缘检测图、边缘柔化图、亮度融合图等等）。 2. 代码中有大量注释，方便改写。 3. 代码运行环境为 MATLAB2020，可能需要装一些图像处理函数的插件(很快的)。 4. 提供了详细的文档说明、详细的流程图等。 5. 资源中附加了演示使用视频。其他说明： 1. 在下载压缩包后，可以简单看一下 "使用视频.mp4"。注意，鼠标点击选完“生长点”后，需要再按一下“回车”。 2. 如果您觉得资源还不错的话，希望留下你独特的评价。

2023-03-05

简单优先分析法演示系统-C/C++程序设计、Qt图形化界面

适合人群： 1. 熟悉 C/C++ 的人员 2. 正在做关于 Qt 可视化却无从下手的人员 3. 希望做一个小项目，但没有合适的框架的人员该资源包含： 1. 该系统能够分步演示说明简单优先关系矩阵的计算过程（例如 L 关系、 R 关系、L+关系、R+关系、小于、大于、等于关系的求解过程）。 2. 系统能够演示利用简单优先关系矩阵分析符号串的过程。 3. 系统用的 Qt 界面展示，较为美观。 4. 对所采用的算法、程序结构和主要函数过程以及关键变量，都进行了详细的说明。 5. 提供了关键程序的清单、源程序及可执行文件和相关的软件说明。 6. 资源中附加了演示视频。阅读建议： 1. 在下载压缩包后，务必细看 .txt 说明文件里的内容 2. 参考博客可见：https://blog.youkuaiyun.com/Wang_Dou_Dou_/article/details/126636951 写在最后：如果您觉得资源还不错的话，希望留下你独特的评价。

2022-09-01

Qt和C/C++实现的可视化景点旅游信息系统——包含详细注释与txt说明文件

适合人群： 1. 熟悉 C/C++ 的人员 2. 正在做关于 Qt 可视化却无从下手的人员 3. 希望做一个小项目，但没有合适的框架的人员我主要能学到什么： 1. 该项目包含鼠标点击响应与绘图相关的算法 2. 该项目包含创建、删除、编辑结点或者边的分布图的算法 3. 该项目包含判断创建的导游线路图有无回路的算法——拓扑图 4. 该项目包含输出给定入口景点的导游线路图的算法——DFS 5. 该项目包含求两个景点间的最短路径的算法——Floyd 6. 该项目包含给出道路建设(最小生成树)的算法——Kruskal 7. 该项目包含自定义地图文件读入与写出的算法阅读建议：在下载压缩包后，务必细看 .txt 说明文件里的内容写在最后： 4.9元，一个 Big 桶藤椒泡面的价格如果您觉得资源还不错的话，希望留下你独特的评价。

2021-11-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人