自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 收藏
  • 关注

原创 【论文笔记】An Empathy-Based Sandbox Approach to Bridge the Privacy Gap

而这篇论文构建的沙盒环境则提供了一个零风险的训练场,它允许用户暂时“穿上”人工生成的虚拟角色的身份外衣,并在该角色的身份下体验各种隐私选择所带来的真实系统后果(例如,看到精准的定向广告)。通过这种角色扮演和共情 的方式,用户得以在没有泄露自己真实隐私数据的前提下,直观地感知隐私数据与系统结果之间的因果关系,从而有效地获取隐私知识和情感共鸣,最终促使他们做出与自身隐私目标相符的长期行为改变。如果广告重叠率低于 50%,则表明当用户切换角色时,超过一半的广告是独特的,证明沙盒的数据替换机制是有效的。

2025-11-28 20:21:55 693

原创 【论文笔记】REL-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance

如果一个药瓶(LLM)的标签(认知标记)正确地标明了药效(不确定性),但因为瓶子的设计(温暖度、历史表现)让人觉得它特别可靠,即使药效不明(中等确定性),用户仍可能会过度依赖,那么这个产品在现实世界的安全性就是存在问题的。也就是说,围绕模型的基础能力的评估并不能满足真实场景下的人机交互的安全需求,换句话说,基础能力的测试并未考虑到人的参与。上,即模型的预测概率是否与其准确率相匹配(例如,模型说有80%的把握,准确率是否确实为80%),换句话说就是 测评的是模型的基础能力(比如回答的正确率)。

2025-11-27 15:11:48 714

原创 【论文笔记】As Confidence Aligns: Exploring the Effect of AI Confidence on Human Self-confidence

这篇论文首次系统地探究了人工智能(AI)所表达的置信度(Confidence)如何影响人类的自信(Self-confidence),以及这种影响对人机协作决策有效性的后果。研究发现人类的自信会向 AI 的置信度靠拢(即“信心一致”),且这种一致性会影响人类的自信校准(Calibration)并降低人机决策的效率。

2025-10-27 01:41:44 607

原创 【论文笔记】Introduction to Explainable AI

狭义定义:使模型决策对人类可理解的技术与方法。广义定义(“可理解 AI”):涵盖对模型、数据、性能、输出范围、局限性等全方位的透明化。

2025-10-17 12:35:27 838

原创 【论文笔记】Fostering Appropriate Reliance on Large Language Models

本研究采用混合方法,系统地识别并量化了LLM回应的三个关键特征(解释、来源、不一致性)对用户信任的影响。明确了解释会普遍增加信任,而来源和不一致性是减少过度信任的有效机制。提供了关于用户如何解释LLM解释、如何进行来源点击以及解释和来源之间交互作用的细致见解。

2025-10-10 01:38:02 845

原创 【论文笔记】Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View

论文引入了两种与人类社会动态相似的智能体特质:“随和型”(easy-going)和“过度自信型”(overconfident)。适应性强,与不同类型的智能体兼容,有助于形成和谐的社会结构。倾向于高估自身能力,忽视潜在风险,并抵制他人意见。论文探讨了两种多轮协作下的思维模式:“辩论”(debate)和“反思”(reflection)。多个智能体提出观点,交换意见,进行集体论证并最终达成共识。这种模式促进知识共享和学习。智能体回顾自己之前的回答,从中吸取经验并相应地优化其答案。

2025-09-03 15:55:35 1021

原创 【论文笔记】STORYWRITER: A Multi-Agent Framework for Long Story Generation

研究只考虑了英文,并不支持多语言生成只关注了小说故事生成,并未考虑其他艺术风格该文章中的复杂叙事结构,其实就是把 生成的 Outline 在扩写后,交给 LLM 重构了 Outline 的顺序,这样不能解决实际问题,只是表面上的工作,该处可以参考中对于复杂叙事结构的描述,或许有参考价值。生成长度为 4000 字,并不能很好的解决小说的故事生成,还是个 toy。

2025-08-16 23:08:46 1117 1

原创 【论文笔记】Multi-Agent Based Character Simulation for Story Writing

故事生成,多智能体系统,角色模拟。

2025-08-16 21:54:35 1427 1

原创 【论文笔记】STORYTELLER: An Enhanced Plot-planning Framework for Coherent and Cohesive Story Generation

生成内容虽长(平均 7594 词),但深度和复杂度仍不及人类创作的完整小说。更别提网文长度的小说。生成内容仍缺乏经典文学作品的深度与复杂性。缺乏专业的故事质量评测基准(需结合叙事理论设计新指标)。现有指标(如人类偏好)存在主观性。当前实验集中于一般叙事,需验证在奇幻/科幻等复杂体裁的表现。

2025-08-14 22:25:13 1123

原创 【论文笔记】DOC: Improving Long Story Coherence With Detailed Outline Control

DOC框架通过详细提纲生成器和详细控制器的双重机制,显著改善了长篇故事生成的连贯性。将创作负担从生成阶段转移到规划阶段:通过层次化详细提纲提供更可靠的全局指引实现精细的生成控制:确保生成内容忠实于详细提纲,同时保持创造性建立高效的人机协作模式:在高层次规划阶段与人类互动,而非逐段干预低层次提纲遵循:无法始终严格遵循提纲的所有细节事实一致性:角色名称、性别等基本事实可能出现不一致提纲质量波动:提纲叶节点在细节层次上不一致风格问题:重复使用角色全名等小问题。

2025-08-13 19:41:03 1146

原创 【论文笔记】AGENTS’ ROOM: NARRATIVE GENERATION THROUGH MULTI-STEP COLLABORATION

协作优于单一模型:将复杂任务分解并由专业代理协作完成,比单一模型一次性生成更有效。结构化优于自由生成:基于叙事理论的结构化生成,比自由生成更能保证故事质量。人类评估仍是金标准:尽管自动化评估取得进展,但人类对故事质量的判断仍是不可替代的。这一研究为创意写作辅助系统、教育工具和娱乐内容生成等领域提供了重要的技术基础和理论指导。

2025-08-09 00:53:52 1212

原创 【环境配置】KAG - Windows 安装部署

KAG-Windows 部署

2025-07-11 20:51:58 1481 3

原创 【论文笔记】BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation

摘要: 复旦大学团队提出BookWorld系统,通过多智能体模拟将静态小说文本转化为动态交互世界。该系统从小说中提取角色画像、世界观设定和地理结构,构建角色智能体(自主决策)和世界智能体(全局调度),支持角色驱动的故事生成。核心创新包括:1)增量式角色关系更新与四元组世界观建模;2)基于地理图的动态路径规划与事件触发;3)记忆检索机制增强行为连贯性。实验表明,BookWorld生成的故事在角色一致性和情节创意性上优于基线方法。代码已开源,适用于创意写作与沉浸式叙事应用。 (字数:149)

2025-07-03 20:04:23 914 1

原创 【环境配置】Neo4j Community Windows 安装教程

由于 Neo4j Desktop 实操下来存在无法打开等问题,所以选择使用 Neo4j Community。本教程安装的版本为 Neo4j 5.26.8,JDK 版本为,操作系统为 Windows 11。

2025-07-01 21:30:34 708

原创 【论文笔记】SecAlign: Defending Against Prompt Injection with Preference Optimization

SecAlign: Defending Against Prompt Injection with Preference Optimization - CSS 25

2025-06-01 01:22:02 1736 1

原创 【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation

RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation

2025-05-25 17:42:34 997 1

原创 【论文笔记】Exploring Large-Scale Language Models to Evaluate EEG-Based Multimodal Data for Mental Health

GPT-4o 一次调用内置图像+文本解析能力,简化管道设计。无需专门微调,提示工程即可达接近传统机器学习水平的性能。实验证明将 EEG 与视觉/音频结合,可捕捉更多互补信息,提升心理状态识别精度。

2025-04-27 00:20:54 815 1

原创 【论文笔记】HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficie

向量知识库与知识图谱的结合

2025-03-27 15:11:57 1162 1

原创 【论文笔记】CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph

CogMG通过LLM与KG的协作,既减少了LLM的“幻觉”,又解决了KG的知识覆盖问题。

2025-03-17 22:05:33 1209 2

原创 【论文笔记】Best Practices and Lessons Learned on Synthetic Data for Language Models

Best Practices and Lessons Learned on Synthetic Data for Language Models

2025-03-12 19:24:11 935 1

原创 【LeetCode】LCR 139. 训练计划 I

教练使用整数数组 actions 记录一系列核心肌群训练项目编号。为增强训练趣味性,需要将所有奇数编号训练项目调整至偶数编号训练项目之前。请将调整后的训练项目编号以 数组 形式返回。

2025-02-19 22:14:55 460

原创 【论文笔记】Identifying malicious traffic under concept drift based on intraclass consistency enhanced vae

Identifying malicious traffic under concept drift based on intraclass consistency enhanced variational autoencoder

2025-02-19 21:10:58 1374 1

原创 【LeetCode】LCR 121. 寻找目标值 - 二维数组

【LeetCode】LCR 121. 寻找目标值 - 二维数组

2025-02-17 14:40:08 1101

原创 【LeetCode】LCR 120. 寻找文件副本

数组 - 简单设备中存有 n 个文件,文件 id 记于数组 documents。若文件 id 相同,则定义为该文件存在副本。请返回任一存在副本的文件 id。示例 1:输入:documents = [2, 5, 3, 0, 5, 0]输出:0 或 5。

2025-02-16 19:49:28 725

原创 【论文笔记】On Generative Agents in Recommendation

推荐系统中离线指标与线上效果的长期脱节问题制约了行业发展。本文提出基于大语言模型的用户模拟器 Agent4Rec,模拟真实用户行为,弥合离线与在线评估的鸿沟。

2025-02-16 18:09:09 1582 1

原创 【scikit-multiflow】使用 scikit-multiflow 的流数据生成器生成概念漂移数据流

使用 scikit-multiflow 的流数据生成器生成不同类型的概念漂移数据流

2025-02-15 21:17:46 1041

原创 【LangChain】Chapter12 -Chat

Chatbot

2025-02-03 00:16:18 503

原创 【LangChain】Chapter11 - Question Answering

Question Answering

2025-02-02 22:35:30 1096

原创 【LangChain】Chapter10 - Retrieval

《LangChainChatwithYourData》-Retrieval

2025-01-19 21:12:18 703

原创 【LangChain】Chapter9 - Vectorstores and Embeddings

《LangChain Chat with Your Data》- Vectorstores and Embeddings

2025-01-17 12:02:59 835

原创 【LangChain】Chapter8 - Document Splitting

《LangChain Chat with Your Data》-Document Splitting

2025-01-16 01:16:52 1160

原创 【LangChain】Chapter7 - Document Loading

《LangChain Chat with Your Data》-Document Loading

2025-01-14 20:35:38 812

原创 【LangChain】Chapter6 - Agents

本节简单介绍了一下什么是 agent,讲解了如何使用 LangChain 搭建一个 agent,对两个工具进行了演示,并介绍了如何自己构建工具的过程。

2025-01-13 16:29:20 1241

原创 【LangChain】Chapter5 - Evaluation

本节介绍了使用 LangChain 对 LLM 问答应用进行评估。

2025-01-13 13:54:34 957

原创 【Seed-Labs 2.0】Buffer Overflow Attack Lab (Server Version)

【Seed-Labs 2.0】Buffer Overflow Attack Lab (Server Version)

2025-01-04 16:22:39 2022

原创 【Seed-Labs 2.0】TCP/IP Attack Lab

本实验的相关文件参见官网本实验建议在官方提供的虚拟机环境中进行,可以参考。

2025-01-03 20:27:16 2011

原创 【Seed-Labs 2.0】Cross-Site Scripting (XSS) Attack Lab (Web Application: Elgg)

跨站脚本 (XSS) 是网络应用程序中常见的一种漏洞。攻击者可利用该漏洞向受害者的网络浏览器注入恶意代码(如 JavaScript 程序)。利用这些恶意代码,攻击者可以窃取受害者的凭证,如会话 cookie。利用 XSS 漏洞可绕过浏览器为保护这些凭证而采用的访问控制策略(即同一来源策略)。

2025-01-03 01:05:35 2013 2

原创 【LangChain】Chapter4 - Question and Answer Over Documents

LangChain for LLM Application Development - Question and Answer Over Documents

2024-12-30 16:50:19 1112

原创 【LangChain】Chapter3 - Chains

本节介绍了三种常见的 Chain。通过 Chain 的使用,我们可以使用 prompt 跟 LLM 产生更丰富的功能,以使 LLM 能更加精确的回答我们的问题。

2024-12-29 16:33:40 1194

原创 【LangChain】Chapter2 - Memory

该存储器允许存储消息和然后提取变量中的消息。该存储器保存对话在一段时间内的互动列表。该内存会在内存中保存最近交互的缓冲区,并使用标记长度而不是交互次数来决定何时刷新交互。该记忆功能可创建一段对话的摘要。通过这四种 memory 形式,我们可以使用 Langchain 实现有记忆存储的 LLM 聊天应用,使得我们的聊天更加顺畅,满足我们的需求。但同时,记忆存储功能不只能应用在聊天应用上,还可以运用在使用 LLM 进行信息检索等方面。将文本(来自对话或其他地方)存储在矢量数据库中,并检索最相关的文本块。

2024-12-28 16:31:17 1167

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除