- 博客(71)
- 收藏
- 关注
原创 【论文笔记】An Empathy-Based Sandbox Approach to Bridge the Privacy Gap
而这篇论文构建的沙盒环境则提供了一个零风险的训练场,它允许用户暂时“穿上”人工生成的虚拟角色的身份外衣,并在该角色的身份下体验各种隐私选择所带来的真实系统后果(例如,看到精准的定向广告)。通过这种角色扮演和共情 的方式,用户得以在没有泄露自己真实隐私数据的前提下,直观地感知隐私数据与系统结果之间的因果关系,从而有效地获取隐私知识和情感共鸣,最终促使他们做出与自身隐私目标相符的长期行为改变。如果广告重叠率低于 50%,则表明当用户切换角色时,超过一半的广告是独特的,证明沙盒的数据替换机制是有效的。
2025-11-28 20:21:55
692
原创 【论文笔记】REL-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance
如果一个药瓶(LLM)的标签(认知标记)正确地标明了药效(不确定性),但因为瓶子的设计(温暖度、历史表现)让人觉得它特别可靠,即使药效不明(中等确定性),用户仍可能会过度依赖,那么这个产品在现实世界的安全性就是存在问题的。也就是说,围绕模型的基础能力的评估并不能满足真实场景下的人机交互的安全需求,换句话说,基础能力的测试并未考虑到人的参与。上,即模型的预测概率是否与其准确率相匹配(例如,模型说有80%的把握,准确率是否确实为80%),换句话说就是 测评的是模型的基础能力(比如回答的正确率)。
2025-11-27 15:11:48
713
原创 【论文笔记】As Confidence Aligns: Exploring the Effect of AI Confidence on Human Self-confidence
这篇论文首次系统地探究了人工智能(AI)所表达的置信度(Confidence)如何影响人类的自信(Self-confidence),以及这种影响对人机协作决策有效性的后果。研究发现人类的自信会向 AI 的置信度靠拢(即“信心一致”),且这种一致性会影响人类的自信校准(Calibration)并降低人机决策的效率。
2025-10-27 01:41:44
607
原创 【论文笔记】Introduction to Explainable AI
狭义定义:使模型决策对人类可理解的技术与方法。广义定义(“可理解 AI”):涵盖对模型、数据、性能、输出范围、局限性等全方位的透明化。
2025-10-17 12:35:27
838
原创 【论文笔记】Fostering Appropriate Reliance on Large Language Models
本研究采用混合方法,系统地识别并量化了LLM回应的三个关键特征(解释、来源、不一致性)对用户信任的影响。明确了解释会普遍增加信任,而来源和不一致性是减少过度信任的有效机制。提供了关于用户如何解释LLM解释、如何进行来源点击以及解释和来源之间交互作用的细致见解。
2025-10-10 01:38:02
845
原创 【论文笔记】Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View
论文引入了两种与人类社会动态相似的智能体特质:“随和型”(easy-going)和“过度自信型”(overconfident)。适应性强,与不同类型的智能体兼容,有助于形成和谐的社会结构。倾向于高估自身能力,忽视潜在风险,并抵制他人意见。论文探讨了两种多轮协作下的思维模式:“辩论”(debate)和“反思”(reflection)。多个智能体提出观点,交换意见,进行集体论证并最终达成共识。这种模式促进知识共享和学习。智能体回顾自己之前的回答,从中吸取经验并相应地优化其答案。
2025-09-03 15:55:35
1021
原创 【论文笔记】STORYWRITER: A Multi-Agent Framework for Long Story Generation
研究只考虑了英文,并不支持多语言生成只关注了小说故事生成,并未考虑其他艺术风格该文章中的复杂叙事结构,其实就是把 生成的 Outline 在扩写后,交给 LLM 重构了 Outline 的顺序,这样不能解决实际问题,只是表面上的工作,该处可以参考中对于复杂叙事结构的描述,或许有参考价值。生成长度为 4000 字,并不能很好的解决小说的故事生成,还是个 toy。
2025-08-16 23:08:46
1117
1
原创 【论文笔记】Multi-Agent Based Character Simulation for Story Writing
故事生成,多智能体系统,角色模拟。
2025-08-16 21:54:35
1427
1
原创 【论文笔记】STORYTELLER: An Enhanced Plot-planning Framework for Coherent and Cohesive Story Generation
生成内容虽长(平均 7594 词),但深度和复杂度仍不及人类创作的完整小说。更别提网文长度的小说。生成内容仍缺乏经典文学作品的深度与复杂性。缺乏专业的故事质量评测基准(需结合叙事理论设计新指标)。现有指标(如人类偏好)存在主观性。当前实验集中于一般叙事,需验证在奇幻/科幻等复杂体裁的表现。
2025-08-14 22:25:13
1123
原创 【论文笔记】DOC: Improving Long Story Coherence With Detailed Outline Control
DOC框架通过详细提纲生成器和详细控制器的双重机制,显著改善了长篇故事生成的连贯性。将创作负担从生成阶段转移到规划阶段:通过层次化详细提纲提供更可靠的全局指引实现精细的生成控制:确保生成内容忠实于详细提纲,同时保持创造性建立高效的人机协作模式:在高层次规划阶段与人类互动,而非逐段干预低层次提纲遵循:无法始终严格遵循提纲的所有细节事实一致性:角色名称、性别等基本事实可能出现不一致提纲质量波动:提纲叶节点在细节层次上不一致风格问题:重复使用角色全名等小问题。
2025-08-13 19:41:03
1145
原创 【论文笔记】AGENTS’ ROOM: NARRATIVE GENERATION THROUGH MULTI-STEP COLLABORATION
协作优于单一模型:将复杂任务分解并由专业代理协作完成,比单一模型一次性生成更有效。结构化优于自由生成:基于叙事理论的结构化生成,比自由生成更能保证故事质量。人类评估仍是金标准:尽管自动化评估取得进展,但人类对故事质量的判断仍是不可替代的。这一研究为创意写作辅助系统、教育工具和娱乐内容生成等领域提供了重要的技术基础和理论指导。
2025-08-09 00:53:52
1212
原创 【论文笔记】BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation
摘要: 复旦大学团队提出BookWorld系统,通过多智能体模拟将静态小说文本转化为动态交互世界。该系统从小说中提取角色画像、世界观设定和地理结构,构建角色智能体(自主决策)和世界智能体(全局调度),支持角色驱动的故事生成。核心创新包括:1)增量式角色关系更新与四元组世界观建模;2)基于地理图的动态路径规划与事件触发;3)记忆检索机制增强行为连贯性。实验表明,BookWorld生成的故事在角色一致性和情节创意性上优于基线方法。代码已开源,适用于创意写作与沉浸式叙事应用。 (字数:149)
2025-07-03 20:04:23
912
1
原创 【环境配置】Neo4j Community Windows 安装教程
由于 Neo4j Desktop 实操下来存在无法打开等问题,所以选择使用 Neo4j Community。本教程安装的版本为 Neo4j 5.26.8,JDK 版本为,操作系统为 Windows 11。
2025-07-01 21:30:34
708
原创 【论文笔记】SecAlign: Defending Against Prompt Injection with Preference Optimization
SecAlign: Defending Against Prompt Injection with Preference Optimization - CSS 25
2025-06-01 01:22:02
1736
1
原创 【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation
RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation
2025-05-25 17:42:34
997
1
原创 【论文笔记】Exploring Large-Scale Language Models to Evaluate EEG-Based Multimodal Data for Mental Health
GPT-4o 一次调用内置图像+文本解析能力,简化管道设计。无需专门微调,提示工程即可达接近传统机器学习水平的性能。实验证明将 EEG 与视觉/音频结合,可捕捉更多互补信息,提升心理状态识别精度。
2025-04-27 00:20:54
815
1
原创 【论文笔记】HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficie
向量知识库与知识图谱的结合
2025-03-27 15:11:57
1162
1
原创 【论文笔记】CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph
CogMG通过LLM与KG的协作,既减少了LLM的“幻觉”,又解决了KG的知识覆盖问题。
2025-03-17 22:05:33
1209
2
原创 【论文笔记】Best Practices and Lessons Learned on Synthetic Data for Language Models
Best Practices and Lessons Learned on Synthetic Data for Language Models
2025-03-12 19:24:11
935
1
原创 【LeetCode】LCR 139. 训练计划 I
教练使用整数数组 actions 记录一系列核心肌群训练项目编号。为增强训练趣味性,需要将所有奇数编号训练项目调整至偶数编号训练项目之前。请将调整后的训练项目编号以 数组 形式返回。
2025-02-19 22:14:55
460
原创 【论文笔记】Identifying malicious traffic under concept drift based on intraclass consistency enhanced vae
Identifying malicious traffic under concept drift based on intraclass consistency enhanced variational autoencoder
2025-02-19 21:10:58
1374
1
原创 【LeetCode】LCR 120. 寻找文件副本
数组 - 简单设备中存有 n 个文件,文件 id 记于数组 documents。若文件 id 相同,则定义为该文件存在副本。请返回任一存在副本的文件 id。示例 1:输入:documents = [2, 5, 3, 0, 5, 0]输出:0 或 5。
2025-02-16 19:49:28
725
原创 【论文笔记】On Generative Agents in Recommendation
推荐系统中离线指标与线上效果的长期脱节问题制约了行业发展。本文提出基于大语言模型的用户模拟器 Agent4Rec,模拟真实用户行为,弥合离线与在线评估的鸿沟。
2025-02-16 18:09:09
1581
1
原创 【scikit-multiflow】使用 scikit-multiflow 的流数据生成器生成概念漂移数据流
使用 scikit-multiflow 的流数据生成器生成不同类型的概念漂移数据流
2025-02-15 21:17:46
1040
原创 【LangChain】Chapter9 - Vectorstores and Embeddings
《LangChain Chat with Your Data》- Vectorstores and Embeddings
2025-01-17 12:02:59
835
原创 【LangChain】Chapter8 - Document Splitting
《LangChain Chat with Your Data》-Document Splitting
2025-01-16 01:16:52
1160
原创 【LangChain】Chapter7 - Document Loading
《LangChain Chat with Your Data》-Document Loading
2025-01-14 20:35:38
812
原创 【LangChain】Chapter6 - Agents
本节简单介绍了一下什么是 agent,讲解了如何使用 LangChain 搭建一个 agent,对两个工具进行了演示,并介绍了如何自己构建工具的过程。
2025-01-13 16:29:20
1241
原创 【Seed-Labs 2.0】Buffer Overflow Attack Lab (Server Version)
【Seed-Labs 2.0】Buffer Overflow Attack Lab (Server Version)
2025-01-04 16:22:39
2021
原创 【Seed-Labs 2.0】Cross-Site Scripting (XSS) Attack Lab (Web Application: Elgg)
跨站脚本 (XSS) 是网络应用程序中常见的一种漏洞。攻击者可利用该漏洞向受害者的网络浏览器注入恶意代码(如 JavaScript 程序)。利用这些恶意代码,攻击者可以窃取受害者的凭证,如会话 cookie。利用 XSS 漏洞可绕过浏览器为保护这些凭证而采用的访问控制策略(即同一来源策略)。
2025-01-03 01:05:35
2009
2
原创 【LangChain】Chapter4 - Question and Answer Over Documents
LangChain for LLM Application Development - Question and Answer Over Documents
2024-12-30 16:50:19
1112
原创 【LangChain】Chapter3 - Chains
本节介绍了三种常见的 Chain。通过 Chain 的使用,我们可以使用 prompt 跟 LLM 产生更丰富的功能,以使 LLM 能更加精确的回答我们的问题。
2024-12-29 16:33:40
1194
原创 【LangChain】Chapter2 - Memory
该存储器允许存储消息和然后提取变量中的消息。该存储器保存对话在一段时间内的互动列表。该内存会在内存中保存最近交互的缓冲区,并使用标记长度而不是交互次数来决定何时刷新交互。该记忆功能可创建一段对话的摘要。通过这四种 memory 形式,我们可以使用 Langchain 实现有记忆存储的 LLM 聊天应用,使得我们的聊天更加顺畅,满足我们的需求。但同时,记忆存储功能不只能应用在聊天应用上,还可以运用在使用 LLM 进行信息检索等方面。将文本(来自对话或其他地方)存储在矢量数据库中,并检索最相关的文本块。
2024-12-28 16:31:17
1167
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅