cookieSDU-优快云博客

原创智辩星WitNova 代码说明文档——山东大学软件学院2025创新项目实训

目录后端各文件代码功能详细说明app/api/routes/community.pyapp/api/routes/debate.pyapp/api/routes/deepseek.pyapp/api/routes/training.pyapp/api/routes/users.pyapp/api/routes/websocket.pyapp/api/deps.pyapp/core/config.pyapp/core/security.pyapp/email-templates/build/email_cod

2025-06-16 18:05:42 904

原创智辩星WitNova 用户操作手册——山东大学软件学院2025创新项目实训

智能陪练是平台的核心功能之一，用户可以与 AI 进行实时辩论，将自己针对论点的辩论发送给AI，AI会对用户的辩论内容进行分析和点评，并给出改进建议，提升用户的辩论技巧和反应能力。点击具体的辩论和培训，可以查看具体每次辩论和培训的内容，用户的输入和AI的回复，同时可以查看辩论的结果，供用户进行复盘反思。（4）选择辩论轮数：平台支持选择1-10的轮数，用户可以选择适合的赛制和辩论次数，以合理控制辩论赛的时间。辩论仿真功能支持用户模拟真实的1v1辩论赛事，自定义辩题、辩论轮数和参赛角色，体验不同的辩论场景。

2025-06-16 12:51:32 1207

原创大模型创新应用之RAG实战篇混合检索——山东大学软件学院项目创新实训（九）

在检索操作中，和是两种十分常用的检索方式。关键词检索（如BM25）和向量相似度检索（如Embedding）各有优劣。关键词检索基于精确的词项匹配，适合处理明确的查询，例如日期、名称或专业术语，速度快且结果可解释，但无法理解语义，遇到同义词或表达差异时效果受限。向量检索则通过深度学习模型捕捉语义关系，能泛化到未见过的表达方式，支持模糊查询和多语言场景，但计算成本较高，且可能因过度泛化返回不相关结果，例如把编程语言“Python”误匹配为动物“蟒蛇”。而。

2025-06-11 19:14:28 759

原创大模型创新应用之RAG实战篇基于向量检索的RAG——山东大学软件学院项目创新实训（八）

类中包含的属性有向量数据库、大语言模型的api接口以及需要返回的检索结果个数，类中还定义了一个对话的方法，对于用户输入的问题，去向量数据库实例中进行检索拿到检索结果，然后构建提示词，把检索结果和用户输入的问题传入之前已经定义好的提示词模板（如下图所示，context就是向量数据库的检索结果，query就是用户输入的问题）中，然后利用api调用deepseek大语言模型，传入提示词，返回LLM的最终结果。依然存在问题，这个输出结果表示异步代码未被正确执行，核心问题是没有正确使用 await，

2025-05-28 13:51:49 155

原创大模型创新应用之RAG实战篇 Chroma向量数据库——山东大学软件学院项目创新实训（七）

向量数据库是一种专门设计用于存储、管理和检索高维向量数据的数据库系统。其核心功能在于通过数学空间中的向量表示非结构化数据（如文本、图像、音频、视频），并基于相似性度量实现高效检索。与传统关系型数据库依赖精确匹配或固定字段查询不同，向量数据库利用嵌入技术将数据转化为高维向量，从而捕捉语义或上下文关联性。这类数据库的核心技术包括近似最近邻（ANN）搜索算法，如IVFFlat、HNSW等，能够在海量数据中快速定位与查询向量最接近的结果。

2025-05-17 10:33:20 1762

原创大模型创新应用之RAG实战篇 M3E模型——山东大学软件学院项目创新实训（六）

由于本项目的辩论数据集以中文为主，因此采用M3E文本向量模型。

2025-05-07 10:00:49 988

原创大模型创新应用之RAG实战篇文本向量——山东大学软件学院项目创新实训（五）

例如，二维空间中的向量可以表示为(x,y)，它表示从原点(0,0)到点(x,y)的有向线段。以此类推，我们可以用(向量之间可以计算距离，而距离的远近就对应于语义相似度的大小，意思接近的句子转换成的向量之间距离应当很小。或者我们可以对选定的向量模型用相关文档进行测试，检验一下语义相似的两句话转换成的向量距离是否很小等等，来对模型进行评估。的训练方式：首先构建相关（正例）与不相关（负例）的句子对样本，然后让正例间的距离小，负例间的距离大。：两个向量之间夹角的余弦值，夹角越小，余弦值越大，相似度越高。

2025-05-04 23:58:58 294

原创智辩星WitNova 软件详细设计说明书——山东大学软件学院2025创新项目实训

当前社会热点议题等公共讨论日益频繁，但传统辩论教育存在高门槛（需专业教练）、低互动（缺乏实时反馈）和资源不均（优质内容稀缺）的痛点。本项目通过深度融合大语言模型（DeepSeek）与教育技术，打造零门槛、高交互、智能化、沉浸式的AI辩论训练平台，通过技术赋能思维训练，解决思维训练领域的“教-学-练-评”闭环难题。评估系统（Evaluation System）实现低延迟（<500ms）的实时辩论交互。支持100+并发用户的稳定服务。构建10+维度的智能评估体系。模拟5+并发用户辩论场景。

2025-05-04 00:22:43 874

原创智辩星WitNova 软件概要设计说明书——山东大学软件学院2025创新项目实训

实时辩论系统模块DeepSeek 对话接口封装：基于 FastAPI 重构后端接口，封装 DeepSeek 对话 API，实现论点生成接口、逻辑反驳接口和辩论复盘接口。智能训练建议：统计用户行为数据（如辩论失败次数、发言长度、反驳成功率），基于规则和用户个人能力（逻辑能力、反驳能力等 5 个基础维度）生成训练建议，覆盖率 80%。用户成长体系模块积分与徽章系统：设计 5 类积分规则（如每日登录、完成辩论等获取积分），设置青铜、白银、黄金 3 种徽章等级（按总分触发，覆盖率 100%）。

2025-05-02 00:33:11 833

原创智辩星WitNova 项目进度——山东大学软件学院2025创新项目实训

本次会议针对智辩星 WitNova 项目，确定了工作内容与分工，涵盖核心功能、辅助系统和扩展功能。在项目申请书和任务书审核通过之后，小组全体成员立即进行了第一次线下会议，针对项目的实施方案和总体开发计划展开了热烈的讨论，大家各抒己见，共同梳理出了优化方案。1. 实现辩论会话的记录与管理功能，记录完整辩论流程，将历史会话融入大模型Prompt，支持会话回溯与持续对话，查看辩论记录等功能。第1-3周：核心辩论功能开发（接口调用）+ 基础框架搭建（基础UI）3. 设计敏感词过滤规则，实现辩论社区用户高质量互动。

2025-05-01 23:48:26 2487

原创智辩星WitNova 需求规格说明书——山东大学软件学院2025创新项目实训

社会公共讨论需求激增，传统辩论教育存在高门槛（依赖专业教练）、低互动性（缺乏实时反馈）、资源分配不均（优质内容稀缺）三大痛点。从公开辩论平台（如华语辩论网、PROCON等）、学术数据库（如CNKI等）及开源辩论数据集（如Debatepedia语料）爬取/收集500 + 条结构化辩论语料，原始数据文本量>100MB。标注每条语料的核心属性：辩论主题、正反方立场、核心论点、论据支持、逻辑结构（如因果论证、类比论证）定义 JSON 格式的消息结构，包含消息类型（如立论、反驳、复盘）、内容、时间戳等字段。

2025-04-29 09:20:41 748

原创智辩星WitNova 用户需求说明书——山东大学软件学院2025创新项目实训

多维评分（逻辑性、说服力、语言质量），生成可视化报告及个性化提升建议。

2025-04-28 19:36:30 1150

原创大模型创新应用之RAG实战篇 DeepSeek接口封装与Prompt提示词模板——山东大学软件学院项目创新实训（四）

DeepSeek接口封装已经由团队另一位成员实现，主要是初始化一个OpenAI客户端，指定好服务地址base_url和身份验证密钥api_key，然后用客户端调用大模型服务的聊天补全接口，并指定好模型model（本项目采用DeepSeek-R1模型），消息messages（包含角色role和内容content）以及流式响应模式stream等生成参数。以上函数需要传入两个参数，一个是包含占位符的模板字符串prompt_template，一个是关键字参数集合**kwargs，用于填充模板中的占位符。

2025-04-22 21:53:51 561

原创大模型创新应用之RAG实战篇文档的加载与分割——山东大学软件学院项目创新实训（三）

现在我们已经初步获取到了辩论相关的文档数据集，但是面对庞大的数据集和过多的文档内容，我们就需要先对其进行分块。分割文档，主要是因为模型处理长文本的能力有限——直接塞入大段内容很有可能会截断关键信息，而分割成小块后，既能适配模型的上下文窗口，又能提高检索效率。小块文本信息更集中，检索时更精准，避免返回无关内容；同时，合理分割（比如按段落或章节）能保留局部语义连贯性，让生成的答案更准确。此外，分割后的小文本计算和存储成本更低，适合大规模应用。

2025-04-13 21:21:15 2045

原创大模型创新应用之RAG实战篇 python爬虫——山东大学软件学院项目创新实训（二）

在预备篇中我们提到，如果需要提高大模型在某个特定领域问题回答的准确性，那我们首先就需要获取该领域大量的文章、资料等数据来源。对于辩论而言，我们就需要获取大量关于社会热点和公众讨论的话题和例证，像这样的文档我们可以通过爬取一些辩论或新闻网站来获取数据信息。

2025-04-04 23:14:02 1003

原创大模型创新应用之RAG预备篇——山东大学软件学院项目创新实训（一）

如果需要提高大模型在某个特定领域问题回答的准确性，那我们首先就需要获取该领域大量的文章、资料等数据来源，然后对获取到的原始数据进行清洗加工，比如去除噪声、格式化、去重等，尽可能提高文本数据的质量，然后对文本进行分组、分词处理以及向量化处理，最后分门别类存储到向量数据库中即可。当我们输入一个问题时，RAG首先会将该问题描述转化成向量，然后去向量数据库中检索相似的片段，然后将检索到的信息和刚刚输入的问题组合起来，形成一个完整的、提示性很强的提示词（prompt）投喂给大语言模型，从而生成更加准确具体的回答。

2025-03-31 22:42:57 759

cookieSDU的博客