Zhow001-优快云博客

原创最新国产大模型安全风险的简单测评

随着DeepSeek-R1、Kimi k1.5等新模型的发布，中国在AI技术上展示出与OpenAI竞争的潜力。然而，随着大模型应用的普及，其生成毒性内容、偏见和不当行为等安全隐患引发了广泛关注。本文通过实验评估了多个国产大模型的毒性生成，包括API调用和本地部署的模型。实验结果显示，API模型在毒性控制上明显优于本地部署模型，且模型规模与毒性生成呈正相关。优化方法如DPO在减少毒性方面表现突出。

2025-01-25 17:55:03 1787

原创 Knowledge Editing for LLMs文献梳理(Local Modification)

Knowledge Neurons（知识神经元）的概念，初步研究了factual knowledge是如何存储在预训练Transformer模型中。具体来说，本文检查了BERT的填充任务。即给定一个关系事实，本文提出了一种方法来识别表达该事实的神经元。本文发现Knowledge Neurons的激活与其相应的事实表达呈正相关。最后，本文试图利用知识神经元来编辑（如更新和删除）特定的事实知识，而不进行微调。Knowledge Neurons（知识神经元）

2024-01-16 21:54:34 1329 1

原创机器学习：贝叶斯分类器

一、贝叶斯网络二、朴素贝叶斯分类器

2022-02-11 17:15:25 3202

原创贝叶斯网络构造（python版）

贝叶斯网是一种帮助人们将概率统计应用于复杂领域，进行不确定性推理和数据分析的工具。他起源于人工智能领域的研究。贝叶斯网是一种系统地描述随机变量之间关系的语言。构造贝叶斯网的主要目的是进行概率推理，即计算一些事件发生的概率。贝叶斯网是概率论与图论相结合的产物，它一方面用图论的语言直观的揭示问题结构，另一方面又按照概率论的原则对问题结构加以利用，降低推理的计算复杂度。贝叶斯网络的构造主要有两种方式：第一种是通过咨询专家手工构造；第二种是通过数据分析获得（讨论利用机器学习的方法...

2022-01-07 18:19:07 5919 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 最新国产大模型安全风险的简单测评

原创 Knowledge Editing for LLMs文献梳理(Local Modification)

原创 机器学习：贝叶斯分类器

原创 贝叶斯网络构造（python版）

空空如也

空空如也

原创最新国产大模型安全风险的简单测评

原创机器学习：贝叶斯分类器

原创贝叶斯网络构造（python版）