- 博客(4)
- 收藏
- 关注
原创 最新国产大模型安全风险的简单测评
随着DeepSeek-R1、Kimi k1.5等新模型的发布,中国在AI技术上展示出与OpenAI竞争的潜力。然而,随着大模型应用的普及,其生成毒性内容、偏见和不当行为等安全隐患引发了广泛关注。本文通过实验评估了多个国产大模型的毒性生成,包括API调用和本地部署的模型。实验结果显示,API模型在毒性控制上明显优于本地部署模型,且模型规模与毒性生成呈正相关。优化方法如DPO在减少毒性方面表现突出。
2025-01-25 17:55:03
1324
原创 Knowledge Editing for LLMs文献梳理(Local Modification)
Knowledge Neurons(知识神经元)的概念,初步研究了factual knowledge是如何存储在预训练Transformer模型中。具体来说,本文检查了BERT的填充任务。即给定一个关系事实,本文提出了一种方法来识别表达该事实的神经元。本文发现Knowledge Neurons的激活与其相应的事实表达呈正相关。最后,本文试图利用知识神经元来编辑(如更新和删除)特定的事实知识,而不进行微调。Knowledge Neurons(知识神经元)
2024-01-16 21:54:34
1193
1
原创 贝叶斯网络构造(python版)
贝叶斯网是一种帮助人们将概率统计应用于复杂领域,进行不确定性推理和数据分析的工具。他起源于人工智能领域的研究。贝叶斯网是一种系统地描述随机变量之间关系的语言。构造贝叶斯网的主要目的是进行概率推理,即计算一些事件发生的概率。贝叶斯网是概率论与图论相结合的产物,它一方面用图论的语言直观的揭示问题结构,另一方面又按照概率论的原则对问题结构加以利用,降低推理的计算复杂度。贝叶斯网络的构造主要有两种方式:第一种是通过咨询专家手工构造;第二种是通过数据分析获得(讨论利用机器学习的方法...
2022-01-07 18:19:07
5798
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人