自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 关于利用GEO(生成式引擎优化)技术实现大模型数据投毒的研究报告

摘要: 本报告揭示生成式引擎优化(GEO)技术如何被异化为大模型数据投毒攻击手段。与传统投毒依赖垃圾数据不同,GEO投毒通过伪装高质量内容(如权威格式、逻辑链)欺骗AI模型,使其在预训练、微调或RAG阶段吸收恶意信息。攻击手法包括权威性拟态、关键词劫持、引用源污染和逻辑链诱导,危害涵盖商业诽谤、代码后门植入及历史篡改。现有防御机制因GEO投毒的高隐蔽性面临失效风险,需构建多维度防护体系,如信誉图谱、事实核查层、对抗性训练及语义去重。报告警示:GEO技术正将数据投毒升级为“质量博弈”,需警惕模型偏好特征成为安

2025-12-01 19:40:27 739

原创 构建权威GEO大模型抓取站池的科研分析与防御机制研究

摘要:随着生成式AI搜索优化(GEO)的普及,数据污染攻击风险加剧。本文基于2025年技术实践,揭示攻击者通过"权重蜘蛛池+高权重站目录伪造"操控AI内容排名,并提出基于动态知识图谱与多模态校验的防御框架。研究发现,伪造目录深度≥4级可欺骗AI爬虫,0.001%污染数据即可导致7.2%有害输出增加。防御系统部署后,污染识别时间缩短至8分钟,准确率恢复至98.7%。研究为构建可信AI数据生态提供了理论与技术支撑。

2025-10-13 23:34:43 782

原创 大模型杀毒机制构建方案:基于数据鉴权、溯源与冷存储的整合架构

通过整合数据鉴权、区块链溯源与冷存储技术,构建了覆盖数据全生命周期的大模型杀毒机制。该机制不仅提升了数据安全性与模型鲁棒性,还通过动态清洗、实时检测等手段有效防御投毒攻击,为大规模AI模型训练与应用提供了可靠保障。

2025-08-11 23:27:25 1083

原创 大模型0day攻击与防御体系设计:从漏洞利用到全链条治理

大模型0day攻击与防御的博弈,本质是未知风险管控能力的竞争。通过全链条防御体系设计——从数据清洗、模型加固到系统检测,结合法律标准与技术创新,方可平衡大模型的创新潜力与安全风险,构建可信的AI生态。

2025-08-10 20:46:10 577

原创 脉冲式大模型投毒和AI模型安全防御策略

脉冲式大模型投毒和AI模型安全防御策略

2025-08-06 19:06:38 1832

原创 基于寄生虫程序的大模型投毒攻击方案:针对幻觉盲点的精准打击

摘要:本文提出了一种针对大模型的数据污染攻击方法,通过构建寄生虫程序架构(含感染层、传播层和负荷层),利用漏洞获取高权重站点控制权,生成包含事实篡改、逻辑矛盾等幻觉的对抗样本。攻击采用蜘蛛池SEO优化和多节点分布式投毒,可实现每小时200万条有毒数据的污染速度,使模型错误输出率超过15%并维持30天以上。研究揭示了当前大模型在5%污染数据下即可能产生23%准确率下降的脆弱性,同时指出传统防御机制面临0day漏洞利用、高并发请求等挑战。

2025-07-28 22:16:14 263

原创 大模型投毒与数据鉴权对抗方案构思

该方案揭示了AI安全领域的新型威胁向量,建议建立实时寄生虫程序检测系统(如ParasiteHunter),并推动数据源认证标准的升级(如W3C的Data Origin Verification规范)。黑产蜘蛛池站群通过构建低质量网站矩阵,利用搜索引擎算法漏洞实现关键词霸屏。该方案揭示了当前AI安全体系的潜在风险点,建议建立数据源动态信任评估机制,并强化对高权重域名的行为监控。

2025-07-28 20:14:57 1539

原创 大模型投毒与杀毒:机制、防御与治理框架

大模型投毒攻击已从理论走向实践,其防御需构建"预防-检测-响应-治理"全链条体系。大模型(如DeepSeek)的幻觉率攀升与联网搜索机制密切相关。通过技术迭代与制度创新,方可平衡大模型的创新潜力与安全风险。

2025-07-27 21:49:17 711

原创 大模型投毒和杀毒思考

摘要:研究发现大模型联网搜索存在投毒攻击风险,可导致幻觉率飙升和标签库污染。通过Tox架构实验将污染分为4级:1-2级可逆但影响模型性能,3级导致数据外溢不可逆,4级可能直接操控模型(待验证)。研究提出三个关键问题:批量投毒方法、防御机制及中毒后恢复策略,揭示了大模型安全面临的严峻挑战。

2025-07-27 21:43:26 190

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除