- 博客(323)
- 资源 (10)
- 收藏
- 关注
原创 详解大模型四类漏洞
大语言模型(LLM)的漏洞,分为安全与访问控制、合规与法律、信任与安全、品牌四大类。具体包括注入攻击、知识产权侵权、有害内容、错误信息等多种风险。
2025-04-04 23:15:00
389
原创 PurpleLlama大模型安全全套检测方案
PurpleLlama包含多个关键工具和评估基准,用于提升LLM的安全性:(1)CyberSec Eval:网络安全评估工具,用于量化LLM在网络安全方面的风险,包括生成恶意代码的可能性、不安全代码建议频率以及协助网络攻击的能力。(2)Llama Guard:输入输出保护工具,用于过滤和检查LLM的输入输出内容,防止生成危险输出或被黑客利用。(3)Prompt Guard:提示保护工具,用于检测和阻止恶意提示注入,确保基于LLM的应用程序的安全性。
2025-03-21 22:15:00
1457
原创 基于trl复现DeepSeek-R1的GRPO训练过程
本文讲解了借助trl对Qwen2.5-0.5B-Instruct做GRPO的强化学习训练(DeepSeek)的过程,包括数据、数据处理、reward函数定义、训练前后的模型输出差异。
2025-03-01 23:15:00
1557
1
原创 解读“大语言模型(LLM)安全性测评基准”
本文汇总了,大语言模型在用户输入prompt的操作后,大语言模型输出相应结果,这个过程中遇到的两大类安全问题,8种“prompt安全”问题与6种“内容安全”问题。
2025-02-04 23:45:00
732
原创 从TinyZero的数据与源码来理解DeepSeek-R1-Zero的强化学习训练过程
通过具体的数据与处理训练过程,来更好的理解DeepSeek-R1-Zero的强化学习训练方法。
2025-02-02 22:26:37
3629
原创 重点解读《From Naptime to Big Sleep: Using Large Language Models To Catch Vulnerabilities In Real-World》
Google Project Zero团队与Google DeepMind团队合作,将Naptime项目升级,得到了Big Sleep项目,这也是一个Agent。
2025-01-11 23:30:00
357
原创 模糊测试中常见的10种变异mutation策略
基于变异策略的模糊测试,有两个重点:(1)seed:种子,初始的合法输入序列。(2)mutation:对已经存在的输入序列,进行微调。那mutation有哪些策略呢?
2024-12-04 23:30:00
482
原创 文章解读《Project Naptime: Evaluating Offensive Security Capabilities of Large Language Models》
Google的Project Zero团队,开发了一个叫做Naptime的项目,用于做漏洞研究
2024-11-25 23:30:00
658
原创 论文重点记录《RACONTEUR: A Knowledgeable, Insightful, and Portable LLM-Powered Shell Command Explainer》
文章重点内容解读RACONTEUR: A Knowledgeable, Insightful, and Portable LLM-Powered Shell Command Explainer
2024-11-09 23:30:00
340
原创 wireshark抓包查看langchain的ChatOpenAI接口发送和接收的数据
通过wireshark抓包,目的IP地址过滤,追踪流,就能看到langchain的ChatOpenAI发送的POST请求细节内容,并能依此构造一个POST请求来模拟该接口的通信。
2024-11-02 22:45:00
514
原创 COT存在的问题以及ReAct Agent对此所做的优化
从ReAct的论文中(参考1),可以看到,单纯用COT,也会存在一些问题,靠COT也无法很好的回答问题,如下图所示
2024-10-26 23:30:00
427
原创 文章被modelscope转载
笔者的这篇文章《vllm部署Mistral-Large-Instruct-2407》被转载到modelscope了,记录一下:
2024-10-08 23:30:00
262
原创 nanoGPT用红楼梦数据从头训练babyGPT-12.32M实现任意问答
训练babyGPT-12.32M,使用GPU,以《红楼梦》为训练集语料,只需要4分钟,就能完成。也能实现(效果很差,输出难以控制,但语气上确实有那么点意思的)AIGC
2024-09-18 22:45:00
1066
原创 vllm部署Mistral-Large-Instruct-2407
vllm部署最新发布的最强大模型Mistral-Large-Instruct-2407为openai兼容接口
2024-07-25 23:30:00
1307
2
原创 MongodDB实现用户名密码远程登录的配置步骤
安装后不需要密码,就能连接上MongoDB,这是不安全的行为。那如何实现根据用户名密码才能远程连接某个特定的数据库呢?
2024-05-27 22:23:00
1177
原创 使用OpenVINO在本地CPU运行大模型的过程
本文在CPU上实测一下OpenVINO运行大模型ChatGLM3-6b的运行效果,并记录整个过程
2024-04-27 23:00:00
1246
原创 conda create 报错 Connection to repo.anaconda.com timed out 的修复
conda create 环境时,报错 Connection to repo.anaconda.com timed out 的修复方法
2024-04-22 23:45:00
4149
2
原创 使用binwalk提取混合类型文件中的子文件
使用固件分析工具binwalk,可以很方便的判断混合类型文件,并提取混合类型文件中的子文件,本文说明该工具的安装到使用实例
2024-04-04 23:15:50
828
原创 理解大模型训练中的 Pre-Training,Fine-Tuning,In-Context Learning,Reward Modeling,PPO,DPO,RLHF
大模型训练中的 Pre-Training,Fine-Tuning,In-Context Learning,Reward Modeling,PPO,DPO,RLHF的含义与区别。
2024-03-09 23:30:00
5844
原创 使用gpu_burn对GPU进行压测
使用gpu_burn,能在命令行中,对服务器上的每一个GPU进行压力测试,得出其速度、温度等关键指标。
2024-02-07 23:45:00
10292
1
原创 记一次Centos7上无法连接到MongoDB的处理步骤
当mongodb出现问题时,可以通过mongodb的log(`sudo tail /var/log/mongodb/mongod.log`),或者看命令`mongod`的输出,来定位问题。
2024-01-31 23:30:00
733
原创 解读4篇混合类型文件Polyglot相关的论文
解读4篇混合类型文件Polyglot相关的论文,涵盖混合类型检测、恶意混合类型软件检测、相关的CVE和漏洞。
2024-01-30 21:32:27
1167
原创 基于LLaMA-Factory用deepspeed多GPU训练大模型报错Caught signal 7 (Bus error: nonexistent physical address)
基于LLaMA-Factory用deepspeed多GPU训练大模型报错Caught signal 7 (Bus error: nonexistent physical address)的解决方法
2023-12-21 23:45:00
4015
2
nForm 国际化开发一例
2013-07-03
最简单的linux字符设备驱动
2012-11-25
简单的winsock编程客户机、服务器示例
2011-03-09
数据结构(C#语言版)
2011-02-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人