- 博客(868)
- 资源 (138)
- 收藏
- 关注
原创 Heldroid:基于语言和静态分析的勒索软件检测方案深度剖析
Heldroid作为一种创新的勒索软件检测方案,通过将自然语言处理、静态代码分析和机器学习相结合,为勒索软件的检测提供了一种高效、准确的解决方案。其多维度的特征融合、高效的预过滤机制和跨平台的检测能力,使其在勒索软件检测领域具有重要的研究价值和应用前景。未来,随着技术的不断发展和完善,Heldroid有望成为网络安全领域的重要工具,为保护用户的设备和数据安全发挥更大的作用。关注“AI拉呱公众号”一起学习更多AI知识!
2025-03-28 17:14:50
572
原创 Redemption:终结勒索软件的实时防御黑科技
Redemption通过创新的内核级防护机制,为勒索软件防御提供了新范式。其零数据丢失、低系统开销的特性,使其成为企业终端安全的理想选择。随着攻防技术的持续演进,实时行为分析+主动防御将成为未来安全产品的标配。延伸阅读Redemption论文原文深信服勒索防护方案对比Check Point反勒索白皮书关注“AI拉呱公众号”一起学习更多AI知识!
2025-03-28 17:06:34
40
原创 DeepSeek V2版本和V3版本的区别
MLA技术的引入,使得在大模型运行过程中,每次生成一个token时,只需要处理与之相关的token,极大地提高了处理效率并降低了显存占用。DeepSeek-V2首次引入MoE(混合专家模型)架构,这一架构通过多个子模型(即“专家expert”)的组合,有效减少了参数量和硬件消耗,从而实现了高效的推理和成本效益高的训练。在 MoE 模型中,输入数据通过路由机制被分配给不同的专家(Expert),每个专家是一个独立的神经网络模块,负责处理特定部分的输入数据。每个深度上对每个标记进行预测时保持完整的因果链。
2025-03-27 09:40:43
25
原创 大语言模型新助手:KBLAM 知识增强技术解读
KBLAM 为增强 LLMs 的知识提供了一种全新的、高效的方法。它把外部知识表示成密集的连续向量,利用知识三元组之间的独立性,避免了大规模知识源上昂贵的自注意力计算,实现了动态知识更新,还提高了模型的可解释性。不过,KBLAM 也有一些可以改进的地方。比如在处理分布外数据集时,性能还有提升的空间,这可能需要更优质、多样的合成数据来训练。而且,知识令牌在编码过程中可能会损失一些信息,未来可以通过调整超参数来优化。此外,探索更复杂的指令调整方式,也能让 KBLAM 在知识推理方面发挥更大的潜力。
2025-03-26 12:00:54
35
原创 智慧眼镜OS - 智能眼镜操作系统及超级应用(配置硬件可以直接做一个超级眼镜)
智慧眼镜OS 使你能够**《同时》**运行多个应用程序,这样你就可以真正充分利用以人工智能为优先的可穿戴应用程序。想象一下,一个由超级智能助手组成的委员会在倾听你的对话,并帮助你解决问题、产生新想法,并更好地与你正在交谈的人建立联系。*大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。你的朋友建议你明天去烧烤。一个主动人工智能代理会搜索明天的天气预报,并将有雨的预报覆盖在你的视野中。
2025-03-25 19:53:13
471
原创 深入理解局部神经网络(LNN):原理与实例解析
局部神经网络(LNN)是一种特殊的神经网络结构,它的主要特点是神经元之间的连接具有局部性。与传统的全连接神经网络不同,在LNN中,每个神经元只与输入层的一部分神经元相连,而不是与所有神经元相连。这种局部连接的方式大大减少了网络的参数数量,从而降低了计算复杂度,提高了训练效率。我们使用经典的MNIST手写数字数据集来演示LNN的应用。MNIST数据集包含60,000张训练图像和10,000张测试图像,每张图像都是28x28像素的灰度图像,代表了0-9之间的一个数字。
2025-03-25 17:37:00
136
原创 RAG是如何工作以及开发栈是什么样的?
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。
2025-03-25 17:00:24
423
原创 什么是RAG与为什么要RAG
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。检索增强生成(RAG)是一种流行的技术,通过在生成答案之前从知识库中检索相关的外部知识来增强 LLM 的响应。RAG 提高了准确性,减少了幻觉,并使模型能够提供更符合上下文和更新的信息。RAG 包括三个步骤:检索、增强和生成。在此步骤中,系统会在外部知识源(例如向量数据库)中搜索相关信息,以基于用户查询找到相关的信息。
2025-03-24 16:15:23
907
原创 学习RAG的资源集合:RAG是LLM的“图书馆”
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。
2025-03-24 15:19:45
445
原创 股票量化机器人-特征选择
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。
2025-03-23 18:04:19
30
原创 安全架构全景图
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。
2025-03-14 14:33:13
28
原创 DeepSeek基本原理和核心创新点
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。
2025-03-14 11:59:41
36
原创 如何私有化部署DeepSeek?
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。
2025-03-14 11:56:06
35
原创 什么是ATTCK以及其核心的组件
含义:一般为网络流量中或者操作系统上观察到的能高度表明计算机被入侵的痕迹.将这些特征收集整理为库,下次再表现如此特征就确定计算机已经被入侵了.
2025-03-13 17:50:30
110
原创 IDS入侵检测系统和IPS入侵防御系统什么区别
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。
2025-03-11 11:06:39
37
原创 cursor(cline)+MCP:让工作效率直接起飞
Function Calling、AI Agent、MCP 这三者之间有什么区别?Function Calling 指的是 AI 模型根据上下文自动执行函数的机制。Function Calling 充当了 AI 模型与外部系统之间的桥梁,不同的模型有不同的 Function Calling 实现,代码集成的方式也不一样。由不同的 AI 模型平台来定义和实现。MCP 是一个标准协议,如同电子设备的Type C 协议(可以充电也可以传输数据),使 AI 模型能够与不同的 API 和数据源无缝交互。
2025-03-11 10:07:54
1008
原创 论文《AVScan2Vec: 恶意软件转成向量》解读
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。
2025-03-10 16:20:38
1107
原创 manus是AGI还是惊鸿一瞥?
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。
2025-03-06 23:24:17
290
原创 IDS入侵检测系统和IPS入侵防御系统什么区别
入侵检测系统(Intrusion Detection System,简称IDS)是一种网络安全设备或软件应用,旨在监控网络流量,检测潜在的恶意活动或违规行为。它不仅能发现敌人,还能主动出击,阻止敌人的进攻。:当IPS检测到恶意流量时,可以立即阻断该流量,防止其进入网络。比如,如果检测到某个IP地址正在进行暴力破解,IPS会直接断开与该IP的通信。比如,如果发现某个邮件附件中包含恶意软件,IPS会阻止该邮件的传输。IPS的工作方式就像一位门卫,不仅能发现可疑人员,还能直接拒之门外。
2025-03-05 21:16:33
34
原创 LLM自动金融量化-CFGPT
是一个开源的语言模型,首先通过在收集和清理的中国金融文本数据(CFData-pt)上进行继续预训练,包括金融领域特定数据(公告、金融文章、金融考试、金融新闻、金融研究论文)和通用数据(维基百科),然后使用知识密集的指导调整数据(CFData-sft)进行微调。我们使用CFBenchmark-Basic进行初步评估。与几个具有相似参数的基线模型相比,CFGPT在识别,分类和生成任务上表现具有优势。我们基于。
2025-03-05 09:46:18
144
原创 什么是等保和等保三级的具体要求(一篇就够,点赞收藏)
等保(信息安全等级保护)是我国网络安全领域的核心制度,旨在对信息和信息系统按照其重要性和受破坏后的危害程度分等级实施保护。
2025-03-05 09:24:25
30
原创 从漏洞到防御:大型语言模型在增强网络安全中的作用
题目:《From Vulnerability to Defense: The Role of Large LanguageModels in Enhancing Cybersecurity》论文介绍:随着网络威胁日益复杂,传统网络安全机制面临挑战,大语言模型(LLMs)的出现为网络安全领域带来变革。文章全面探讨了 LLMs 在网络安全中的应用、面临的挑战及未来发展方向。关键词:大语言模型;入侵检测;恶意软件检测;钓鱼攻击检测。
2025-03-04 11:58:59
883
原创 什么是“模型坍塌“及如何解决“LLM模型坍塌“?
模型坍塌(Model Collapse)是深度学习和生成模型中常见的现象,指模型在训练过程中逐渐失去多样性和泛化能力,导致性能严重退化甚至无法继续优化。Bender等人(2021)强调,仅在合成数据上训练的模型可能会进入一个退化循环,生成缺乏新颖性和原创性的输出。这是因为这些模型越来越依赖自身的输出或类似系统的输出,导致对语言的理解趋于同质化且不够稳健。性能退化:训练过程中,模型的准确率下降、损失函数发散或过拟合。生成模型(如GAN)中,生成器可能仅输出单一或重复的结果(如所有样本趋同于某个模式)。
2025-02-28 16:28:06
35
原创 人工智能+Excel=提升生产力(点赞收藏)
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖,拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。
2025-02-26 19:06:14
342
原创 大语言模型Agent在网络安全领域的应用案例
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖,拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。本文章深入探讨了三个核心问题:如何构建针对网络安全的LLMs、LLMs在网络安全任务中的应用,以及该领域面临的挑战和未来研究方向。
2025-02-25 19:31:57
81
原创 关于DeepSeek的提效工具汇总,点赞收藏,你一定会用得到!
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖,拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。
2025-02-24 22:24:52
305
原创 论文解读<CRAW4LLM: Efficient Web Crawling for LLM Pretraining>
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖,拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。
2025-02-24 17:26:32
152
原创 DeepSeek等LLM对网络安全行业的影响
DeepSeek等大模型也在升级攻击方法,恶意邮件生成,恶意软件生成等助理黑客攻击;其次在防御方法上DeepSeek等大语言模型有强大的自然语义理解能力,可以在安全运营,安全检测能力等方法上有很大的帮助,减轻安全分析工程师的压力.关注评审分享一起学习更多知识!
2025-02-23 19:06:14
210
原创 一篇文章了解DeepSeek的创新以及原理以及如何使用?
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖,拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。
2025-02-21 19:00:00
145
原创 网络安全:DeepSeek已经在自动的挖掘漏洞
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖,拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。
2025-02-20 22:26:13
2571
原创 网络安全的态势如何以及如何解决?
大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,兼职硕士研究生导师;热爱机器学习和深度学习算法应用,深耕大语言模型微调、量化、私域部署。曾获多次获得AI竞赛大奖,拥有多项发明专利和学术论文。对于AI算法有自己独特见解和经验。曾辅导十几位非计算机学生转行到算法岗位就业。
2025-02-18 23:51:45
137
原创 DeepSeek原理介绍以及对网络安全行业的影响
DeepSeek是一家成立于2023年7月17日的创新型科技公司,由知名量化资管巨头幻方量化创立。致力于开发和训练强大的大语言模型(LLM),这些模型可以用于各种自然语言处理任务,例如文本生成、AI基础设施构建以及AI应用探索等。补充:“杭州六小龙”指的是游戏科学(黑悟空)、深度求索(DeepSeek)、宇树科技(四足机器人)、云深处科技(类人机器人)、强脑科技(研究脑机接口)和群核科技(空间智能)六家企业公司。这6家公司5家都是与AI强关联的公司。
2025-02-17 17:47:19
2138
原创 Agent快速构建框架的langGraph到底是什么及案例
LangGraph 通过图结构解决了传统 Agent 框架在复杂流程控制上的不足,特别适合需要循环、多角色协作或人工干预的场景。其设计理念在可控性、可靠性和灵活性之间取得了平衡。创作不易,欢迎评论和关注作者,学习更多知识。
2025-02-15 20:17:23
703
原创 深入研究Deepseek以及团队精神
在今天这个社会高速发展的阶段,特别是科技创新企业,要用于颠覆式创新,走别人没走过的路,用于尝;其次敢于试错,试错对于很多科学研究以及实验具有非常高的价值。企业以及员工的格局要大,用于解决人类科技难题。
2025-02-12 14:27:54
706
原创 基于Ollama 和 Open WebUI 部署 DeepSeek-R1
DeepSeek是目前推理效率最高的模型,私有化部署模型有助于企业将私有化的数据与LLM结合。解决具体的企业问题,提效研发。
2025-02-11 16:00:19
370
原创 什么是知识蒸馏以及模型知识蒸馏案例解读
通过上面的结果分析,我们可以看出模型蒸馏后会对准确率有所降低,但是模型的大小有了20%的降低,这样特别对于大语言模型领域有了重要的意义。我们都知道ChatGPT也是有采用蒸馏模型来降低对算力依赖,国产大模型厂商也在使用蒸馏模型。希望以上内容对你有所帮助,关注我获取更多的关于人工智能方面的知识。
2025-02-10 21:55:12
1246
原创 DeepSeek深度剖析以及蒸馏概念
开源的生态很重要,让大家用起来,形成产品的生态圈;创新要坚持从第一性原理出发,从现有模型的缺点以及不足开始,逐步深入,实现颠覆式创新。任何LLM的成本非常关键,如何能降低推理成本是非常重要的事情。客户需求、使用效果永远是决定产品成本的关键。
2025-02-10 11:15:33
609
原创 作为安全从业人员的技能树
大语言模型时代的网络安全态势更加紧迫,如何使用新时代的工具来学习攻防,同时网络安全攻防都在不断变革新的技术,如何做好攻防是一个关键点。
2025-02-09 13:48:36
1116
原创 DeepSeek的核心创新点
DeepSeek 能够实现大规模强化学习的一个重要技术特点是其采用了基于规则(rule-based)的方法,确保强化学习可以规模化,并实现面向强化学习的扩展(Scaling).能力密度:所谓的能力密度,可以理解为模型在各种评测集上展现出来的能力,除以其参数规模,或者说是激活的参数规模。在真正训练模型之前,我们会进行大量的风洞实验,积累各种预测数据,以确定模型需要什么样的数据配比和超参配置,从而达到最佳效果。高质量的数据能够提升模型的训练效果。:采用更稀疏激活的模型架构,可以用更少的激活参数承载更多的能力。
2025-02-08 09:58:53
50
原创 DeepSeek到底做了哪些创新?
DeepSeek已发布了多个版本的模型,包括DeepSeekLLM、DeepSeek-Coder、DeepSeekMath、DeepSeek-VL、DeepSeek-V2、DeepSeek-Coder-V2、DeepSeek-VL2以及DeepSeek-V3等。DeepSeek在保持高性能的同时,实现了显著的成本降低。在全球竞争激烈的大模型领域,DeepSeek不断探索前沿技术,例如在DeepSeek-V3中,通过创新性的架构设计与算法优化,实现了性能的大幅提升,同时成本显著降低,使其在市场中脱颖而出。
2025-02-07 15:49:14
70
智慧眼镜OS - 智能眼镜的开源操作系统.zip
2025-03-25
基于Transformer的高光谱遥感场景图像分类与识别(内含数据集).zip
2025-03-07
基于C语言实现婴儿哭声检测刻在arm板上运行.zip
2025-02-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人