大模型前沿技术及应用
文章平均质量分 82
介绍大模型前沿技术和应用。
AI安全这点事
欢迎关注微信公众号【AI安全这点事】,更新最新AI和网络安全论文和技术。博客后面可能不更新了,只在公众号更新。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
我用 Pygame + DeepSeek 做了一个中文 AI RPG 游戏!
DeepSeek接入游戏NPC原创 2025-04-06 18:18:31 · 840 阅读 · 0 评论 -
从AI博士到游戏开发者:不一样的人生选择
人生没有标准答案。我们或许会在某个阶段专注于一个领域,但这并不意味着我们不能改变方向。原创 2025-04-03 22:12:43 · 773 阅读 · 0 评论 -
python接入deepseek对数据分类分级
DeepSeek 是一个国产的开源大模型,具备强大的自然语言处理能力,能够进行文本理解、信息抽取、问答等任务。作为一款基于深度学习的 AI 模型,DeepSeek 采用了先进的 Transformer 架构,能够处理各类复杂的文本信息,为开发者提供高效的智能化解决方案。在实际应用中,我们常常需要对海量数据进行分类和分级,例如医疗记录的关键信息提取、新闻事件的自动摘要、企业文档的智能归档等。原创 2025-04-03 17:23:06 · 752 阅读 · 0 评论 -
【大模型实战】基于Llama2微调新闻情感分类
本实战内容基于Llama模型对情感新闻数据高效指令微调,预测结果表明微调之后的结果明显提高了分类性能。原创 2025-04-02 18:14:44 · 341 阅读 · 0 评论 -
【大模型架构解析】万字长文带你了解大模型中的NLP基础知识
自然语言处理(Natural Language Processing,NLP)是一门结合了计算机科学、人工智能和语言学的学科,旨在让计算机能够理解、生成和处理人类语言。NLP 的核心目标是使机器具备与人类交流的能力,无论是书面语言还是口头语言。近年来,随着深度学习和大数据的发展,NLP 技术取得了显著的突破,被广泛应用于机器翻译、文本摘要、情感分析、自动问答、语音识别等多个领域。NLP 主要涉及多个关键任务,如分词、词性标注、句法分析、命名实体识别和语义理解等。原创 2025-03-30 20:07:44 · 1022 阅读 · 0 评论 -
GPT 被破解?DeepSeek 提示词攻击揭秘与终极防御指南
随着大模型技术的迅猛发展,AI 在各个领域的应用日益广泛,然而,与此同时,提示词攻击(Prompt Injection Attack) 也逐渐成为突破 AI 安全防线的一种有效方式。尤其是 DeepSeek 这样的强大大模型工具,使得提示词攻击变得更加隐蔽且高效。原创 2025-03-27 10:34:50 · 1084 阅读 · 0 评论 -
【大模型实践笔记2】DeepSeek-R1大模型微调
本文通过在kaggle gpu上微调实战,轻松微调了网络安全领域问答数据。从结果来看,微调后的模型回答问题更精准,原始模型回答太宽泛。👉关注公众号【AI安全这点事】分享更多网络安全前沿技术和论文。原创 2025-03-27 10:30:28 · 341 阅读 · 0 评论 -
Deepseek辅助逆向破解Flappy Bird小游戏
Flappy Bird 作为一款经典的小游戏,以其魔性的玩法和高难度著称。今天,我们尝试利用辅助分析Smali 代码,并使用进行破解,探索游戏的逻辑。通过DeepSeek和,我们快速分析了Smali 代码,并成功破解了。这个方法不仅适用于游戏修改,也能帮助我们更深入理解Android 逆向工程!🎯。原创 2025-03-27 10:26:35 · 1333 阅读 · 0 评论 -
大模型“安全护城河”全景解读:从攻防博弈到未来展望
大模型正以惊人的速度推动人工智能技术进步,其带来的创新与变革令人瞩目。然而,正如论文所强调的,只有在确保安全与可靠的前提下,才能真正让大模型造福社会。当前,攻防技术的不断博弈、跨领域防御体系的逐步构建以及国际间的密切合作,正为我们铺就一条安全可控的 AI 发展之路。未来,随着技术的不断进步和防御措施的逐步完善,我们有理由相信,能够构筑出一道坚固的“安全护城河”,既防范外部攻击,又保护用户隐私,让大模型在万众瞩目的同时,始终保持安全可靠。原创 2025-03-27 10:21:14 · 1129 阅读 · 0 评论 -
Office/WPS免费接入DeepSeek模型攻略,打工人必备!
今天给大家分享WPS和office如何通过OfficeAI插件接入DeepSeek大模型原创 2025-03-27 08:35:54 · 767 阅读 · 0 评论 -
【大模型实践笔记1】DeepSeek-R1大模型本地部署
最近,AI 大模型的应用越来越广泛,DeepSeek 作为一款高性能的开源大模型,吸引了很多人的关注。但是,许多人仍然选择直接使用网页版,而不是本地部署。那么问题来了:为什么要本地部署?RAG 技术的核心是检索,想要让 AI 具备知识库的能力,首先得把知识库转换成它能理解的格式,而这就需要Embedding(向量嵌入)技术。Embedding 的作用1.将文本转化为 AI 可理解的高维向量。例如,“苹果”和“梨”在向量空间中会更接近,而“苹果”和“计算机”则相距较远。2.提高相似度匹配的能力。原创 2025-03-27 08:28:53 · 1262 阅读 · 0 评论 -
2分钟教你学会在Word中接入DeepSeek
在图11中,我们首先从Word选项对话框中选中“自定义功能区”,然后从列位置选择命令中选择“宏”,这个时候可以看到有一个”Normal.DeepSeek.DeepSeekR1“宏命令,选中它,在自定义功能区的“开发工具”选项卡下,鼠标右键单击选择“添加新组”。在弹出的“信任中心设置”对话框中,先选择“宏设置”选项,然后单击“启用所有宏”,最后勾选“信任对VBA工程对象模型的访问”,如图7所示。在弹出的“Word选项”对话框中,首先选中“自定义功能区”,然后在“自定义功能区”勾选上开发工具,如图5所示。原创 2025-03-26 20:12:26 · 979 阅读 · 0 评论 -
2025 AI 大模型江湖争霸:谁能称霸未来?
近年来,AIGC(人工智能生成内容)领域迎来了爆炸式发展。无论是文字、图片、音频还是视频,大模型的能力正在迅速提升。尤其是 2024 年 9 月 OpenAI 推出的 O 系列推理模型,更是引领了行业进入文理分科时代。那么,在 2025 年,国内外有哪些值得关注的大模型?它们的应用领域如何?本文将为你全面解析。原创 2025-03-26 20:06:28 · 1087 阅读 · 0 评论 -
图解大模型工作原理。一文带你彻底搞懂大模型损失函数!
有许多语言建模训练技术(随意和掩蔽),但在本文中我们将重点介绍因果语言建模 (CLM)。在 CLM 中,模型将经过训练,以根据前面的标记预测序列中的下一个标记或单词。这通常用于训练 GPT 等文本生成模型。然后,在训练期间,预测的 “next token” 将与 true token 进行比较。因此,在 CLM 期间,当输入标记向左移动 1 个位置时,将采用真实标签。图3。原创 2025-03-26 19:33:16 · 828 阅读 · 0 评论 -
深度解析 DeepSeek-R1 硬件选型:如何挑选最适合你的 AI 模型?
DeepSeek-R1 系列模型从轻量级到超大规模,覆盖了从日常应用到前沿科研的全方位需求。选择合适的版本不仅依赖于模型本身的性能,更需结合实际应用场景、硬件资源以及预算规划。希望本文的详细解析能为你在 AI 模型选型和部署过程中提供有力参考,助你在智能时代抢占先机!阅读推荐:更多部署教程和详细案例请关注 服务器百科 及各大云服务平台的官方指南。你对 DeepSeek-R1 的哪个版本最感兴趣?是否有在部署中遇到的问题?欢迎在评论区留言讨论,分享你的宝贵经验!原创 2025-03-26 19:37:26 · 614 阅读 · 0 评论
分享