- 博客(988)
- 收藏
- 关注
原创 深度探索:DeepSeek与鸿蒙HarmonyOS应用开发的深度融合
DeepSeek是一个专注于AI模型开发与部署的平台,支持多种深度学习框架(如TensorFlow、PyTorch)的模型转换与优化。它能够将复杂的AI模型高效地部署到端侧设备上,满足实时性与资源受限场景的需求。本书以讯飞星火认知大模型为例,全面系统地阐述其基础知识、操作方法与技巧,以及相关实战案例。全书共分为12章,第1章为新手入门篇,为读者铺垫了讯飞星火认知大模型(以下简称讯飞星火)的基础知识;第2至第4章为基础操作篇,提供了讯飞星火的基础操作、对讯飞星火插件的探索以及讯飞星火指令集的详解;
2025-04-02 10:56:09
568
原创 DeepSeek部署入门教程!基于Ollama+Chatbox零成本部署DeepSeek-R1,赶紧收藏!
在人工智能领域,DeepSeek 作为国产大模型的第一梯队选手,凭借其卓越的算法优化和高性能表现(支持代码生成、数学推理、多轮对话等场景)持续领跑行业。然而,尽管官方提供了免费的网页版服务,但在实际使用中,用户常常面临三大痛点:网络延迟高(尤其是在代码生成场景中)、隐私数据外泄风险以及高峰期服务器响应缓慢。为了解决这些问题,让您享受毫秒级响应速度与绝对数据隐私的双重优势。访问 Ollama 官网下载页面:Ollama 下载链接。下载安装包:下载 安装程序。运行安装程序:右键点击安装包,选择「以管理员身份
2025-04-02 10:30:10
895
原创 DeepSeek部署入门教程!一键本地推理,DeepSeek-R1 蒸馏模型 + llama.cpp 部署教程!
通过llama.cpp运行DeepSeek-R1蒸馏版模型,您可以在消费级硬件上体验高性能推理。llama.cpp提供了灵活的配置选项,支持多种硬件加速方式,并且易于部署。建议优先使用预编译二进制文件以简化部署流程,并根据硬件配置调整量化参数与GPU层数。如果您需要更高的推理精度,可以尝试运行更大参数版本的模型,但请注意这需要专业级硬件设备支持。希望本指南能帮助您顺利运行DeepSeek-R1模型,享受高效、灵活的本地推理体验!
2025-04-02 10:28:16
725
原创 正在和DeepSeek-V3-0324做个大项目,「氛围编程」简直太疯狂了
最近超火的氛围编程(Vibe coding)你听说了吗?这个概念是由 AI 大神 Andrej Karpathy 提出的,用户只需要自然语言描述,就能生成代码。仅仅过去一个多月,这一术语就迅速席卷了开发者社区,大家开始纷纷整活。刚刚,Hugging Face 联合创始人 Thomas Wolf 表示:打开 Hugging Face 上的 DeepSite 应用,你也可以体验氛围编程了。做出这一研究的是一位名叫 enzostvs 开发者。
2025-04-01 10:54:18
999
原创 DeepSeek | DeepSeek-V3新版本模型,升级能力速览!
一个专注大模型AIGC方向的公众号。每日分享大模型(LLM)技术、智能Agent,国内外精华论文、NLP基础知识、国际学术、AI发展前沿动态,无论你是AI领域的初学者,还是资深研究者,这里都有你想要的宝藏知识!422篇原创内容公众号DeepSeek-V3新版本:DeepSeek-V3-0324昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7。链接:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324。
2025-04-01 10:53:36
925
原创 智谱上线AutoGLM沉思,OpenAI不再独享Deep Research
快,这个时刻来得太快了,刚刚人在中关村参加发布会!Deeper Research 不再是 OpenAI 专属了智谱全量上了有 AutoGLM 能力的 Deep Research,结合了推理模型的深度研究能力和 Agent 的浏览器使用能力,AutoGLM 沉思既能轻松访问现有 AI 搜索引擎里需要登陆的网页(知网、某书、公众号、某东等),又可以输出结构化的研究报告,单次任务的持续操作时间轻松超15分钟,能解决 Manus 里跟信息搜索相关的复杂任务。关键是免费体验不限量。
2025-03-31 22:17:23
1037
原创 阿里通义RAG团队等提出RAG与长文本对比新框架,助力智能路由决策机制设计
论文标题:LaRA: Benchmarking Retrieval-Augmented Generation and Long-Context LLMs - No Silver Bullet for LC or RAG Routing开源地址: https://github.com/Alibaba-NLP/LaRA随着大型语言模型(LLMs)的快速发展,输入长度限制从最初的4K token到如今普遍支持的128K甚至百万级token输入,“长文本”(Long Context, LC)的定义也在发生着巨变。
2025-03-27 11:50:59
417
原创 用于化学数据提取的大型语言模型
化学和材料科学领域积累了大量的知识,但这些知识大多以非结构化的自然语言形式存在,而结构化数据对于创新和系统化的材料设计至关重要。传统上,数据提取依赖于人工整理和部分自动化方法,但这些方法在多样化的化学和材料研究中面临挑战。随着LLMs的出现,这一领域发生了重大变化,LLMs能够解决未明确训练的任务,为数据提取提供了一个强大且可扩展的替代方案。然而,将LLMs应用于化学和材料科学数据提取时,也面临着独特的挑战,但化学专业知识和物理定律也为验证LLMs输出提供了机会。
2025-03-27 11:49:32
816
原创 垂直类AI Agent智能体开发指南
随着大模型的不断发展与普及,很多人已经明显体会到,大模型LLM在简单的办公场景应用已经非常成熟,但在一些复杂的业务场景,却很难落地应用。要想实现这一目标,需要很多专业的技术支持。由此,催生了大量AI Agent的需求,但是很多人对Agent的理解依旧停留在过去,实际上技术生态的不断发展完善,已经进入到了新的形态。随着Deepseek-R1的开源,使得很多传统公司有机会自己部署大模型,近距离使用高性能AI后,改变了很多人的观念。
2025-03-27 11:43:42
430
原创 vLLM+Qwen-32B+Open Web UI构建本地私有大模型
ModelScope是一个由阿里巴巴集团推出的开源模型即服务(MaaS)平台,旨在简化模型应用的过程,为AI开发者提供灵活、易用、低成本的一站式模型服务产品。该平台汇集了多种最先进的机器学习模型,涵盖自然语言处理、计算机视觉、语音识别等多个领域,并提供丰富的API接口和工具,使开发人员能够轻松地集成和使用这些模型。官方网站。
2025-03-18 10:57:30
491
原创 deepseek的爆火,会带来失业潮吗?
像我们公司虽然今年招的少,但也会对新招的应届生统一进行AI培训。用任正非先生的话来说就是,今后职场只有两种人,一种是能使用AI的人,另一种是创造AI工具的人。
2025-03-18 10:54:20
303
原创 DeepSeek本地部署+联网搜索+知识库
分享一个在DeepSeek本地部署+联网搜索+知识库的方法。这个方法呢对比前面更加快捷还能联网搜索。操作系统:Windows11 24H2准备工具:Ollama、Edge(微软浏览器)、Page Assist(扩展应用)看过前面关于DeepSeek本地部署的朋友直接跳转(二)可视化(一)、Deepseek本地安装搭建操作步骤:第一步:下载与安装Ollama2、推荐使用motrix或迅雷下载(使用IDM快给我整噶皮了)。
2025-03-17 21:31:39
1075
原创 智慧农业-1459丨智慧农业顶层设计与解决方案(43页 PPT)
该PPT文档围绕智慧农业展开,涵盖建设背景、需求分析、顶层设计、解决方案、案例展示以及保障服务等方面内容,为智慧农业的发展提供了全面的规划思路与实践参考。政策推动:国家出台多项政策,如 2014 年中央一号文件及农业部相关意见,强调加强农产品质量监管、加大农业科技创新、扶持新型农业经营主体、推进农业信息化,以实现农业现代化。农业信息化任务:包含建设国家农业资源基础数据系统等十大任务,旨在提升农业管理、生产、市场信息服务、疫病防控等多方面的信息化水平。
2025-03-17 21:29:39
704
原创 2025年AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!
在学习大模型之前,你不必担心自己缺乏相关知识或认为。我坚信,只要你有,你就能够掌握大模型,并能够用它们完成许多有意义的事情。在这个快速变化的时代,虽然新技术和概念不断涌现,但希望你能静下心来,踏实地学习。一旦你精通了某项技术,你就能够用它来实现自己的目标,甚至可能找到理想的工作或完成具有挑战性的项目。在众多的技术中,大模型因其强大的的应用而备受推崇。首先,大模型在处理复杂数据和任务时展现出无与伦比的能力,。其次,大模型能够处理大量的数据,这对于数据挖掘、信息检索和知识发现等领域至关重要。
2025-03-14 10:31:41
486
原创 76k star,像写 Markdown 一样画流程图,这个开源工具太牛了!
Mermaid 是一款基于 JavaScript 的图表和制图工具,它使用 Markdown 风格的文本定义和渲染器来创建和修改复杂的图表。Mermaid 的主要目的是帮助文档跟上开发的步伐。以下是 Mermaid 支持的一些主要图表类型:流程图 (Flowchart序列图 (类图 (状态图 (实体关系图 (甘特图 (饼图 (Pie Chart用户旅程图 (Git 图 (Git Graph需求图 (
2025-03-13 10:36:17
1031
原创 “人工智能+”热点法律问题六人谈 | 林北征:从DeepSeek生态看大模型许可证的法律问题
马云:未来20年,AI时代所带来的巨大变革,会超出所有人的想象。出品 | 电商头条 作者 | 王小孟押注AI赛道后,阿里巴巴开始惊艳全球。图源:通义万相Wan公众号,采用了Apache2.0协议,分为14B和1.3B两个参数规格,支持文生视频和图生视频任务全球开发者在Github、Hugging Face、魔搭社区下载体验。此前,根据权威评测集VBench,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置,几天后更凭借诸多优点受到海外用户的好评。其中,
2025-03-12 11:38:39
1050
原创 马云太牛了,阿里大模型拿下全球第一
马云:未来20年,AI时代所带来的巨大变革,会超出所有人的想象。出品 | 电商头条 作者 | 王小孟押注AI赛道后,阿里巴巴开始惊艳全球。图源:通义万相Wan公众号,采用了Apache2.0协议,分为14B和1.3B两个参数规格,支持文生视频和图生视频任务全球开发者在Github、Hugging Face、魔搭社区下载体验。此前,根据权威评测集VBench,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置,几天后更凭借诸多优点受到海外用户的好评。其中,
2025-03-12 11:29:45
1096
原创 一文说清楚什么是AI Agent(智能体),零基础入门到精通,看这篇就够了!赶紧收藏!
AI Agent,即人工智能代理,一般直接叫做智能体。它是一种能够感知环境、做出决策并采取行动的系统。这些系统能够执行被动的任务,也能够主动寻找解决问题的方法,适应环境的变化,并在没****有人类直接干预的情况下做出决策。例如,一个自动驾驶Agent:可以感知周围的交通情况、道路状况等信息,这就是感知环境根据感知的信息制订下一步的行动计划。例如,决定是否加速、减速、转弯等,这就是做出决策根据决策控制汽车的加速器、刹车、方向盘等,这就是采取行动。
2025-03-10 22:03:47
1173
原创 2025人工智能爆发,报什么专业才不被淘汰?零基础入门到精通,看这篇就够了!赶紧收藏!
2025春节期间,Deepseek和宇树科技的机器人火爆出圈,让很多普通人切身感受到人工智能已经袭来。尤其是Deepseek,甚至有文章说“Deepseek能让张雪峰都失业”。虽然Deepseek目前还没夸张到能报高考志愿表这种程度,但的确和之前的人工智能(AI)聊天助手相比进步了一大截,很多文字分析和处理的工作用人工智能来做已经超过普通人类了。近几年每年都有家长会过来问我,“林老师,我给孩子选这个专业,将来会被人工智能(AI)替代吗?
2025-03-10 21:32:05
1928
原创 全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键
算了么」团队拥有深厚的学术和技术背景,核心成员来自清华大学、北京大学以及 Intel、字节跳动等知名企业。团队在分布式资源调度领域深耕多年,曾获 2024 年中国国际大学生创新大赛亚军(金奖,创业组冠军),并已获得奇绩创坛、水木创投等知名机构的投资。早在平台创立之初,「算了么」团队就敏锐洞察到大模型发展的两大趋势:「小型化」与「分布式」。两者均对当前大模型的实际应用落地具有重要的推动作用。
2025-03-08 11:29:18
921
原创 阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版。
今夜,Manus发布之后,随之而来赶到战场的,是阿里。凌晨3点,阿里开源了他们全新的推理模型。QwQ-32B。本来还有点意识模糊,当看到他们发出来的性能比对图,我人傻了。不是,我没看懂,这特么是个什么怪物。在几乎所有数据集里,QwQ-32B 都已经能跟满血版DeepSeek R1(671B)表现相当了。尤其是作为QwQ-32B 的主攻方向的数学和代码。而且,QwQ-32B在基准测试上的性能跑分,几乎拉开o1-mini一个身位。我人已傻。今天这夜,对我的冲击有一点大。
2025-03-08 11:25:56
965
原创 一码难求的Manus,聊聊它背后的趋势
因为Manus今天的爆火,我发现已经有一大批疑似AI写的文章开始满天飞,内容越来越离谱。比如,最开始只是说Manus推出了首个通用Agent助手,接着就演变成了“中国推出首个AI智能体,秒杀OpenAI,全球都跪了”这种标题党式的夸张说法。与此同时,也有不少同学问我什么是智能体。从广义上来说,**智能体的概念可以追溯到1950年。
2025-03-07 16:56:57
1222
原创 一手体验首款通用Agent产品Manus - 唯有惊叹。
昨天夜里,深夜惊雷。一个新团队突然发了一个首款通用行的项目:Manus。演示在此,我人直接看麻了。看完我的第一感觉,卧槽,人类又要一败涂地了。这尼玛,就是OpenAI的DeepResearch和Claude的Computer Use的究极集合体,甚至,他还能自己写代码,直接Coding Agent。这特么是什么怪物啊。。。我预想到这一天会来,只是没想到,来的如此之早。Manus在GAIA的评分上,也非常的离谱。已经超越OpenAI的DeepResearch的了,成为GAIA评分第一。
2025-03-06 20:36:51
765
原创 AI开发界的“瑞士军刀”!LangChain深度解析:从入门到实战全攻略
—想成为AI工程师?这把“利器”你必须掌握!一、背景:为什么我们需要LangChain?在人工智能飞速发展的今天,大语言模型(如GPT-3、文心一言)已成为开发者的“超级工具”。然而,将这些模型与真实世界的数据、工具结合,却像“给跑车装错轮胎”——看似强大,实则难以驾驭。痛点:1. 模型接口混乱:不同厂商的API(如OpenAI、百度千帆)参数差异大,代码复用率低。2. 任务流程复杂:从数据检索到生成回答,需手动拼接多个工具,代码冗余且易出错。
2025-03-06 11:55:28
860
原创 保姆级教程~本地微调DeepSeek-R1-8b模型
利用特定领域的数据集对已预训练的大模型进行进一步训练的过程。它旨在优化模型在特定任务上的性能,使模型能够更好地适应和完成特定领域的任务。其中最重要的是超参数(如学习率、批次大小和训练轮次)调整优化。转成大白话就是调整大模型中一些参数的值,使其在特定数据集上表现更优秀。
2025-03-06 11:43:19
1029
原创 什么是推理大模型?DeepSeek R1推理大模型与DeepSeek V3模型的区别是什么?
其实,虽然OpenAI o1大模型发布的时候强调了它推理能力的大幅提升,但实际上OpenAI并没有给出明确详细的推理大模型的定义。在OpenAI的官网上,OpenAI定义推理模型是在回答之前进行思考,并在回复用户之前,在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前,先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样。
2025-03-05 11:34:58
705
原创 小白入门大模型教程,大模型零基础入门到精通,看这篇就够了!
大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。除了语言大模型之外,还有视觉大模型、多模态大模型等。现在,包括所有类别在内的大模型合集,被称为广义的大模型。
2025-03-05 11:06:07
1855
原创 大模型训练之训练数据准备,即怎么准备高质量的训练数据集?零基础入门到精通,看这篇就够了!赶紧收藏!
训练数据集的质量是大模型的主要生命线之一,数据集质量直接影响到模型的性能和效果训练一个高性能且表现较好的模型是由多种因素决定的,比如模型的设计,损失函数与优化函数的实现,训练方式的选择;当然也包括高质量的训练数据。那么,怎么才能得到一个高质量的训练数据集呢?这个就是我们今天需要讨论的问题。训练数据集的准备机器学习和深度学习模型的性能高度依赖于训练数据的质量和数量;训练数据的准备工作对于构建一个高效可靠的模型至关重要。
2025-03-04 11:44:35
798
原创 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1
语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。
2025-03-04 11:27:04
746
原创 国内主流AI 大模型架构及应用场景深度分析
商汤领先发布“日日新 SenseNova”大模型体系,提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型以及能力,结合决策智能大模型,为 AGI 实现提供重要起点。除语言大模型“商 量 SenseChat”外,“如 影SenseAvatar”、“琼宇 SenseSpace”、“格物SenseThings”、“秒画 SenseMirage”一系列生成式 AI 模型,能够在文生图创作、2D/3D数字人生成、大场景/小物体生成实现应用。
2025-03-03 11:53:06
796
原创 神仙级AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!
1.为什么要学习大模型?在学习大模型之前,你不必担心自己缺乏相关知识或认为这太难。我坚信,只要你有学习的意愿并付出努力,你就能够掌握大模型,并能够用它们完成许多有意义的事情。在这个快速变化的时代,虽然新技术和概念不断涌现,但希望你能静下心来,踏实地学习。一旦你精通了某项技术,你就能够用它来实现自己的目标,甚至可能找到理想的工作或完成具有挑战性的项目。在众多的技术中,大模型因其强大的功能和广泛的应用而备受推崇。那么,为什么要学习大模型呢?
2025-03-03 11:46:26
911
原创 LangGraph 0.3 重磅发布:预构建代理生态全面升级
Replit 的开发者工具到 Uber 的智能生产力革命,LangGraph 已成为构建 AI 代理的首选框架。0.3 版本的发布,标志着其生态体系进入全新阶段。
2025-02-28 21:12:20
1038
原创 刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商
大家心心念念的 GPT-4.5 终于来了!凌晨 4 点,OpenAI 开始了直播,奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。OpenAI 正式发布了其最大、最强的聊天模型 GPT‑4.5 研究预览版本。奥特曼发推称,GPT‑4.5 让他第一次感觉像在与一个有思想的人在交谈,可以从模型那里得到真正好的建议。OpenAI 表示,GPT-4.5 在扩展预训练和后训练方面向前迈出了一步。通过扩展无监督学习,GPT-4.5 提高了识别模式、建立联系和产生创造性见解的能力,而无需推理。
2025-02-28 17:22:54
1087
原创 值得收藏 Deepseek本地部署保姆级教程,小白轻松上手
Deepseek已经火遍大江南北,本次馍馍为大家带来了Deepseek本地部署教程,本地部署有效解决了在线API的费用开销和官网资源紧张问题,同时本地部署也最大程度保证了项目的私密性与安全性,适合实验环境和敏感单位。
2025-02-27 10:46:17
1207
原创 AI产品经理「100道面试」(问题 + 答案),AI产品经理从入门到精通,收藏这一篇就够了!
以前总说AI是未来,但现在AI就是当下。面试题一般是对求职者相对比较综合的考察,,亦可通过面试题来测试自己对AI的认知程度。如果你对这些面试题的答案感兴趣的话,1.什么是机器学习?2.描述深度学习与传统机器学习的区别。3.什么是自然语言处理?4.如何评估一个机器学习模型的性能?5.什么是过拟合和欠拟合?6.请解释什么是神经网络。7.描述决策树和随机森林。8.什么是梯度下降?9.请解释什么是卷积神经网络?10.什么是迁移学习?11.如何评估一个新市场的机会?
2025-02-27 10:24:59
1268
原创 DeepSeek-R1、Qwen2.5为什么要引入YARN?
PI 的旋转角度计算公式可以重写为:YARN 的原论文中从更加理论的角度分析了 PI 的这一问题。
2025-02-26 11:41:51
1087
原创 18 家平台接入 DeepSeek R1 满血版可无限免费使用 爆肝整理全在此篇
DeepSeek R1模型凭借其卓越的推理能力与开源特质,备受众多AI应用平台青睐。其强大之处在于能为各类场景提供精准高效的支持。它的开源特性更是推动了整个AI领域的发展,让更多开发者能够基于此进行创新。国内不少产品纷纷接入R1满血版,这无疑为科研工作带来了新的契机。科研人员可以借助其强大功能,更深入地探索未知领域,加速科研进程。对于企业而言,能大幅提升生产效率,优化业务流程。而对于个人,也能在日常工作与生活中获得更多便利,让效率得到显著提升。
2025-02-26 10:50:55
960
原创 知识Agent检索:让RAG迸发智慧的五个架构跃迁点
❝作为经历过从零搭建企业级RAG系统的老兵,我深知开发者们在面对复杂问题时"知道该优化,但不知从何下手"的迷茫。本文将用最直白的语言,拆解传统RAG升级为智能Agent的必经之路。读完你会发现,那些看似高深的概念,背后都是工程实践中摸爬滚打出的智慧结晶。一、问题出在哪?从真实故障说起传统RAG的表现就像个老实但死板的学生:把整个问题扔进搜索引擎抓回20篇产品手册生成笼统的功能对比结果用户投诉答案"像产品说明书,没有商业洞察"。问题出在哪?img。
2025-02-26 10:42:56
730
原创 unsloth: 仅用7GB显存就能训练自己的R1推理模型
今天来和大家分享unsloth公开的笔记本,这篇jupyter notebook提供了一个增强过的整个GRPO流程。链接:llama3.1 8B版本:Qwen2.5 1.5B版本:我们知道r1在思考的时候总能”啊哈“灵光一现找到关键思路,而r1训练过程的第一阶段得到的r1-zero就是使用了组相对策略优化(GRPO)自主学会了在没有人类反馈的情况下分配更多思考时间。
2025-02-25 10:54:27
1012
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人