- 博客(1099)
- 收藏
- 关注
原创 转行指南:Java开发工程师转AI工程师,附大模型学习路线
数学基础:包括线性代数(矩阵运算、特征值/向量)、微积分(梯度、优化)和概率与统计(分布、假设检验、贝叶斯推断)。这些是AI算法的基础。编程语言:重点学习Python,因为它是AI开发的主流语言,Java开发者的编程经验能帮助快速上手。机器学习:了解监督学习、非监督学习、强化学习,掌握算法如线性回归、决策树、支持向量机(SVM)等。深度学习:学习神经网络(如卷积神经网络CNN、循环神经网络RNN、长短时记忆网络LSTM),并熟悉TensorFlow、PyTorch等框架。大型语言模型(LLM)
2025-04-03 09:00:00
1202
原创 2025新风口!AI大模型又起飞了!
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-04-03 08:15:00
145
原创 Manus工作原理大揭秘:下一代AI Agent的多智能体架构究竟是怎么设计的?
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-04-03 08:00:00
922
原创 大模型必看:垂直领域大模型建设路径与实践场景全析
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-04-02 09:00:00
816
原创 大模型核心技术:六款原生开发类智能体框架,看完你就知道如何选了!
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-04-02 09:00:00
497
原创 2025到底该如何抓住风口学习大模型?普通人从0到1的AI大模型通关指南!附学习路线+资源
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-04-02 08:45:00
1030
原创 Embedding、向量模型怎么选?知识库准不准还得看它
数据截至2025年3月份排名(Borda)模型零样本学习参数数量嵌入维度最大令牌数任务平均得分(Mean (Task))任务类型平均得分(Mean (TaskType))双语挖掘分类聚类指令检索多标签分类成对分类重排序检索语义文本相似度(STS)199未知3072819268.3259.6479.2871.8254.995.1829.1683.6365.5867.7179.429970亿40963276861.4754.21。
2025-04-01 10:22:07
795
原创 2025技术风口深度报告:带你彻底吃透大模型Agent(附应用场景全景解析)
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-04-01 10:13:03
1050
原创 RAG技术实战血泪史:18次实验后的最佳方案选择指南
如果你真的想学习大模型,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!
2025-04-01 10:00:25
825
原创 2025未来就业报告:十大预测新兴行业 ——人工智能全领域赋能产业
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-30 09:30:00
898
原创 12张架构关系图可视化解析:MCP/RAG/Agent 设计模式全对照
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-30 08:30:00
1583
原创 十分钟教会你DeepSeek如何接入智能体,真的太好用了!零代码构建个人知识库
个人知识库软件目前主流的是在远程云端运行,也就是说大家的文件会被上传到远程服务器被运算,那么它们就不能纯离线使用了。好奇的读者可能会问,为什么主流的知识库软件都需要在线云端运行,而不支持纯离线呢?对这些问题感兴趣的,可以继续看看下面的介绍。个人知识库大模型已经把人类现有公开的知识学的差不多了,但是唯独很多个人文件、公司未公开的文件,它们都没有学到,因此对这类知识的回答就不会精准。如下所示问DeepSeek这月超市购物花费,它是无法回答的,主要原因就像它说的那样,数据来源缺失。
2025-03-30 08:00:00
1005
原创 Qwen 发布 Qwen2.5-VL-32B 模型:更智能、更轻便
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-29 10:06:27
941
原创 开发者必看:10大AI Agent框架全解析(附应用场景+性能对比)
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-29 09:59:01
1076
原创 AI三驾马车:算法、算力、数据,谁更重要?
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-28 10:20:10
1016
原创 想要转行ai赛道?看完这篇少走三年弯路!
最近有朋友说,想转行ai赛道,做大模型之类的工作,不知道有哪些岗位。今天就来聊聊,AI大模型有哪些方向,新人怎么转行大模型赛道,让大家少走弯路,早日在AI领域如鱼得水!其实,在招聘网站上搜搜 “大模型”,看看那些招聘要求,就能大概了解大模型工程师都有哪些方向了。主要分为下面这四类:数据治理方向:大模型数据工程师,主要负责爬虫、数据清洗、ETL、Data Engine、Pipeline 这些工作。简单说,就是要把数据整理得妥妥当当,让模型能 “吃” 得好。
2025-03-27 15:19:01
484
原创 什么是AI模型训练?到底在训练什么?今天一次讲清楚!
AI模型训练实质上是利用数据驱动的方法,使人工智能系统能够从经验数据中自主学习,并针对特定任务进行高效预测、分类或内容生成。此过程的核心在于通过优化算法调整模型内部参数(例如,在神经网络中的权重和偏置),以最小化模型输出与实际目标值之间的误差或损失函数。这样做的目的是为了提高模型的泛化能力,使其在未见过的数据集上也能保持出色的性能。
2025-03-27 15:18:10
381
原创 为什么整个 AI 领域都朝着 AI Agent 的方向发展?
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-25 09:53:24
923
原创 一文了解模型精度(FP16、FP8等)、所需显存计算以及量化概念
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-25 09:47:42
413
原创 一文图解Agent智能体:60张图、14个技术点回顾Agent的基本认知
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-25 09:45:45
822
原创 40+图解带你深度学习AI Agent的全站技术框架(含MCP)
AI Agent是任何可以通过传感器感知其环境并通过执行器对环境采取行动的东西。——罗素和诺维格,《人工智能:一种现代方法》(2016 年)•环境—— 代理互动的世界•传感器—— 用于观察环境•执行器—— 用于与环境互动的工具•效应器—— 决定如何从观察到行动的“大脑”或规则这个框架适用于所有与各种环境互动的代理,比如与物理环境互动的机器人或与软件互动的AI Agents。可以稍微扩展这个框架,使其适用于“增强型 LLM”。
2025-03-24 10:04:57
848
原创 大模型 RAG关键知识总结:信息检索 + 文本向量化 + BGE-M3 实践全解析!
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-24 09:59:38
856
原创 新手必读!从零开始预训练大语言基础模型,创建属于你自己的大语言神器
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-23 08:00:00
944
原创 从入门到精通:大模型Agent核心框架MCP实战解析
大模型MCP(Model Context Protocol,模型上下文协议)是一种由Claude母公司Anthropic于2024年11月底推出的开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。它可以被视为AI应用程序的“USB-C接口”,为应用程序向大语言模型提供上下文的方式提供了标准化方案。(图:Norah Sakal)MCP的核心目标是解决LLM应用与数据源连接的难题,支持通过统一的客户端-服务器架构访问本地资源(如浏览器、数据库、文件系统、API等)或远程资源。
2025-03-22 10:18:28
908
原创 一篇72页的DeepSeek-R1/QWQ-32B推理能力在AI Agents场景的应用分析
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-22 10:07:21
575
原创 Qwen2.5大模型微调实战:医疗命名实体识别(NER)任务(完整代码)
命名实体识别 (NER) 是一种NLP技术,主要用于识别和分类文本中提到的重要信息(关键词)。这些实体可以是人名、地名、机构名、日期、时间、货币值等等。NER 的目标是将文本中的非结构化信息转换为结构化信息,以便计算机能够更容易地理解和处理。NER 也是一项非常实用的技术,包括在互联网数据标注、搜索引擎、推荐系统、知识图谱、医疗保健等诸多领域有广泛应用。SwanLab 是一个开源的模型训练记录工具,常被称为"中国版 Weights&Biases + Tensorboard"。
2025-03-21 10:24:13
792
原创 一篇文章带你彻底搞懂 LLM Posting-Train(后训练)技术
大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!
2025-03-21 10:06:56
424
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人