- 博客(230)
- 资源 (4)
- 收藏
- 关注
原创 Manus技术架构与应用实践深度解析
Manus的突破标志着AI从“建议生成”走向“行动执行”的范式转移。其技术架构为行业提供了可复用的蓝本——多代理协同、沙箱隔离、动态规划等设计理念,正在成为下一代智能体的标准配置。本文从技术架构、实现机制、应用场景及行业影响四个维度,深度解析Manus的核心技术创新。
2025-04-05 03:45:00
477
原创 LLM大模型教程——什么是AI大模型
当GPT-4展现出惊人的上下文理解能力,当Stable Diffusion创造出媲美人类画师的图像作品,当AlphaFold2破解蛋白质折叠密码——这些里程碑事件标志着人工智能发展进入大模型主导的新纪元。本综述将深入解析这一技术革命的核心载体——AI大模型。
2025-04-02 20:05:53
953
原创 LLM大模型教程——为什么要学习AI大模型
LLM不仅是工具,更是认知伙伴。它重新定义了“技术能力”的内涵——从代码实现转向智能设计,从局部优化转向系统创新。技术人员若想避免被时代淘汰,必须将LLM学习纳入核心能力体系,通过“理论-实践-迭代”的闭环,成为AI时代的架构师而非旁观者。
2025-04-02 10:16:18
814
原创 LLM大模型学习系列——总纲
LLM大模型学习系列旨在帮助技术开发者掌握LLM大模型相关技术知识,从大模型的基本原理、结构、微调,到大模型的应用开发,让开发者有一个全面的认识,以便于日常工作中的需要。
2025-04-02 09:59:58
298
原创 springboot整合Thymeleaf web开发出现Whitelabel Error Page
springboot内嵌Tomcat提供web服务,浏览器触发页面刷新操作的时候,出现Whitelabel Error Page,访问不成功。本文针对此问题做解答。
2025-04-01 20:42:00
338
原创 Ollama 加载本地下载的gguf大模型
在本地安装好ollama后,下载加载模型总是失败,出现的错误信息为:pull model manifest net/http: TLS handshake timeout。尝试很多办法都没能成功,所以出现了本文离线下载gguf模型文件,然后再倒入ollama运行的原因。
2025-03-31 17:41:05
729
原创 SpringAI 集成本地Ollama大模型
随着人工智能技术的快速演进,DeepSeek 作为国内领先的大模型研发团队,其开源的 R1 系列模型凭借 "低成本、高性能" 的特性,在数学推理、代码生成等领域展现出与国际顶尖模型相媲美的能力。与此同时,Spring AI 作为 Spring 生态体系中专门针对 AI 工程化的框架,通过模块化设计和多模型适配能力,为 Java 开发者提供了便捷的 AI 集成方案。二者的结合,为企业级智能应用开发带来了新的技术路径。
2025-03-31 12:05:55
932
原创 大模型微调方法解析
通过微调大模型达到增加模型性能,节省训练资源和成本,适配特定场景任务。如何高效地通过微调(Fine-tuning)让通用模型适配垂直领域任务,成为行业关注的核心问题。
2025-03-06 11:31:37
1127
原创 基于DeepSeek R1 微调自己的大模型&Ollama本地部署
在人工智能技术加速渗透各行各业的今天,大型语言模型(LLM)的落地应用正面临两大核心挑战:通用性与场景适配的平衡,以及数据隐私与计算成本的博弈。介绍基于DeepSeek R1 微调自己的大模型,并用低成本方式本地化部署,让个人用户也能享受到AI大模型算力平民化的普照。
2025-02-28 10:09:19
834
原创 Pytorch基本知识
事实上,绝大多数操作并不修改tensor的实际数据(即存储区的内容),而是修改tensor的头信息,这样操作既节约内存,处理速度也更快,例如使用索引截取部分tensor后新tensor的内存指向不会发生变化,只会改变对应的地址偏移量,而使用。值得注意的是,model.state_dict()所存储的模型参数tensor的require_grad都是False,而model.named_parameters()模型参数中的require_grad属性都是True。)的一部分,从而可以进行参数优化。
2024-10-01 23:51:03
1564
2
原创 机器学习概述
随着科技的不断更新发展,人工智能与社会生活的关系也越来越紧密。那么,人工智能和机器学习有什么关系,什么是机器学习,机器学习的模型算法有哪些,如何进行机器学习?本系列文章将从上述几个问题展开。
2024-10-01 23:50:13
838
原创 机器学习模型算法
如何进行机器学习:从上可知,机器学习离不开数据、模型和算法,通常包含数据预处理、模型学习、模型评估、样本预测几个步骤。数据预处理:从原始raw数据,经过(特征处理+幅度缩放、特征选择、维度约减、采样),输出测试集和训练集;模型学习:模型选择、交叉验证、结果评估、超参选择;模型评估:选择符合场景的评估准则样本预测:新的输入数据预测。如何选择合适的模型呢?请继续看下文
2024-09-29 20:19:36
872
原创 机器学习EDA探查工具Pandas profiling
在最初的数据探查的时候,可以通过pandas的函数,以及matplotlib做图像绘图,这个工作比较重复和低效,所以pandas针对常用的数据列统计和展示,做了EDA工具profiling,可以自动帮助数据分析。问题1:在python 3.10.11环境下,安装pip install pandas-profiling,运行出现错误因为profiling版本更新问题,暂时没有去解决。问题2:升级profiling版本,名称从pandas-profiling变换为ydata_profiling,运行出错。
2024-09-25 20:07:32
537
原创 机器学习自动化建模AutoML
实体entity: 可以简单理解为特征列关系relationship:实体与实体之间的关联键定义特征算子:一些特征工程函数,应用于特征实体集合关系来构造新的特征,如groupby, mean,max等;
2024-09-14 09:47:15
698
原创 机器学习特征构建与特征筛选
上一篇文章讲述了原始特征分析和处理,保障后续拿到的是干净的特征变量,但实际这些特征对于建模不一定是有效的,所以需要在原始特征的基础上,结合业务场景做特征变量的衍生,提升数据的表达能力。
2024-09-10 17:31:47
1465
原创 pytorch 模型部署
量化后的模型在特定CPU或者GPU上相比FP32、FP16有更高的速度和吞吐,也是部署提速方法之一。就是随机将tensor中的部分元素置为0,比如常见的dropout,附带正则化作用的同时也减少了模型的容量,从而加快了模型的推理速度。这块没研究透,后续再探;的基础上,对模型通道或者模型结构进行有目的地修剪,剪掉对模型推理贡献不是很重要的地方,保障精度下降很少或者几乎不变。先用大网络训练,然后再用大网络调教小网络,使小网络接近大网络的精度。上述AI模型部署步骤也提到,对模型进行优化,有哪些优化点呢?
2024-09-05 09:43:20
1030
原创 pytorch 梯度算法介绍
假设有一个序列xn, 对应目标是yn, 通过模型预测得到的结果是, 则MSE损失函数有优化问题变成求min(loss)对于求min(loss), 本质是要梯度的负方向,所以更新梯度的问题变成其中,a是学习率。
2024-09-04 23:33:52
734
2
原创 CNN网络的一些基本知识
CNN中常见层layer有conv layer, pool layer, relu layer, linear layer等,如何选取layer组合,以及每层layer如何设置参数,是算法工作者需要面临的直接问题。
2024-08-30 19:31:09
712
原创 pytorch 数据处理
对于NN模型训练来说,需要将数据转换成torch识别的数据类型,才能喂给模型。pytorch中,通常使用Dataset和DataLoader这两个工具类来构建数据管道。自定义DataSet都需要集成DataSet父类,复写 __init__,__getitem__和__len__方法。用DataLoader读取Dataset的数据。
2024-08-25 23:20:46
535
原创 业务系统高可用性建设
高可用性(High Availability)是指系统或服务能够持续提供高水平的可用性和可靠性,即在面对各种故障、错误和异常情况时,仍能保持持续运行和正常工作。可用性关注可访问性,可靠性关注功能正确性和时效性。用计算公式:MTBF / ( MTBF + MTTR ),MTBF指平均无故障时间,MTTR指平均故障修复时间。
2023-10-11 14:52:12
394
原创 架构师之如何定位问题
有时架构设计师摸不清楚自己到底要解决什么问题,觉得这个问题要解决,那个问题也要解决,甚至不是问题的问题也要解决,然后设计出一个你那个解决所有问题的方案。但是实际情况是有些问题根本不是问题,有些问题确实是问题但又不是核心问题,有些问题是核心问题,但是又不是当下最核心的问题。作者借鉴前人思考,从三个维度对问题进行定义。比如:大禹的父亲鲧治水着重在堵的方法上,毕生精力都在思考如何更好的堵。这里错误的将问题聚焦在堵,如何堵上,但实际的根本问题是人们的财产生命和洪水破坏之间的矛盾。比如:消金公司如何做好资金防控。
2023-09-08 16:51:12
227
原创 Python django开发
执行python3 manage.py createsuperuser, 输入对应的信息,可创建超级用户。pip install django==2.2.5 # 选择2.2.5的原因是这个版本是持久维护的。在app的view.py中,增加试图函数,必须包含一个返回响应HttpResponse。第六步,通过ide打开项目,并且设置到对应的env环境。在app下的admin.py中,注册对应的model。第三步:start 一个项目,并创建子应用。第八步,在APP中开发模型。,会看到需要管理员账密信息。
2023-07-10 23:25:43
942
原创 mac python3 安装virtualenv
注意:如果出现WARNING: The script virtualenv is installed in ‘/home/local/bin’ which is not on PATH. Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.主要原因是找不到virtualenv,所以在环境变量中增加执行路径。第三步,增加环境变量。
2023-07-09 22:47:31
1522
翻译 技术如何在需求侧赋能业务
技术同学通常面临一个痛点:这个需求上线倒排,需要短期内加班完成功能研发deadline之前发布。技术同学如何在业务需求侧赋能机制,博主期望通过自己多年项目实践经验,尝试给出一些可行的路径和方法,抛转引玉。
2023-03-04 21:05:45
357
原创 架构方法论
对架构本身进行剖析:什么是架构?为什么架构很重要?这些是对架构方法论理解的前提。在理解概念后,如何设计一个好的架构,如何通过架构图描述架构,以及架构图好坏的基本指标。本篇内容结构:• 什么是软件架构• 架构有什么用?为什么重要• 如何设计一个好的架• 怎么描述架构设计• 架构制图方法论和工具
2023-02-12 20:01:17
1454
原创 DDD领域设计
DDD是一种基于模型驱动开发的软件开发思想,强调领域模型是整个系统的核心,领域模型绑定了领域和技术实现,确保了最终技术实现就一定解决了领域中的核心问题。DDD主要分为两个部分,战略设计与战术设计。战略设计主要从高层"俯视"系统,帮助我们精准地划分领域以及处理各个领域之间的关系;而战术设计则从技术实现的层面教会我们如何具体地实施DDD。
2023-01-27 23:16:00
2062
原创 隐私计算主流技术
隐私计算目前主流的技术路线有三种:多方安全计算、联邦学习和TEE。多方安全计算(Secure Multi-party Computation, MPC),是指一组互相不信任的参与者在保护个人隐私的同时,还可以进行协同计算。TEE(Trusted Execution Environment)是一种具有运算和储存功能,能提供安全性和完整性保护的独立处理环境。联邦学习本质上是一种分布式机器学习技术,或机器学习框架,主要分为横向联邦学习、纵向联邦学习、联邦迁移学习三大类;
2023-01-15 00:28:23
2421
1
原创 隐私计算概述
隐私计算是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一些列信息技术,保障数据在流通和融合过程中的“可用不可见”。从技术交付出发,隐私计算是众多学科的交叉融合技术,目前主流的隐私计算技术分为三大方向:第一类是多方安全计算为代表的密码学隐私计算技术;第二类是以联邦学校为代表的人工智能与隐私计算技术融合衍生的技术;第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。
2022-12-24 22:11:33
1493
原创 隐私计算之数据隐私保护
数据价值的发挥及经济效益的产生,离不开数据资源化并参与社会生产活动实践。这就决定了数据的开放、共享协同将成为未来发展的必然趋势。数据安全是数据流通的底线,包括数据隐私安全和数据流通安全。
2022-12-22 23:35:37
1278
原创 隐私计算之数据是新的产生要素
21世纪以来,以大数据、人工智能、区块链、量子计算等信息技术为标志的新一轮科技革命和产业变革悄然而至,数据量和算力呈爆炸性增长,数据成为驱动经济社会发展的关键生产要素。有关数据统计,2018年我国数字经济总量达到31.3万亿,占总的GDP比例为34.8%。到2021年我国数字经济规模增至45.5万亿元。随着我国大数据产业和实体经济深度融合,产业不断发展壮大,数据作为生产要素的重要作用不断凸显。本文主要介绍为什么数据是新的生产要素,如何发挥数据要素价值,从国家宏观层面顶层设计是怎样的。
2022-12-09 21:33:29
901
可直接运行的Java web jar 镜像
2021-01-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人