- 博客(66)
- 收藏
- 关注
原创 一文带你熟悉llama.cpp的前置补充知识
LLaMa.cpp是由开发者 GG 发起的一个C++编写的轻量级、高性能的CPU/GPU大语言模型推理框架,专为在本地CPU上部署量化模型而设计,它提供了一种在资源有限的设备上对LLM从模型转换、量化到推理的一站式解决方案,让LLM的部署流程变得简单而高效,能够将训练好的量化模型转换为可在CPU上运行的低配推理版本,其主要开发目标就是让开发者在消费级设备或边缘设备上本地部署运行大模型,也可以作为依赖库集成的到应用程序中提供类GPT的功能。在高性能和低资源消耗之间取得平衡,是LLaMa.cpp的一大亮点。
2025-04-01 09:51:31
809
原创 你知道对应的模型尺寸所需要的显存要求嘛?一文带你了解
显存需求(GB)≈ 参数量(B)× 参数类型(字节/参数)× 1.3。显存需求(GB)≈ 参数量(B)× 参数类型(字节/参数)× 4。显存需求(GB)≈ 参数量(B)× 参数类型(字节/参数)(训练阶段需要额外存储梯度和优化器状态)(部署阶段可能需要额外的优化或缓存)
2025-03-31 11:02:22
400
原创 一文带你掌握卷积的规律
卷积是深度学习中非常重要的操作,广泛应用于图像识别、自然语言处理等领域。理解卷积操作的规律对于构建和优化神经网络至关重要。
2025-03-26 09:20:11
593
原创 新手如何使用 Milvus
Milvus 是高性能、高度可扩展的开源向量数据库,支持 TB 级向量的增删改和近实时查询。它集成了多个向量索引库,具有数据分区分片、持久化等功能,应用场景广泛。
2025-03-21 10:04:35
1156
原创 一文带你了解ollama的使用
本教程详细介绍了如何使用Ollama部署私有化大模型,涵盖环境准备、模型拉取、自定义配置、运行测试、高级功能及常见问题,适合开发者快速落地大模型应用。
2025-03-18 10:14:10
353
原创 从0 - 1搭建智能体
在当今数字化时代,智能体的应用越来越广泛,无论是情感陪伴、业务咨询还是财务管理,都能看到智能体的身影。本文将详细介绍如何从 0 - 1 搭建智能体,包括大模型参数设置、人设和回复逻辑构建、系统提示词和用户提示词的使用等关键步骤。
2025-03-14 10:32:14
764
原创 AIOPS架构师路径
该博客系统梳理了架构师从基础架构认知到云原生架构实践的全链路学习路径,涵盖分布式系统、高并发优化、容器化技术等核心领域,并结合淘宝十年架构演进案例与工具链实操指南,助力技术人员系统化掌握高可用、高性能系统设计能力。
2025-03-10 15:42:56
978
原创 你不了解的大模型微调技术都在这里
核心思想:冻结大模型参数,只调少量附加参数Pre!x Tuning(前缀微调)Prompt Tuning(提示词微调)P-Tuning(参数化提示词)LoRA(低秩适应)三、技术对比表技术参数冻结训练参数适用场景典型案例Pre!x Tuning全冻前缀向量生成任务多语言翻译Prompt Tuning全冻提示词表分类/生成T5模型微调P-Tuning全冻LSTM+提示词NLU任务情感分析LoRA全冻低秩矩阵大模型推理优化L
2025-03-08 16:41:05
402
原创 一文带你读懂模型部署
本项目基于华为MindSpore框架和ResNet卷积神经网络构建了一个宠物分类系统,能够对输入的宠物图片进行分类识别。以下详细介绍该系统的训练、测试和部署过程。项目源码地址。
2025-02-21 10:10:51
905
原创 你懂安全优化SSL嘛?
SSL(Secure Sockets Layer),即安全套接层,是一种广泛应用于网络通信领域、保障数据传输安全的加密协议
2024-12-30 09:18:36
1129
原创 你真的了解大数据嘛?
在当今数字化时代,大数据已成为各个领域不可或缺的重要资源,深刻地改变了人们的生活和工作方式。本文将深入探讨大数据的核心特征、广泛应用领域、热门就业方向,以及关键的数据存储技术和处理框架,并通过 C++对 MongoDB 进行代码实践,展示其在高性能服务器开发中的应用。在上述代码中,首先初始化了 MongoDB 的驱动实例,然后创建了一个连接到本地 MongoDB 服务器的客户端。接着,获取了指定数据库和集合的对象,并向集合中插入了一条包含姓名、年龄和城市信息的文档数据。
2024-12-19 10:13:34
606
原创 你想了解的分布式服务器都在这里
分布式系统是由多个相互独立的计算节点(计算机、服务器等)组成,这些节点通过网络通信协作,共同究成一个系统目标。分布式系统的关键特性是,整个系统对外表现为一个整体,而内部实际上由多个节点共同分担任务。
2024-12-19 09:38:10
1299
原创 你可能之前就没有理解过事件驱动模型
事件驱动模型是一种编程模型,它通过**事件循环**监听系统中的各种事件(如 1/0 操作、用户输入、消息到达等),并在事件发生时触发相应的回调函数来处理这些事件。它可以让程序在等待事件时不阻塞主线程,提高程序的响应性和并发能力
2024-12-16 10:22:43
593
原创 深入探索数据库世界:SQLite、Redis、MySQL 与数据库设计范式
在当今数字化浪潮汹涌澎湃的时代,数据已然成为企业和开发者们最为宝贵的资产之一。而数据库作为数据存储与管理的核心工具,其重要性不言而喻。本文将带领读者全面深入地了解 SQLite、Redis 和 MySQL 这三款各具特色的数据库,以及数据库设计范式这一构建高效数据库结构的关键理念。
2024-12-13 15:58:43
1381
1
原创 一文带你了解轻量化的通用技巧
减少模型中的计算次数CNN中主要包含卷积层,激活层,池化层等操作,其中卷积层的计算量远远大于其他层可能实现的方法:1.减少卷积层的数量(网络深度)2.减少卷积层的输出通道数(网络宽度)3.减少某个卷积层中的feature map的尺寸(减小图片分辨率)4.减小卷积核的尺寸降低计算的位宽(神经网络的量化)在CNN计算时,使用更低的位宽.(训练用32bit)比如16bit(推理上),8bit(工程上),4bit,2bit,甚至是1bit.
2024-12-04 15:47:49
827
原创 一文带你了解云平台下的显卡
显卡是连接主机与显示器的桥梁,作为电脑的重要组成部分,主要负责将CPU送来的影像数据处理成显示器能识别的格式以输出图像,可分为独立显卡和集成显卡两大类,其性能对电脑的图形处理能力和显示效果有着直接影响.
2024-12-02 10:35:05
828
原创 Docker技术与应用,最后还有小惊喜哦
开源容器化平台,可用于开发,交付,运行应用.他提供了讲软件编译成一个便携,自给自足的容器,从而简化部署和扩展过程。为了提供一致性运行环境,将代码,配置文件,依赖库等应用运行所需的一切都打包起来,使得任何Docker支持的平台运行时环境一致。
2024-11-29 15:28:58
735
原创 目标检测项目一般流程
目标检测项目是一个全面的过程,涉及算法环境搭建、数据集准备、模型训练与优化、Anchor选取策略、以及性能评估,旨在通过深度学习框架如pytorch实现对图像中物体的精确识别和定位。
2024-11-26 11:02:39
705
原创 一个迷茫的人从0基础自学达到岗位要求的具体步骤分享
当我们下载了不少视频后,面对大量的视频信息,可能会觉得有些无从下手。这时,飞书妙计就可以派上用场了,它能够帮助我们快速地对视频内容进行总结概括。导入视频到飞书妙计:将下载好的视频文件导入到飞书妙计中,它支持多种视频格式,操作相对简单。获取视频总结内容:飞书妙计会自动对导入的视频进行分析,提取出视频中的重点内容、关键知识点以及核心观点等,并以文字形式呈现出来。这样,我们就可以更高效地理解视频所传达的主要信息,而不必花费大量时间去逐字逐句地观看视频。
2024-11-25 11:06:21
978
原创 YOLOV3论文精读
V3比之前版本更大但更精确与SSD一样精确但比SSD快3倍用Titan X 实现57.9AP,用时51ms比RetinaNet快3.8倍卷积层:通过调整卷积步长控制输出特征图的尺寸.所以对输入图片没有特别的限制金字塔特征图:小尺寸特征图用于检测大物体,大尺度特征图检测小物体借鉴Resnet:将输入的特征图与输出特征图对应维度进行相加借鉴DenseNet:将特征图按照通道维度直接进行拼接每个特征图的格子中,都配置3个不同的先验眶,所以最后三个特征图,这里reshape为8X8X3X85,16X16X3X85,
2024-11-22 17:16:35
805
原创 YOLOV3原理
YOLO的核心思想是将目标检测任务转换为一个回归问题,通过在整个图像上进行一次前向传播来预测所有目标的位置和类别。这种方法避免了传统目标检测算法中复杂的区域提议和分类步骤,大大提高了检测速度。
2024-11-21 16:09:27
711
原创 如何将py文件打包成exe文件?---pyinstaller使用方法
是一个用于将 Python 应用程序打包成独立可执行文件的工具。它能够在不同的操作系统上运行,包括 Windows、Linux 和 macOS。通过将 Python 解释器和应用程序的所有依赖项打包在一起,使得用户可以轻松地分发和运行 Python 应用程序,而无需担心目标系统上是否安装了 Python 环境。是一个非常实用的工具,可以将 Python 应用程序打包成独立的可执行文件,方便分发和使用。在使用时,你需要注意依赖项管理、操作系统兼容性和安全性等问题,以确保打包后的应用程序能够正常运行。
2024-09-23 11:03:35
875
原创 给我10分钟带你了解数仓分层建模与企业DW表设计
数据仓库分层建模是通过分层设计(如ODS、DWD、DWS、ADS)来组织和处理数据,从而提高数据处理效率和查询性能,而企业项目中的宽表设计与搭建实战则关注如何在数据仓库中构建高效的宽表以优化查询和数据分析。
2024-09-05 09:38:12
1367
LLAMA3 微调-量化-部署-应用一条龙
2024-09-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人