深度学习
文章平均质量分 95
会唱歌的炼丹师
会唱歌的炼丹师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
从0到1使用MLX微调大模型
本文介绍了在Apple Silicon设备上使用MLX框架微调Qwen2.5-0.5B-Instruct大语言模型的完整流程。首先说明MLX是苹果开发的类似NumPy的机器学习框架,支持在M系列芯片原生运行。教程包含:1)环境搭建,强调必须使用原生Python环境;2)模型获取,演示通过HuggingFace下载Qwen2.5中文模型;3)数据准备,使用COIG-CQIA金融数据集并转换为合适格式。整个流程覆盖了从基础配置到数据处理的各个环节,为开发者提供本地微调大模型的实践方案。原创 2025-06-24 20:40:33 · 1176 阅读 · 1 评论 -
扩散模型新突破:DiffMoE如何用动态专家选择重塑生成式AI?
近年来,扩散模型在图像生成领域展现出惊人的创造力,但其庞大的计算成本始终是制约发展的瓶颈。来自中国研究团队的最新论文《DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers》提出了一种突破性的解决方案,通过混合专家(MoE)架构与动态计算分配机制的结合,在保持计算效率的同时实现了性能的显著提升。本文将深入解析这项技术的核心创新。原创 2025-04-28 11:46:15 · 643 阅读 · 0 评论 -
AI图像生成开发教程之认识AI图像生成模型
经过几个月的实践与酝酿,AI图像生成开发系列教程,它来了。【AI图像生成开发教程】致力于用最通俗易懂的语言,为大家带来最好的教程,介绍AI图像的前世今生,结合图像生成模型、多模态模型、大语言模型以及各类便捷的语音合成等API,完成AI图像生成,并通过设计游戏类、应用类、AI艺术类实际案例,起到抛砖引玉的作用。打通AI生成模型与大语言模型共同创作的障碍,助力大家实现不同AI场景、AI应用的实现。图像生成:用户可以通过输入文字描述或选择风格来生成高质量的图像。原创 2024-01-26 17:19:53 · 1391 阅读 · 0 评论 -
AI图像生成开发教程之文心一言遇见SDXL
经过几个月的实践与酝酿,AI图像生成开发系列教程,它来了。【AI图像生成开发教程】致力于用最通俗易懂的语言,为大家带来最好的教程,介绍AI图像的前世今生,结合图像生成模型、多模态模型、大语言模型以及各类便捷的语音合成等API,完成AI图像生成,并通过设计游戏类、应用类、AI艺术类实际案例,起到抛砖引玉的作用。打通AI生成模型与大语言模型共同创作的障碍,助力大家实现不同AI场景、AI应用的实现。你是否曾梦想过将文字转化为栩栩如生的图像?是否想过让AI为你绘制出你心中的景象?如果是,那么你来对地方了!原创 2024-01-26 17:12:40 · 1710 阅读 · 1 评论 -
When Segment Anything Model Meets Stable Diffusion
Segment Anything Model与Stable Diffusion的守护需要你们,欢迎各位小伙伴来投稿,每周都将会精选出优秀的作品,展示与本页面和应用的首页。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它。❣️‼️ 相遇之美,犹如一场奇妙的奇迹,让我们慢慢品味并渐渐珍惜。这个模型主要是使用提示工程来训练一个根据提示进行分割的预训练大模型,该模型具有在下游分割任务应用的潜力,并且可以与其他视觉任务组合形成其他视觉任务的新解决方案。原创 2023-06-14 16:03:20 · 333 阅读 · 0 评论 -
【Gradio应用】工业异常行为检测
✨RT-DETR✨是第一个实时端到端目标检测器。具体而言,我们设计了一个高效的混合编码器,通过解耦尺度内交互和跨尺度融合来高效处理多尺度特征,并提出了IoU感知的查询选择机制,以优化解码器查询的初始化。此外,RT-DETR支持通过使用不同的解码器层来灵活调整推理速度,而不需要重新训练,这有助于实时目标检测器的实际应用。原创 2023-06-14 16:07:56 · 889 阅读 · 0 评论 -
基于PPYOLOE+的水下生物目标检测
利用PaddleDetection训练水下目标检测模型,并通过EasyEdge部署在移动端。原创 2022-10-29 09:48:38 · 3601 阅读 · 4 评论 -
基于PaddleSeg的遥感建筑变化的解译平台
基于PaddleSeg的遥感建筑变化的解译平台[BaiduAIStudio项目地址]欢迎大家fork(https://aistudio.baidu.com/aistudio/projectdetail/3665856?contributionType=1)一、赛题背景掌握国土资源利用和土地覆盖类型,是地理国情普查与监测的重要内容。高效获取准确、客观的土地利用情况,监测国土变化情况,可以为国家和地方提供地理国情信息决策支撑。随着遥感、传感器技术的发展,特别是多时相高分辨率遥感图像数据的普及,使我们可以足原创 2022-04-02 18:43:52 · 2524 阅读 · 0 评论 -
NeRF:Representing Scenes as Neural Radiance Fields for viem Synthesis(用于视图合成的神经辐射场的场景表示)
NeRF:Representing Scenes as Neural Radiance Fields for viem Synthesis(用于视图合成的神经辐射场的场景表示)|2020年Fig. 1:通过场景的一些图片作为输入,我们提出一种优化连续的 5D 神经辐射场表示的方法摘要我们提出一种方法,使用较少的视图(view)作为输入,对一个连续、隐含的体积场景函数(volumetric scene function)进行优化,从而实现了关于复杂场景的新视图合成的最先进的结果。我们的算法用全连接原创 2022-01-02 14:31:37 · 1641 阅读 · 0 评论 -
Swin Transformer
CV+Transformer之Swin Transformer前言自从Transformer[1]在NLP任务上取得突破性的进展之后,业内一直尝试着把Transformer用于在CV领域。之前的若干尝试,例如iGPT[2],ViT[3]都是将Transformer用在了图像分类领域,目前这些方法都有两个非常严峻的问题受限于图像的矩阵性质,一个能表达信息的图片往往至少需要几百个像素点,而建模这种几百个长序列的数据恰恰是Transformer的天生缺陷;目前的基于Transformer框架更多的是用来原创 2021-12-01 22:03:26 · 7622 阅读 · 0 评论 -
中国软件杯——行人检测与跟踪(GitHub地址:https://github.com/dddlli/Swin-Transformer-Object-Detection-PaddlePaddle)
中国软件杯——行人检测与跟踪(GitHub地址:https://github.com/dddlli/Swin-Transformer-Object-Detection-PaddlePaddle)一、算法设计(一)行人检测部分1.Swin-Transformer作为Faster—RCNN和YOLOV3的backbone,作为特征提取的主干网络,在一定程度上替换了传统卷积神经网络Resnet和DarkNet等这些backbone作为的特征提取网络。自从Transformer[1]在NLP任务上取得突破原创 2021-07-13 11:13:24 · 3431 阅读 · 0 评论 -
基于mobilenetv3与pyqt5 实现自然场景文字检测及识别
本项目基于mobilenetv3与pyqt5 实现自然场景文字检测及识别实现功能文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)支持darknet 转keras, keras转darknet, p原创 2021-05-28 10:43:16 · 1134 阅读 · 0 评论 -
基于tensorflow和卷积神经网络的电影推荐系统的实现
基于tensorflow和卷积神经网络的电影推荐系统的实现一. 数据处理1. MovieLens数据集2. 处理后的数据二. 建模&训练1. 嵌入层2. 文本卷积层3. 全连接层4. 构建计算图&训练5. 推荐本项目使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务。推荐系统在日常的网络应用中无处不在,比如网上购物、网上买书、新闻app、社交网络、音乐网站、电影网站等等等等,有人的地方就有推荐。根据个人的喜好,相同喜好人群的习惯等信息进行个性化的内容推荐。比如打开新闻原创 2021-04-15 20:49:09 · 2422 阅读 · 1 评论 -
PaddlePaddle:CNN对Cifar10图像分类(2)
PaddlePaddle:CNN对Cifar10图像分类(2)在PaddlePaddle:CNN对Cifar10图像分类(1)中已经详细介绍和讲解了PaddlePaddle深度学习框架、卷积神经网络CNN的层级结构以及Cifar10数据集加载的过程,下面通过2个经典的卷积神经网络结构AlexNet和ResNet50对Cifar10数据集进行图像分类。文章目录PaddlePaddle:CNN对Cifar10图像分类(2)(一)基于PaddlePaddle实现AlexNet与ResNet501.Alex原创 2021-04-11 21:55:45 · 981 阅读 · 1 评论 -
图像识别之Mobilenet、Resnet50与InceptionV3详解
图像识别之Mobilenet、Resnet50与InceptionV3详解项目GitHub地址:https://github.com/dddlli/CNN-Image-Recognition.git一、mobilenet学习前言MobileNet是一种轻量级网络,相比于其它结构网络,它不一定是最准的,但是它真的很轻!什么是MobileNet模型MobileNet模型是Google针对手机等嵌入式设备提出的一种轻量级的深层神经网络,其使用的核心思想便是depthwise separable c原创 2021-04-08 21:36:13 · 6736 阅读 · 1 评论
分享