- 博客(51)
- 收藏
- 关注
原创 开源元搜索引擎SearXNG:使用Docker详细搭建部署与使用
本文将详细介绍在Windows系统上使用Docker搭建Searxng的步骤以及使用,注意:项目的部署需要用户了解并熟悉Anaconda、Pytorch等框架;
2025-02-19 15:19:40
5474
3
原创 一文读懂论文:《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》
DeepSeek-R1整篇论文概况一下就是:DeepSeek团队为实现提高和改进AI模型的推理和思考能力,基于基础模型DeepSeek-V3-Base,使用其独创的"GRPO"纯强化学习方法,直接在该基础模型上应用RL,颠覆之前的监督微调的方式,无需任何的监督微调数据,训练出了性能极佳的DeepSeek-R1-zero模型。但训练出DeepSeek-R1-zero存在两个问题,即可读性差和语言混杂。为了解决这些问题并进一步提升推理性能,DeepSeek进一步开发了DeepSeek-R1。
2025-02-13 19:01:50
1324
原创 2024年值得关注的国内医疗大模型
2024 年最值得关注的中文大模型全景图展示了不同类型的中文大模型及其相关信息,主要分为文本、多模态和行业三个类别。
2025-01-09 13:28:30
921
原创 大模型重塑就医体验:医联MedGPT助力健康中国建设
国内领先的AI医疗平台医联在此背景下推出了中国首款大模型驱动的“AI医生”——MedGPT。该模型基于对数字经济时代下医疗需求的深刻洞察,旨在实现疾病预防、诊断、治疗到康复的全流程智能化,以提升医疗服务的效率和质量,优化患者的就医体验。
2024-08-22 14:28:39
642
原创 基于大语言模型的医疗问答系统的设计与研究
基于大语言模型的医疗问答系统在国内外的研究现状表现出了积极的发展趋势,但真正能投入使用的医疗大语言模型很少,基本都在理论实验阶段,但这并不意味着其发展前景受限,由于医疗领域的高度专业性与必须安全性,国内外研究者们正追求更为可用的医疗大模型。
2024-08-22 14:21:54
2228
原创 transformer、vit-transformer、swin-transformer以及DETR的概念与区别
Transformer、ViT (Vision Transformer) 、Swin Transformer 和DETR是深度学习领域中的不同架构,它们在自然语言处理(NLP)和计算机视觉(CV)任务中都有应用。
2024-08-05 14:35:06
1014
原创 自动驾驶:SLAM
SLAM技术通过传感器收集的数据,如激光雷达的点云数据或摄像头的视频数据,来创建环境的三维或二维地图。这些地图不仅帮助车辆了解其所在位置,还能够识别和避开障碍物。根据使用的传感器类型,SLAM可以分为激光SLAM、视觉SLAM和深度SLAM等。
2024-07-30 13:25:45
1175
原创 Self-attention自注意力机制
可变形交叉注意力模块(Deformable Cross Attention Module)是一种神经网络结构,通常用于处理具有空间结构的数据,如图像或视频数据。这种模块结合了注意力机制和可变形卷积(deformable convolution)的思想,以更好地捕捉输入数据中的空间关系和特征。
2024-05-14 18:17:04
747
2
原创 【以规划为导向的自动驾驶】Planning-oriented Autonomous Driving
现代自动驾驶系统的特点是按顺序进行模块化任务,即感知、预测和规划。为了执行各种任务并实现高级智能,当代方法要么为单个任务部署独立模型,要么设计具有独立头部的多任务范式。但是,他们可能会遭受累积错误或任务协调不足的困扰。相反,我们认为应该设计和优化一个有利的框架,以追求最终目标,即自动驾驶汽车的规划。以此为导向,我们重新审视感知和预测中的关键组成部分,并确定任务的优先级,以便所有这些任务都有助于规划。我们推出了统一自动驾驶(UniAD),这是一个最新的综合框架,将全栈驾驶任务整合到一个网络中。
2024-05-14 18:12:52
2023
1
原创 Stacked Hourglass Networks for Human Pose Estimation 用于人体姿态估计的堆叠沙漏网络
本文主要是介绍了一个在当时是新的姿态估计的网络结构。由于本人在研究自动驾驶领域中车道线识别时使用到此网络结构,故这里主要是对整个网络的结构和思想进行一个梳理,可以进一步明白后序一些基于此网络结构的工作,不涉及到 姿态估计领域 的一些见解和讨论,所以本文主要引出和介绍 hourglass 网络。
2024-04-13 15:42:00
1540
原创 YOLOv8:Roboflow公开数据集训练模型
Roboflow是一个提供计算机视觉数据集管理和处理工具的平台。虽然Roboflow本身并不创建或策划公开数据集,但它提供了一系列功能,帮助用户组织、预处理、增强和导出计算机视觉数据集。
2024-03-24 22:03:41
5344
1
原创 车道线检测论文:《Ultra Fast Structure-aware Deep Lane Detection》
该论文标题为《Ultra Fast Structure-aware Deep Lane Detection》,作者是浙江大学计算机科学与技术学院的Zequn Qin、Huanyu Wang和Xi Li。论文提出了一种新颖的、简单而有效的车道检测方法,旨在解决具有挑战性场景下的车道检测问题,并实现极快的检测速度。
2024-03-23 23:30:07
1136
原创 Ultralytics(YOLOv8)的环境部署与安装
YOLOv8 是 ultralytics 公司在 2023 年 1月 10 号开源的 YOLOv5 的下一个重大更新版本,目前支持图像分类、物体检测和实例分割任务。
2024-03-23 21:52:03
22088
12
原创 【PINet车道线检测】代码复现过程
这是篇关于自动驾驶中车道检测技术的研究论文,标题为“Key Points Estimation and Point Instance Segmentation Approach for Lane Detection”,作者包括Yeongmin Ko、Younkwan Lee、Shoaib Azam、Farzeen Munir、Moongu Jeon和Witold Pedrycz。论文提出了一种名为Point Instance Network (PINet)的车道检测方法,该方法基于关键点估计和实例分割方法。
2024-03-19 22:28:20
1681
16
原创 PINet车道线检测论文:key points estimation and point instance segmentation approach for lane detection.
是篇关于自动驾驶中车道检测技术的研究论文,标题为“Key Points Estimation and Point Instance Segmentation Approach for Lane Detection”,作者包括Yeongmin Ko、Younkwan Lee、Shoaib Azam、Farzeen Munir、Moongu Jeon和Witold Pedrycz。论文提出了一种名为Point Instance Network (PINet)的车道检测方法,该方法基于关键点估计和实例分割方法。
2024-03-17 16:22:41
1475
2
原创 PyTorch完整的神经网络模型训练(使用GPU训练)
使用GPU进行神经网络模型训练可以加速训练速度、处理大规模数据和模型、提供更好的模型性能,并且与PyTorch等深度学习框架良好地集成。这些优点使得GPU成为加速神经网络训练的重要工具,为研究人员和从业者提供了更高效的深度学习开发环境。
2024-03-10 20:16:25
8234
1
原创 Pytorch之神经网络最大池化层
池化层(Pooling layer)是深度学习神经网络中常用的一种层类型,它的作用是对输入数据进行降采样(downsampling)操作。
2024-03-07 20:34:46
856
原创 数据结构中红黑树的概念以及代码
红黑树(Red-Black Tree)是一种自平衡的二叉搜索树,它在插入和删除节点时通过一系列的旋转和重新着色操作来保持平衡。
2024-03-05 21:24:09
405
原创 Pytorch之卷积操作
卷积是一种基本的数学操作,常用于信号处理和图像处理领域。在计算机视觉中,卷积操作是一种重要的技术,用于提取图像的特征并进行图像处理。
2024-03-05 20:14:52
1060
原创 Torchvision中的数据集的下载和使用
Torchvision是PyTorch的一个库,用于计算机视觉任务。它提供了许多常用的数据集,可以用于训练和测试计算机视觉模型。
2024-03-03 14:46:55
1619
3
python知识点总结
2024-03-04
Hadoop知识点梳理
2024-03-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人