前网易架构师-高司机
2014年优快云博客之星TOP10;资深游戏服务器架构师;曾在IBM的Platform Computing,淘米网,网易搬砖;开发团队上线了多个国内外爆款游戏+人工智能相关的边缘计算软硬件产品;欢迎+V gao_ke104 探讨咨询服务器架构设计,游戏运营,人工智能等领域的问题。
展开
-
提升AI性能的秘密武器:量化、蒸馏与剪枝全面解析
蒸馏已成为 NLP 中的一项变革性技术,它能够将大型模型压缩为更小、更高效的版本,而不会造成显著的性能损失。与量化和剪枝不同,蒸馏从根本上改变了模型的架构和参数。我们探讨了蒸馏的概念、它与弱监督的关系、它的方法以及它在现代 NLP 任务中的创新应用。剪枝模型,然后重新训练,可以得到一个更小的模型,它比原始模型更有效、泛化更好,其中剪枝为原始大小 20% 的模型的性能优于原始模型。:结构化剪枝是一个更直接有用的想法,它涉及删除整个组件或层,而不是单个参数,以结构化的方式剪枝模型并在运行时间内产生差异。原创 2025-03-17 16:03:58 · 175 阅读 · 0 评论 -
大型语言模型中微调和提炼的详细技术比较
在深度学习的早期,微调是一种生硬的手段。在机器学习的早期,进步是以规模来衡量的——更多的数据、更大的模型和更深的网络。虽然传统上将微调和提炼视为独立的方法,但最近的进展表明,结合微调和提炼的混合方法可能在适应性和效率之间提供最有效的平衡。通过突破效率的界限,我们可以确保 LLM 的变革力量不仅适用于高端研究实验室,还适用于各个行业的实际应用,从个性化 AI 助手到医疗和金融技术领域的低功耗边缘部署。一种简单的方法(简单地在同一个数据集上训练一个较小的模型)是行不通的,因为较小的模型无法学习相同的复杂模式。原创 2025-03-03 15:23:36 · 229 阅读 · 0 评论 -
量化 vs 蒸馏:揭开神经网络优化的秘密
量化通常适用于特定硬件的部署,而蒸馏则适用于需要性能接近大型模型的轻量级模型的情况。深度学习模型,尤其是那些具有大量参数的模型,对于在资源受限的环境中部署提出了挑战。两种流行的技术,量化和提炼,解决了这个问题,旨在使这些模型更轻量级,而不会过多地影响性能。蒸馏的目的是尽量减少老师的预测和学生的预测之间的差异。在这两种情况下,目标都是使书籍(或神经网络)更小、更高效,同时又不丢失故事的本质(或网络的准确性)。该公式提供了一种将实数转换为量化整数的直接且计算有效的方法,使其成为许多量化方案中的热门选择。原创 2025-03-01 13:39:40 · 54 阅读 · 0 评论 -
揭秘人工智能和机器学习中的模型蒸馏
想象一下,训练一个庞大的神经网络——一个能够诊断疾病、驾驶自动驾驶汽车或生成类似人类的文本的庞然大物——却发现部署如此庞大的模型就像试图驾驶一辆油箱很小的跑车跑马拉松一样。这种较高的温度会产生更平滑、更具信息量的分布,揭示硬性独热标签无法捕捉的“暗知识”(类别之间的微妙关系)。这段旅程——从早期的“暗知识”到生成式人工智能的现代应用——提醒我们,即使是最大的模型也可以被驯服和改进,把巨人变成短跑运动员。的工作为大量研究奠定了基础,提供了将深度神经网络的功能压缩为更易于部署且成本更低的灵活模型的蓝图。原创 2025-02-25 00:15:00 · 96 阅读 · 0 评论 -
模型蒸馏:让人工智能更智能、更小、更高效的艺术
在模型提炼中,教师模型(一种经过全面训练的大型人工智能系统)处理输入数据并生成标签(即正确答案)和理由(即选择这些答案的原因)。然后,这个增强的数据集被传递给学生模型,使其不仅可以学习最终答案,还可以学习其背后的思维过程。正是这种知识转移使提炼如此强大——它允许较小的模型继承更大系统的推理和智能。模型蒸馏的一个关键优势是,它通过提供两种类型的标签帮助学生模型捕捉细微的类间关系。第一种是软标签,它代表不同类别的概率预测,提供对数据的更灵活理解。第二种是硬标签,它作为明确的正确答案。原创 2025-02-24 19:30:00 · 423 阅读 · 0 评论 -
如何教计算机识别视频中的人类动作
我们表明,根据这种无监督训练,解码器和编码器将其隐藏状态自组织成一个特征空间,该特征空间将相似的动作聚类到同一个簇中,将不同的动作聚类到较远的簇中。相比之下,我们的系统是完全无监督的,在任何阶段都不需要动作标签,并且仅使用身体关键点输入即可运行。我们的结果优于之前的基于骨架的无监督方法,在跨视图测试中优于基于 RGB+D 的无监督方法,并且在无监督的情况下具有与基于骨架的监督动作识别类似的性能。”的过程来学习这种类型的关联,其中系统从几个给定的示例中学习,每个示例都带有对其所代表的动作的解释。原创 2025-02-21 20:00:00 · 258 阅读 · 0 评论 -
【初级篇】300 多个终极 DeepSeek-R1 提示词,可快速训练模型,解决问题
你将学到如何准确地提示它进行编码、写作、解决问题等,而不是提出模糊的问题和平庸的答案——无需技术术语,无需猜测。让 DeepSeek-R1 将繁忙的工作变成精简、无错误的高效工作,让你专注于重要的事情。这些提示可帮助你应对现实世界的互动 - 撰写精美的邮件、顺利解决冲突、适应文化规范并在公众演讲中表现出色。根据你的主题、风格或观众生成独特的歌词、扣人心弦的对话或引人注目的艺术概念。从 SWOT 分析到财务预测,这些模板可帮助你制定增长战略、降低风险和协调团队,将想法转化为可操作的、数据驱动的结果。原创 2025-02-11 09:58:23 · 307 阅读 · 0 评论 -
【中级篇】解析 DeepSeek-R1 训练过程——无需博士学位
GPT-4 的推出彻底改变了人工智能行业。但今天,与下一波推理模型(例如 OpenAI o1)相比,它感觉就像是 iPhone 4。这些“推理模型”在推理时产生答案之前引入了思路链(CoT)思维阶段,从而提高了其推理性能。OpenAI 一直对自己的方法秘而不宣,而 DeepSeek 则采取了相反的做法——公开分享他们的进展,并因坚持开源使命而赢得赞誉。或者正如 Marc 所说:这个开源推理模型在数学、编码和逻辑推理等任务上与 OpenAI 的 o1 一样出色,这对开源社区……原创 2025-02-11 09:51:23 · 243 阅读 · 0 评论 -
【高级篇】DeepSeek-R1 论文解析
近年来,人工智能 (AI) 领域取得了快速发展,大型语言模型 (LLM) 为通用人工智能 (AGI) 铺平了道路。OpenAI的 O1 是一个出色的模型,它引入了创新的推理时间扩展技术,可显著增强推理能力。然而,它仍然是闭源的。今天,我们深入研究 DeepSeek 推出的开创性研究论文 DeepSeek-R1。这篇题为”的论文介绍了一种最先进的开源推理模型,以及使用大规模强化学习技术训练此类模型的详细方法。在后期训练中仅使用 RL 来训练 DeepSeek-R1-Zero,不使用 SFT。原创 2025-02-11 09:50:45 · 471 阅读 · 0 评论 -
【高级篇】DeepSeek Janus Pro 论文解析
业界还在适应最近发布的震惊人工智能界的 DeepSeek-R1。但不久之后,DeepSeek 又发布了另一个出色的开源模型Janus Pro。这一次,它是一个可以与其他顶级多模态模型相媲美的多模态 AI 模型。在这篇文章中,我们将解释 DeepSeek Janus Pro 背后的研究论文,标题为“要理解这篇论文,我们还需要解释 DeepSeek 之前的论文,该论文介绍了早期的 Janus 模型版本,标题为:“不需要有关原始 Janus 论文的先验知识。原创 2025-02-11 09:49:56 · 121 阅读 · 0 评论 -
【初级篇】DeepSeek 模型的终极指南
随着 DeepSeek-R1 和 DeepSeek-V3 等开源版本的发布,它们继续缩小专有闭源模型和开源模型之间的差距,促进了广泛的采用和研究。从编码辅助到形式定理证明和多语言理解,DeepSeek 的模型套件既展示了技术雄心,也展示了社区驱动的发展,标志着 LLM 演变的关键时刻。DeepSeek 开发了一种创新方法,将 DeepSeek-R1 系列模型中的推理能力提炼到标准大型语言模型 (LLM) 中,特别是 DeepSeek-V3。DeepSeek 的模型集成到各种聊天平台,增强了用户交互。原创 2025-02-11 09:46:47 · 1634 阅读 · 0 评论 -
如何构建有效的人工智能代理
与简单的聊天机器人不同,AI 代理可以做出决策、规划步骤,甚至可以使用不同的工具来完成工作。例如,如果你只想让 AI 总结一篇文章,那么一个简单的 AI 模型就足够了。但是,如果你希望 AI 研究多个来源、创建摘要并撰写完整报告,那么你就需要一个 AI 代理。通过了解 AI 代理的工作原理,你可以构建智能且有效的系统来帮助完成各种任务。关键是保持简单,确保 AI 拥有合适的工具,并始终测试不同的方法来提高其性能。人工智能代理不仅可以一次回答一个问题,还可以将任务分解为几个步骤,并像人类助手一样完成它们。原创 2025-02-14 00:00:00 · 98 阅读 · 4 评论 -
【高级篇】了解 DeepSeek-R1 中的强化学习
在本文中,我们将探索理解 DeepSeek-R1 所必需的 RL 基本方面,深入研究 RL 在 LLM 中的应用方式,分析近端策略优化 (PPO) 在先前模型中的作用,讨论其局限性,并解释为什么在 DeepSeekMath 中引入了组相对策略优化 (GRPO) 并随后应用于 DeepSeek-R1。与在 RL 之前依赖监督微调 (SFT) 的传统方法不同,DeepSeek-R1 仅使用 RL (DeepSeek-R1-Zero) 进行训练,从而能够发展自我改进的推理技能。修改了传统的 RL 方法。原创 2025-02-11 09:34:28 · 682 阅读 · 0 评论 -
Transformer 详解:了解 GPT、BERT 和 T5 背后的模型
更糟糕的是,它们的速度很慢。GPT-3 是最大的 Transformer 模型之一,它接受了近 45 TB 文本的训练。例如,在翻译中,转换器可以决定输入中的哪些单词与输出中的每个单词最相关。有些是为图像而建,有些是为语音而建,但直到最近,还没有一个在语言方面特别擅长。它最初是为翻译而设计的,但人们很快意识到它可以做更多的事情。Transformer 可以找出原因,因为它会查看所有周围的单词,而不仅仅是旁边的单词。不仅仅将不同语言中的单词对齐,还利用注意力来理解单个句子中单词之间的关系。原创 2025-02-08 15:05:15 · 496 阅读 · 0 评论 -
用于精确 LLM 的检索增强生成 (RAG)
或者至少,这是目前的数量。但法学硕士的训练数据在训练时是固定的。基于 RAG 的系统不会仅根据从训练中“知道”的内容来回答问题,而是首先从外部来源检索相关信息。然后根据检索到的内容和用户的问题生成答案。如果它们的训练数据包含正确的信息,它们就能生成正确的答案。但如果检索器不够好,模型可能会说得太多——即使答案就在数据中的某个地方。如果你问的是一般性问题,那么这样做没有问题。但对于任何事实发生变化的事物(科学、法律、商业),你需要一个能够引入新信息的系统。它们可以生成听起来像人类的文本,但有时答案是错误的。原创 2025-02-10 00:15:00 · 29 阅读 · 0 评论 -
【高级篇】DeepSeek R1 详解:思维链、强化学习和蒸馏
DeepSeek R1 是由中国研究团队开发的新型大型语言模型。它意义重大,因为它在数学、编码和科学推理等复杂任务上表现出与 OpenAI 01 等领先模型相当的性能。该模型的创新,特别是在使用强化学习和模型蒸馏方面,可能会使人工智能更加高效和易于使用。原创 2025-02-08 13:42:41 · 524 阅读 · 0 评论 -
【入门级篇】DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
vllm serve deepseek-ai/DeepSeek-R1-Distill-Qwen-32B — tensor-parallel-size 2 — max-model-len 32768 — force-eager 等命令可用于精简版本。虽然 DeepSeek-R1-Zero 证明了纯强化学习是可行的,但 DeepSeek-R1 展示了如何将监督学习与强化学习相结合来创建一个更强大、更实用的模型。Ollama 提供不同尺寸的模型 — 基本上,更大的模型等于更智能的 AI,但需要更好的 GPU。原创 2025-02-05 10:33:32 · 5408 阅读 · 0 评论 -
AI守护煤矿安全生产:基于视频智能的煤矿管理系统架构解析
随着AI技术在国内的迅猛发展,AI正在重塑各个行业,尤其是在煤矿安全检测领域。煤矿业作为国民经济发展的关键支柱型产业,其智能化建设对于促进矿山安全稳健发展、确保国家能源资源安全具有举足轻重的意义。近年来,我国矿山智能化建设步伐加快,成效显著,然而仍面临发展不均衡、不充分及不协调等挑战,亟需进一步优化与提升。原创 2025-01-18 17:52:28 · 431 阅读 · 0 评论 -
GID数据集,使用可迁移深度模型对高分辨率遥感图像进行土地覆盖分类
然而,由于空间分辨率提高带来的复杂信息以及不同影像获取条件所造成的数据扰动,往往很难找到一种有效的方法对高分辨率、异构遥感影像实现准确的土地覆盖分类。在高分二号、高分一号、吉林一号、资源三号、哨兵二号A和谷歌地球平台数据等多源HRRS影像上的实验显示了令人鼓舞的结果,并证明了所提出的方案对多源HRRS影像进行土地覆盖分类的适用性。研究了两种类型的土地覆盖分类问题:1) 迁移深度模型对使用相同传感器和不同条件捕获的 HRRS 图像进行分类,2) 迁移深度模型对多源 HRRS 图像进行分类。原创 2025-01-08 16:31:28 · 142 阅读 · 0 评论 -
如何使用卡尔曼滤波器进行 3D 对象跟踪(c++)
卡尔曼滤波器是一种用于估计动态系统状态的强大工具,可应用于机器人、导航和计算机视觉中的各种问题。通过提供的类和示例,你可以开始将卡尔曼滤波器集成到自己的项目中,以实现准确、高效的 3D 对象跟踪。卡尔曼滤波器是一种强大的工具,可帮助从一系列不完整且嘈杂的测量中估计动态系统的状态。在本文中,我们解释了如何使用卡尔曼滤波器进行 3D 对象跟踪。此类简化了用于 3D 对象跟踪的卡尔曼滤波器的实现。跟踪 3D 对象,首先需要初始化该类的一个实例。C++ 中的自定义类使用卡尔曼滤波器进行 3D 对象跟踪。原创 2024-12-13 09:59:55 · 858 阅读 · 0 评论 -
omniparse完整安装和部署使用教程
OmniParse是一个将各种非结构化数据转换为结构化、适用于生成式AI(LLM)应用的平台。旨在将各种非结构化数据转换为适用于生成式AI(GenAI)应用的结构化数据。无论是文档、表格、图像、视频、音频文件,还是网页,OmniParse 都能对其进行处理,使其变得干净、结构化,并为诸如 RAG(Retrieval-Augmented Generation)和细调等AI应用做好准备。原创 2024-11-20 14:39:14 · 5933 阅读 · 0 评论 -
使用 PyTorch 实现 100% 准确的水果分类器
下载使用数据集:解压放到/data/input/Fruits by YOLO 目录下运行结果:85689。原创 2024-11-20 07:30:00 · 4178 阅读 · 0 评论 -
手势识别和提取控制算法实现
对于模型训练,我们有 18 个不同的类别,每个类别有 800 多张图像,我们还使用数据增强来创建图像批次。我们计算背景模型(随时间更新)和当前帧(包含我们的手)之间的绝对差异,以获得包含新添加的前景物体(即我们的手)的差异图像。确定背景后,我们引入我们的手,让系统明白我们的手是背景中的新成员,这意味着它成为前景对象。对于数字和运算符的输入,我们为每个数字保留 2 秒的窗口。为了从该差异图像中检测出手部区域,我们需要对差异图像进行阈值处理,以便只有我们的手部区域可见,而所有其他不需要的区域都被绘制为黑色。原创 2024-11-19 09:47:55 · 4279 阅读 · 0 评论 -
omniparse完整安装和部署使用教程
OmniParse是一个将各种非结构化数据转换为结构化、适用于生成式AI(LLM)应用的平台。旨在将各种非结构化数据转换为适用于生成式AI(GenAI)应用的结构化数据。无论是文档、表格、图像、视频、音频文件,还是网页,OmniParse 都能对其进行处理,使其变得干净、结构化,并为诸如 RAG(Retrieval-Augmented Generation)和细调等AI应用做好准备。原创 2024-11-19 09:30:01 · 7112 阅读 · 0 评论 -
Deep Fake Detection (DFD) Entire Original Dataset数据集下载
关于数据集点击DeepFake Detection大部分是以视频分类任务为主要任务目标,目标是通过模型辨识某段视频是否为伪造图像。原创 2024-11-18 18:13:56 · 8904 阅读 · 4 评论 -
真实与虚假图像数据集-用于图像取证
关于数据集“真假图像数据集 - 用于图像取证”经过精心策划,旨在支持检测假图像的算法的开发和评估。该数据集分为三个主要目录:训练、测试和验证。每个目录包含两个子目录,一个包含真实图像,另一个包含假图像。该数据集是图像取证、深度学习和计算机视觉领域的研究人员、数据科学家和开发人员的宝贵资源。它为训练能够区分真实图像和被操纵图像的模型提供了坚实的基础。随着深度伪造和其他形式的图像处理技术的兴起,这项任务变得越来越重要。通过利用此数据集,你可以:开发用于检测假图像的强大算法。原创 2024-11-18 06:30:00 · 4168 阅读 · 0 评论 -
使用PyTorch Lightning对汽车和摩托车进行分类,准确率99%以上
从这张图我们可以看到数据分布是很均匀的,这确保了我们的模型不会偏向于另外一方。原创 2024-11-16 10:40:45 · 4162 阅读 · 0 评论 -
汽车与摩托车分类数据集
关于数据集该数据集是2,000 张 摩托车和汽车图像的集合。在收集这些图像时,确保所有类型的摩托车和汽车都包含在图像集合中。这是因为汽车和摩托车的内部多样性很高。也就是说,汽车和摩托车的类型不同,这对模型来说是一项艰巨的任务,因为模型还必须了解摩托车和汽车的多样性。但如果你的模型能够理解汽车和摩托车的基本结构,它将能够区分这两个类别。数据未经过预处理。这样做是有意为之,以便你可以应用想要使用的增强功能。几乎所有2000 张图像都是独一无二的。因此,在应用一些数据增强后,你可以增加数据集的大小。原创 2024-11-16 10:22:32 · 11668 阅读 · 0 评论 -
opencv findContours 报错_acrt_first_block == header
相信大家在使用opencv开发过程中会遇到各种奇奇怪怪的使用问题,比如这个问题很多人应该遇到过,也有很多人在网上搜来搜去,发现很多都是来回抄袭也没有解决掉,那么这篇文章将会非常浅显简单的告诉大家如何解决:报错_acrt_first_block == header之前一直使用OpenCV3.3+VS2015原创 2019-05-20 11:34:35 · 1498 阅读 · 7 评论 -
YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv9、YOLOv10、YOLOv11 推理的 C++ 和 Python 实现
yolo 推理YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv9、YOLOv10、YOLOv11 推理的 C++ 和 Python 实现。支持的推理后端包括 Libtorch/PyTorch、ONNXRuntime、OpenCV、OpenVINO 和 TensorRT。支持的任务类型包括分类、检测和分割。支持的模型类型包括FP32、FP16和INT8。yolo测试C++代码测试你可以使用以下方法测试 C++ 代码:Windowscd buildcmake .原创 2024-11-15 14:01:53 · 8757 阅读 · 0 评论 -
YOLOv11 C++ TensorRT
项目是一个用C++实现并使用NVIDIA TensorRT进行优化的高性能对象检测解决方案。该项目利用 YOLOv11 模型提供快速准确的对象检测,并利用 TensorRT 最大限度地提高推理效率和性能。原创 2024-11-15 14:00:05 · 5952 阅读 · 0 评论 -
揭秘 YOLO 的强大之处:利用 YOLO 系列模型变革物体检测
物体检测广泛应用于自动驾驶、监控和图像分析等应用,因为它能够提供有关场景中物体的存在和位置的详细信息。然后,我们介绍了 YOLO 模型,详细介绍了其独特的架构、优势以及从 YOLOv1 到最新的 YOLOv9 的演变。我们将首先讨论用于物体检测的传统方法,强调它们的局限性及其带来的挑战。最后,我们将详细介绍 YOLOv8 和 YOLOv9 的架构和功能,展示这些模型如何突破实时物体检测的极限。在后续的文章中,我们将探讨 YOLO 模型的具体应用,例如检测人工编写的思维导图中的节点、边和箭头。原创 2024-09-04 16:34:54 · 1633 阅读 · 0 评论 -
为初学者简单易懂地讲解Transformer的基础知识是什么?
例如,它计算句子中的每个单词与其他单词的关系,并使用该信息来理解上下文。Transformer 可以直接建模句子中每个单词与其他单词的关系,使其能够有效地学习单词之间的依赖关系。因为它通过考虑句子的上下文来学习单词表达,所以它的优点是能够生成更自然的句子。Transformer 的注意力机制使其能够高效捕获句子中相距较远的单词之间的关系,其并行计算能力使其能够高速处理大量数据。通过充分利用自注意力机制,Transformer 可以学习句子中每个单词与其他单词的关系,让您对句子有更深入的理解。原创 2024-09-03 11:05:47 · 1055 阅读 · 0 评论 -
如何实现比 PyTorch 还要快的置换/转置操作?
与PyTorch相比,在运行时间方面,OneFlow在fp32的情况下至少快3倍,最多可以达到3.2倍。最后一个维度不变,只交换维度1和2,那么我们可以使用更大的访问粒度来读取数据,然后进行Permute操作。以 PyTorch 为例,当数据大小为 128MB 进行 BatchTranspose 时,由于未合并访问内存,实际读取的数据量远大于写入的数据量(7-8 倍)。正如本文和之前关于CUDA优化的文章所示,内核优化有一些常用的方法,例如结合冗余来减少计算次数,调整访问粒度来提高访问效率。原创 2024-05-20 09:59:22 · 960 阅读 · 0 评论 -
windows环境下cgo使用opencv和遇到的疑难问题解决
最近使用opencv在做一些ai智能化的项目,其中需要使用go来调用opencv的算法来进行一些视频流的处理,硬件环境是Debian环境,需要远程开发和调试,如果多人使用远程调试则带来不便,因此在本地我更期望使用windows环境搭建一套环境来方便开发和调试。 在搭建windows环境过程中我遇到了不少调用opencv的问题,我将在本地给大家分享下我是如何解决的:目录1.下载和编译opencv库cgo调用opencv的问题整理: 问题1:macro "CVPY_TYPE" requires 7原创 2024-05-06 16:35:42 · 1937 阅读 · 0 评论 -
Keras 与 Tensorflow:深层次探讨哪种机器学习框架最适合你?
最初,Keras 被设计为一个独立的神经网络库,支持多个后端,包括 TensorFlow、Theano 和 CNTK。) 的一部分,提供了一个简单的高级 API,可能会稍微降低复杂任务的性能。然而,它的灵活性、控制力以及对深度学习原理的更深入理解对于专注的学习者来说可能是有益的。Keras 模型开发的灵活性加上对多个后端的支持,使 Keras 成为适用于各种应用的多功能工具,特别是在自然语言处理和更简单形式的图像和视频分析方面。Keras 和 TensorFlow 提供用于深度学习模型开发的开源库。原创 2024-04-15 00:15:00 · 891 阅读 · 4 评论 -
Keras 与 PyTorch:深层次探讨哪种机器学习框架最适合你?
但是,为了在 PyTorch 中集成类似 Keras 的功能,你可以探索 PyTorch Lightning 等高级接口,它简化了 PyTorch 代码,以实现更简单的模型开发。Kanerika 在 Keras 和 PyTorch 等 AI/ML 框架方面拥有丰富的专业知识,再加上全面的数据管理和强大的分析能力,使其在美国成为领先的 AI/ML 实施合作伙伴。想象一下你最喜欢的流媒体平台上的个性化推荐、保护你的金融交易的欺诈检测系统或优化你的业务运营的预测性维护 - 这些只是机器学习变革潜力的一瞥。原创 2024-04-12 00:15:00 · 870 阅读 · 0 评论 -
AutoTest 框架分析OneFlow框架的算子对齐任务
以百度的深度学习框架PaddlePaddle为例,一般的做法是调用其他标准库(例如调用cudnn的卷积验证卷积算子的正确性,调用scipy的erf验证erf算子的正确性)或者直接使用Numpy模拟的计算结果(例如,使用Numpy进行模拟来验证全算子的正确性)。PyTorch还硬编码了一些测试用例,即将固定输入用例的标准答案与算子计算出的结果进行比较,分析算子的正确性。然而,对于给定的输入,它将分别使用OneFlow和PyTorch运行,记录运行过程中获得的每个张量并记录相应的梯度张量的值。原创 2024-04-11 00:15:00 · 883 阅读 · 0 评论 -
深度学习框架中张量的执行过程
本文重点介绍深度学习框架中张量执行背后发生的情况。以操作符oneflow.relu为例,介绍执行该操作符需要依赖的Interpreter和VM机制。希望本文对您对深度学习框架的系统设计有所启发。在上面的代码中,输入x被送入算子relu,并打印结果。一切看起来简单而正常。但如果有人问你是否清楚这背后发生了什么以及relu GPU何时调用对应的Cuda Kernel,你可能就不是那么清楚了。我们习惯于直接使用深度学习框架,不会多思考,因此可能对其背后的原理理解不深。然而在这篇文章中,我将尝试解决这个问题。原创 2024-04-10 09:59:22 · 889 阅读 · 0 评论 -
集成 LlamaIndex 和 Qdrant 相似性搜索以进行患者记录检索
介绍由于医疗技术、数字健康记录(EHR)和可穿戴健康设备的进步,医疗领域目前正在经历数据的显着激增。有效管理和分析这些复杂多样的数据的能力对于提供定制医疗保健、推进医学研究和改善患者健康结果至关重要。矢量数据库是专门为高效处理和存储多维数据而定制的,作为一系列医疗保健用途的有效工具而得到认可。例如,目前,医疗专业人员很少实时利用过去的患者记录数据,尽管它们是信息宝库并且可以帮助诊断。如果我们能够构建一个系统,让医生、护士和护理人员仅使用自然语言输入即可快速访问过去的患者记录,结果会怎样?原创 2024-04-10 00:30:00 · 918 阅读 · 1 评论