自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI大模型

分享技术

  • 博客(53)
  • 收藏
  • 关注

原创 AI大模型开发-Python(Anaconda)的安装

Python是最受欢迎的编程语言之一,特别是在数据科学、机器学习和AI领域。Anaconda是一个免费的开源Python发行版,它极大地简化了包管理和部署的过程。在这一节中,将详细介绍如何下载和安装Anaconda,以及如何使用它来创建和管理Python环境。

2024-08-18 18:24:21 1206 2

原创 (AI大模型书籍)掌控未来: 三本不可错过的AI大模型开发宝典

本文特别推荐三本不可错过的AI大模型开发宝典。这些书籍提供了大量实践案例与代码示例,帮助读者逐步掌握从模型构建到优化的各个环节和罄尽。

2024-08-16 23:25:42 3744 2

原创 如何利用智能体玩转“狼人杀“

这个变化可能是:某个“狼人”的伪装,某个“预言家”的查验,某个“玩家”的临终遗言等等。Claude 3 系列模型在多项 AI 系统常用评估测试集中,包括本科级别专家知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K, MATH),多语种数学(MGSM),阅读理解(RACE-H),常识推理(HellaSwag),代码领域均取得领先业界的性能。灵活的模型切换这一点,Amazon Bedrock 为我们提供了丰富的模型选择,我们完全可以根据业务的需要,去做不同模型之间的切换。

2024-09-26 20:58:58 1169

原创 在持续集成流水线中应用 Gen AI 识别并修复漏洞

现代化应用的高速发展使开发人员能够构建高度解耦的基于微服务的架构。然而,这些架构的分布式特性同时也带来了一系列的运维挑战。开发团队需要一直负责应用环境安全的各个方面,如网络安全、IAM 权限、TLS 证书和代码漏洞扫描。在数十甚至上百个微服务的规模下处理这些安全问题,高度自动化变得尤为重要。在容器中运行应用程序是构建微服务的常用方法。该方法允许开发人员使用同样的持续集成流水线来构建应用程序,而无需关心是使用Amazon EKSAmazon ECS还是AWS Lambda来运行应用程序。

2024-09-26 20:56:44 918

原创 提示词工程 (Prompt Engineering) 最佳实践

6计算机科学基于以下文本内容回答问题:您正在研究计算机视觉领域的深度学习应用。您需要训练一个神经网络来进行图像分类。您已经有了一组标记好的图像,但您需要决定如何将这些图像分为训练集和测试集。问题:您应该如何划分训练集和测试集?提示:通常情况下,将数据集随机划分为训练集和测试集是一个好的选择,通常使用70/30或80/20的比例。但是,如果数据集中某些类别的样本数量较少,则应该使用分层采样来确保在训练集和测试集中都有足够的样本数量。

2024-09-25 20:55:54 1615

原创 基于 RAG 实现大模型商品智能检索

传统商品检索需要依赖人工解析和构建商品的描述字段,将商品信息存入 ElasticSearch 或数据库,然后通过分词查询结合多重条件(类别或其他属性)检索到匹配的商品。但是在传统检索中,因为分词本身的特点,经常会遇到误匹配的问题,例如:我们检索 "苹果耳机"的时候,往往会出现苹果和耳机的相关商品,导致客户体验效果不佳。为了让检索更人性化,我们可以借助 RAG 技术,在传统分词搜索的基础上融入向量检索的能力,从而获得更贴近人类需求的检索效果。

2024-09-25 20:51:09 1054

原创 利用千帆SDK实现作文自动批改

儿童陪伴类:为儿童提供趣味陪伴的AI agent,常见场景如绘本陪读、知识百科、人设陪伴等功能。学习教育类:主要为学前和k12学生提供学习教育类AI agent,常见场景如专业英语口语陪练、AI体育老师、数学解题、单词记忆、汉字学习等。娱乐互动类:为全年龄段用户提供娱乐互动类AI agent,常见场景如漫画头像生成、旅游规划、角色扮演、游戏攻略助手、宠物情绪识别等。老年养生类:为老年人提供健康养生类AI agent,常见场景如健康问答、老年健康饮食助手、生活健康提醒等。

2024-09-24 16:23:34 1476

原创 《AI大模型开发之路》:当程序员遇上“大”模型

我的程序总是在关键时刻抛出异常,就像一位调皮的小孩,总是在你最需要他的时候和你捉迷藏。作为一名“经验丰富”的程序员,我满怀信心地开始操作,结果我的Python版本和书中要求的不一致。配置环境、加载模型、调试代码,每一步都充满了未知的Bug,仿佛踩在雷区上,一不小心就“Boom”了。刚看到这个书名时,我还以为是一本教人如何走“大”路的指南,结果翻开一看,发现自己已经站在了AI的十字路口,不知道该往哪走了。,我再次陷入了沉思。它让我明白了,原来AI大模型的开发并不是一蹴而就的,需要不断地尝试和坚持。

2024-09-24 16:19:07 1347

原创 在 FlexSim 中使用 OpenUSD 分析、可视化和优化现实世界的流程

对于制造和工业企业而言,效率和精度至关重要。为了简化运营、降低成本和提高生产力,各公司正在转向和离散事件模拟。离散事件模拟使制造商能够通过试验不同的输入和行为来优化流程,这些输入和行为可以逐步进行建模和测试。是一家模拟建模软件提供商,专门从事离散事件模拟,使用户能够分析、可视化和优化各行各业的真实流程。借助用于创建和运行模拟的强大工具集,它正用于制造、仓储和医疗健康等行业,以改进复杂的系统和运营。最近,FlexSim 开发了,使工程师、设计师和仿真专家能够将 FlexSim 模型无缝转换为格式。

2024-09-15 21:04:04 1194

原创 高级 API 性能:着色器

着色器通过使您能够控制渲染过程的各个方面,在图形编程中发挥着关键作用。它们在 GPU 上运行,负责操作顶点、像素和其他数据。

2024-09-15 21:02:07 1208

原创 CloudXR 套件扩展 XR 工作流

它为开发者、专业人士和企业团队提供了一个可以跨操作系统灵活编排并扩展XR工作负载的平台,包括Windows中的虚拟机和基于Linux的系统(比如容器)。Essentials还包含SteamVR插件,以及可直接集成到XR应用中的示例客户端和新的服务器端API,因此不再需要单独的XR运行时。通过使用NVIDIA CloudXR,开发者可以创建出能够充分利用强大GPU的高质量版本应用,同时还能借助NVIDIA CloudXR的流式传输能力,覆盖到使用移动XR设备的用户。

2024-09-15 21:00:20 1078

原创 由 RTX 赋能的空间框架通过 USD 实现全光线追踪 XR 流程

通过NVIDIA Omniverse和Varjo XR-3,用户可以结合强大的多GPU配置和Varjo逼真的视觉保真度,在混合现实环境中实现实时光线追踪。Meskill还表示,为了满足企业应用的高要求,在现实世界中放置基于全保真设计数据创建的逼真数字孪生并提供精准的照明和反射必不可少。现在,用户可以对包含数百万个多边形、物理材质和精确照明的大规模、复杂、全保真设计数据集进行全光线追踪,来身临其境地体验数据集,而无需耗费额外的数据准备时间。用户甚至可以将XR集成到现有的流程中,并且毫不费力地实施。

2024-09-15 20:58:57 945

原创 AI Workbench 让 Windows 上的 GPU 使用更加简便

是一款免费的、用户友好型开发环境管理器,可在您选择的系统(PC、工作站、数据中心或云)上简化数据科学、ML 和 AI 项目。在 Windows、macOS 和 Ubuntu 上,您可以本地开发、测试项目和构建项目原型,并在系统(本地和远程)之间轻松传输开发环境和计算工作,以优化成本、可用性和规模。AI Workbench 专注于简化开发者体验,而不会阻碍高级用户所需的自定义类型。那是 AI Workbench 处理容器的主要原因。它们是提供和修改 GPU 加速工作所需环境的最简单方法。

2024-09-15 20:57:10 968

原创 Cyborg 和 RAPIDS cuVS 实现矢量搜索机密性保护

在生成式 AI 时代,向量数据库对于高效存储和查询高维数据已变得不可或缺。但是,与所有数据库一样,向量数据库容易受到一系列攻击,包括网络威胁、网络钓鱼尝试和未经授权的访问。鉴于这些数据库通常包含敏感和机密信息,这一漏洞尤其重要。为了解决这一关键问题,Cyborg 与 NVIDIA 合作,使用库增强向量数据库的安全性。RAPIDS cuVS 库是一个开源工具包,可使用先进的算法加速向量搜索。

2024-09-15 20:53:38 823

原创 RAPIDS cuDF 统一显存技术使大型数据集上的 pandas 运行速度最高提升 30 倍

RAPIDS cuDF 统一显存和文本数据处理功能,帮助数据科学家在严苛的工作负载中处理更大、文本密集型数据集时继续使用 pandas。现在,数据科学家可以将这些工作负载加速高达 30 倍。是开源 GPU 加速数据科学和 AI 库的集合。是一个 Python GPU DataFrame 库,用于加载、连接、聚合和过滤数据。作为面向数据科学家的顶级数据处理库,是一个灵活而强大的 Python 数据分析和操作库。上个月,它的下载量超过 2000 万次。

2024-09-15 20:51:50 1103

原创 NeMo Curator 整理用于 LLM 参数高效微调的自定义数据集

出于演示目的,本文重点介绍一个涉及电子邮件分类的玩具示例。目标是整理一个基于文本的小型数据集,其中每个记录都包含电子邮件(主题和正文)以及该电子邮件的预定义分类标签。为此,我们使用了 Enron 电子邮件数据集,将每封电子邮件标记为八个类别之一。此数据集可在 Hugging Face 上公开获取,并包含约 1400 条记录。定义下载器、迭代器和提取器类,将数据集转换为 JSONL 格式。使用现有工具统一 Unicode 表示。定义自定义数据集过滤器,以删除空白或过长的电子邮件。

2024-09-15 20:49:53 1046

原创 用于空间组学的细胞成像特征提取和形态聚类

VISTA-2D 是 NVIDIA 的新基础模型,可以快速准确地执行细胞分割,这项基本任务在细胞成像和空间组学工作流程中至关重要,对所有下游任务的准确性至关重要。VISTA-2D 模型使用图像编码器创建图像嵌入,然后将其转换为分割蒙版(图 1)。这些嵌入必须包含每个细胞的形态信息。图 1.VISTA-2D 网络架构如果可以为每个细胞分割生成嵌入,则可以在所有嵌入上运行聚类,以自动将具有类似形态的细胞分组。

2024-09-15 20:47:58 1152

原创 使用 RAPIDS 的 Parquet 字符串数据的编码和压缩指南

在RAPIDS开源加速数据科学库套件中,libcudf 是用于列式数据处理的 CUDA C++ 库。基于内存格式,支持 GPU 加速的读取器、写入器、关系代数函数和列转换。在本文中,我们使用parquet_io C++ 示例来演示 libcudf API,并评估编码和压缩方法。对于读/写吞吐量,我们使用 Python函数来显示零代码更改性能结果,比较 pandas 和 RAPIDS的性能。RAPIDS是一个开源的 GPU 加速数据帧库,可以将现有 pandas 代码加速高达 150 倍。

2024-09-15 20:46:59 1133

原创 NIM 和 cuOpt 构建供应链优化 AI 智能体

企业在供应链决策中面临着两大挑战:最大限度地提高利润和快速适应动态变化。为了实现优化的供应链运营,企业需要依赖高级分析和实时数据处理,以适应快速变化的环境并做出明智的决策。优化无处不在。为了履行客户承诺并降低风险,组织运行数千个什么如果场景,以满足客户承诺并将风险降至最低。例如,零售公司必须考虑交通、天气和行驶里程等因素,以优化路线,并降低物流成本,其中超过一半的成本归功于​。同样,和监管限制,以及高昂的研发成本,这使得实时优化变得困难。金融机构必须在波动的市场中平衡风险和回报,这需要。

2024-09-15 20:44:37 853

原创 Geneformer AI 模型,有限数据也能解锁基因网络

和功能强大的 AI 模型,可以通过从大量单细胞转录组数据中进行迁移学习来学习基因网络动力学和相互作用。借助此工具,研究人员可以在数据有限的情况下准确预测基因行为和疾病机制,从而加速药物目标的发现,并提高对各种生物学背景下复杂基因网络的理解。AI 模型 Geneformer 由麻省理工学院和哈佛大学博德研究所的研究人员及其合作者开发,该模型使用 sc-RNA 表达数据中表达最高的基因生成每个细胞的密集表示,这些表示可以用作各种下游预测任务的特征。

2024-09-15 20:43:05 1259

原创 Grace CPU 提升数学优化性能和能效

数学优化是一种功能强大的工具,可以帮助企业和人们做出更明智的决策,并实现任意数量的目标。这些目标包括提高运营效率、降低成本和提高客户满意度。许多日常用例都可以应用数学优化,例如调度航班、定价酒店房间、选择 GPS 路线和规划货运卡车路线等。然而,数学优化计算需求很高。模型复杂性和数据集大小需要复杂的 AI 算法和高性能计算。由于对更快、更好的数学优化解决方案的需求不断增长,从系统、软件平台到加速库,全栈创新是必需的。

2024-09-15 20:41:32 1064

原创 借助 Hybrid RAG 实现 AI 模型高性能与数据隐私保护

快速发展的生成式 AI 领域专注于构建可以创建逼真内容(例如文本、图像、音频和合成数据)的神经网络。生成式 AI 正在多个行业中引发革命,通过快速创建内容、为智能知识助手提供支持、增强软件开发以编码副驾驶,以及跨多个领域自动执行复杂任务。然而,生成式 AI 模型基于有限数据进行训练,只知道数据能告诉他们的内容。实际上,这是一个问题:确保生成内容的准确性和相关性,特别是对于模型训练数据中没有的信息。

2024-09-15 20:39:15 1290

原创 使用 Canaries 防止 AI 模型文件未经授权访问

随着 AI 模型在功能和创建成本方面的增长,它们保存了更多敏感或专有数据,保护静态数据变得越来越重要。为此,组织正在设计策略和工具,通常作为数据丢失预防和安全供应链计划的一部分,以保护模型权重。虽然安全工程讨论的重点是预防(我们如何预防 X?),但检测(发生了 X 吗?)是成熟的深度防御框架中类似的关键部分。这一部分可显著缩短检测、隔离和补救入侵所需的时间。目前,对于 AI 模型的检测功能与用于监控任何其他敏感数据的检测功能相同,没有任何检测功能专注于 AI/ML 的独特性。

2024-09-15 20:38:00 1564

原创 为工程师构建生成式 AI 应用程序

入门非常简单,因为 GitHub 为您提供了内置的 Playground,可让您在 GitHub UI 中免费测试不同的提示和模型参数。随着最近增加的 .NET 支持,Azure AI 推理 SDK 提供了一条整合 AI 的强大途径,确保 .NET 开发人员不会随着这项技术的发展而落后。现在您已经了解了如何使用 Azure AI 推理 SDK 将 AI 模型集成到您的 .NET 应用程序中,让我们探索如何进一步利用 GitHub 模型来扩展您的 AI 功能。您可以随意尝试不同的模型、提示和参数来试验代码。

2024-09-12 21:21:26 1021

原创 探索 AI 代理驱动的汽车保险索赔 RAG 管道。

虽然它们包含与数据工程中的传统 ETL 类似的数据提取和处理,但它们引入了额外的管道阶段,例如分块、嵌入和将数据加载到矢量数据库中,这与标准的 Lakehouse 或数据仓库管道不同。此外,我还想研究和评估如何审查这个和其他 RAG 和生成性人工智能工作流程,以确保符合公平性、可靠性和安全性、隐私性和安全性、包容性、透明度和问责制的标准,如构建和开发这些系统的。这篇文章中,我探讨了最近的一项实验,旨在创建一个针对保险行业量身定制的 RAG 管道,专门用于处理汽车保险索赔,目的是尽可能减少处理时间。

2024-09-12 21:21:15 971

原创 预训练和监督微调(SFT)之间的差异

毫无疑问,大型语言模型的预训练需要多节点、多 GPU 的配置,这就需要分布式训练。目前底层的分布式预训练可以通过调用 NCCL 来实现,更上层的工具有 Megatron、DeepSpeed、HF 的加速库(目前支持 FSDP)等,这些工具可以有效实现 DP/PP/TP。而微调是加载预训练模型中的参数,保留预训练中学习到的共性特征,并在少量高质量标注数据上进行训练,以提升模型在特定任务上的能力和性能。当我们谈论预训练和监督微调(SFT)之间的差异时,目标、使用的数据集和所需的 GPU 数量都是不同的。

2024-09-11 21:35:15 1014

原创 使用您自己的图像微调 FLUX.1 LORA 并使用 Azure 机器学习进行部署

在本博客中,我们将深入研究使用 Dreambooth 对 FLUX 模型进行微调的过程,这种方法因其在生成高质量、定制的 AI 生成内容方面的有效性而广受欢迎。按照本博客中概述的步骤,您可以利用 FLUX.1 [dev] 模型的优势,并使用您独特的数据集对其进行增强,从而实现高质量、个性化的输出。它利用预先训练的模型的现有功能,并通过微调数据集中提供的特定细节、风格或主题对其进行增强。工作区是 Azure 机器学习的顶级资源,提供了一个集中的位置来处理使用 Azure 机器学习时创建的所有工件。

2024-09-11 21:34:37 1580

原创 使用 Azure 机器学习微调小型语言模型 (SLM) Phi-3

在此示例中,我们将学习如何使用 QLoRA 对 phi-3-mini-4k-instruct 进行微调:使用 Flash Attention 对量化 LLM 进行高效微调。3.8B phi-3 mini 模型于 2024 年 4 月底首次发布,phi-3-small、phi-3-medium 和 phi-3-vision 于 5 月在 Microsoft Build 大会上亮相。让我们使用较短版本的数据集来创建训练和测试示例。为了指导调整我们的模型,我们需要将结构化示例转换为通过指令描述的任务集合。

2024-09-11 21:34:17 1012

原创 基线代理 AI 系统架构

你还可以使用 API 管理监视和分析 Azure OpenAI 服务的使用情况 [ 16 ],设置令牌限制策略 [ 17 ],并对 Azure OpenAI 请求的响应启用语义缓存,以减少带宽、处理要求和延迟 [ 18 ]。这些系统由多个可对话的代理组成,这些代理可以相互对话,可以集中协调或以分散的方式自组织 [1, 2]。Azure AI Studio 提供的这些组件和服务实现了复杂的 AI 解决方案的无缝集成、部署和管理,促进了 Agentic AI Systems 的开发和运行。

2024-09-11 21:34:06 945

原创 如何让人工智能训练更快

此公式提供了一个基本框架,但请注意,实际训练时间可能受到许多其他因素的影响,包括 I/O 速度、网络延迟(对于分布式训练)、CPU-GPU 通信速度、GPU 训练期间硬件故障的频率 等。需要注意的是,使用梯度累积时,每个训练步骤都会处理来自多个微批次的梯度的累积,这可能会稍微增加每个步骤的计算时间。通过在每个设备上使用较小的微批次大小进行训练,我们可以减少内存压力,同时保持较大的全局批次大小以获得准确的梯度估计。通常,较大的全局批次大小可以提供更准确的梯度估计,有助于模型收敛。

2024-09-11 21:22:31 1604

原创 训练 Vision Transformer 模型并运行推理

截至目前,CV 模型主要基于卷积神经网络。然而,随着 Transformer 的兴起,Vision Transformer 也逐渐得到应用。接下来,让我们看看主流的 CV 实现及其特性。

2024-09-11 21:02:51 1050

原创 非监督式机器学习:群集

聚类分析是一种非监督式机器学习形式,在此形式下,基于观察值的数据值或特征的相似性,将观察值分组到群集中。 这种就是非监督式机器学习,因为它不使用先前已知的标签值来训练模型。 在聚类分析模型中,标签是群集,仅根据该群集特征向群集分配观察结果。

2024-09-10 20:12:39 299

原创 多元线性回归和 R 平方

在此单元中,我们将多元线性回归与简单的线性回归进行对比。 我们还将介绍一个称为 R2的指标,该指标通常用于评估线性回归模型的质量。

2024-09-10 20:08:58 1456

原创 适用于计算机视觉的机器学习

使用筛选器将效果应用于图像的功能在图像处理任务中非常有用,例如可能使用图像编辑软件执行的任务。 但是,计算机视觉的目标通常是从图像中提取含义或至少是可操作的见解,这需要创建经过训练以基于大量现有图像识别特征的机器学习模型。

2024-09-09 19:19:35 1356 1

原创 什么是生成式 AI?

人工智能 (AI) 通过使用机器学习与环境交互并执行任务来模仿人类行为,而无需明确指示要输出的内容。

2024-09-09 19:14:57 336 1

原创 右键菜单-新建里没有新建文本文档(windows 系统)

然后保存好,再次修改后缀名,把.TXT改成.reg,双击导入到注册表中,重启电脑。

2024-09-06 12:09:25 304 1

原创 2024 年 IBM 量子开发者大会:等你来

在 2024 年 IBM Quantum™ 开发者大会上,与会者将获得 IBM Quantum 尖端工具和即将推出的路线图更新的独家、亲身预览,所有这些都围绕一个主题 — —Qiskit 的性能。

2024-09-01 11:14:14 1279

原创 利用实用规模量子计算模拟宇宙中最极端的环境

华盛顿大学和劳伦斯伯克利国家实验室最近的研究展示了可扩展的技术,有朝一日可以实现最高能量下的基础物理实验模拟。

2024-09-01 11:05:10 2293

原创 IBM Speech to Text:发出语音识别请求

要使用 IBM Watson® Speech to Text 服务请求语音识别,您只需提供要转录的音频。服务为其每个接口(WebSocket 接口、同步 HTTP 接口和异步 HTTP 接口)提供了相同的基本转录功能。描述服务对这些示例的响应。

2024-08-28 19:52:29 1028 2

原创 IBM-Speech to Text:了解语音识别结果

无论您使用何种接口, IBM Watson® Speech to Text 服务都会返回反映您指定的参数的转录结果。服务会以 UTF-8 字符集返回所有 JSON 响应内容。

2024-08-28 19:52:11 1031

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除