- 博客(480)
- 收藏
- 关注
原创 DataWorks数据集成同步至Hologres能力介绍
DataWorks 数据集成是一个稳定高效、弹性伸缩的数据同步平台,致力于提供在复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力,提供低成本、高效率、全场景覆盖的数据同步方案。当我们面向数据库级别,向 Hologres 进行同步时,能够实现简单且快速的同步设置。
2025-04-01 10:25:22
594
原创 高效向量检索实践:阿里云百炼生成+Milvus存储技术方案解析
阿里云提出百炼+Milvus从多模态数据向量化到高效检索的完整链路解决方案。该方案覆盖数据预处理、向量生成、分布式存储、混合检索等全流程,为AI场景提供开箱即用的向量数据管理能力,支撑推荐系统、内容相似性搜索等场景的快速落地。
2025-03-31 10:49:49
963
原创 MaxCompute MaxFrame正式推出AI Function功能,一键调用大模型处理海量数据!
MaxCompute MaxFrame正式推出AI Function功能,一键调用大模型处理海量数据!AI Function引入开箱即用的Qwen 2.5 和 Deepseek-R1-Distill-Qwen 等系列大模型,直接调用接口就可以对 MaxCompute表中的海量数据使用大模型进行离线处理。
2025-03-28 14:03:16
1017
原创 谁是 AI 搜索先锋?阿里云携手 Elastic 正式启动先锋者招募!
阿里云携手 Elastic 在中国市场正式启动“Elastic Pioneer” 先锋者计划。这一计划,是精心筹备的 Elastic 推广大使招募项目,旨在汇聚社区开发者的力量,共同构建 AI 搜索技术应用新范式,加速企业数字化转型进程。
2025-03-28 10:12:30
709
原创 快速使用Milvus MCP Server,0代码搭建智能搜索Agent
本文介绍如何使用 Milvus MCP Server 即可实现快速高效搭建智能搜索 Agent,简化繁琐的开发流程,为搭建智能应用提效!
2025-03-27 15:49:25
581
原创 【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B
现阿里云PAI-Model Gallery已同步接入DeepSeek-V3-0324、Qwen2.5-VL-32B-Instruct两大新模型,提供企业级部署方案。
2025-03-27 15:08:38
568
原创 Hologres诊断与优化快速入门
本文讲述了如何利用Hologres诊断与调优工具,实现对 SQL 和数据库异常的全方位诊断,从而提升实例稳定性。
2025-03-27 11:41:06
666
原创 爱橙科技基于 MaxCompute 智能物化视图最佳实践
本文根据《Data+AI融合趋势下的智能数仓平台建设》线下meetup演讲实录整理而成,从三个角度分享爱橙科技如何基于 MaxCompute 智能物化视图进行计算成本优化。
2025-03-27 11:30:59
959
原创 DistilQwen2.5-R1发布:知识蒸馏助推小模型深度思考
文章介绍了DistilQwen2.5-R1系列模型的开发与性能评估。通过知识蒸馏技术,该系列模型成功将大规模深度推理模型的知识迁移到小模型中,显著提升了计算效率和部署灵活性。
2025-03-26 14:05:28
1333
原创 最佳实践 | 在 EMR Serverless Spark 中实现 Doris 读写操作
本文将介绍如何在 EMR Serverless Spark 中实现 Doris 的读写操作。
2025-03-25 10:07:51
1005
原创 MCP+Hologres+LLM 搭建数据分析 Agent
Hologres已成为MCP官方集成服务,可通过MCP+Hologres+LLM搭建构建跨数据源、多步骤分解的数据分析Agent。
2025-03-24 11:40:31
819
原创 使用DataWorks Notebook实现智能图片标注,给你的图片加个“注释”
本文将基于视觉识别模型 RAM 和自然语言处理模型 BERT,介绍如何使用DataWorks Notebook实现多模态图片标注,为智能内容生成、多模态数据分析领域提供数据基础。
2025-03-21 10:40:49
853
原创 如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介
阿里云人工智能平台 PAI 推出 PAI-Judge 裁判员大模型,为用户构建符合应用场景的多维度、细粒度的评测体系,支持单模型评测和双模型竞技两种模式,允许用户自定义参数,实现准确、灵活、高效的模型自动化评测,为模型迭代优化提供数据支撑。
2025-03-21 09:57:12
1056
原创 在EMR Serverless Spark中实现StarRocks读写操作
EMR Serverless Spark 是一款面向 Data+AI 的高性能 Lakehouse 产品。它为企业提供了一站式的数据平台服务,包括任务开发、调试、调度和运维等,极大地简化了数据处理和模型训练的全流程。
2025-03-20 13:51:19
747
原创 Hologres Dynamic Table快速入门
动态表(Dynamic Table)具备自动物化查询结果的功能,并提供了增量计算与全量计算两种模式,以适应不同场景下的计算需求。在Hologres 3.0版本中,Dynamic Table作为全新表类型被重点引入。
2025-03-20 09:55:31
916
原创 DataWorks :Data+AI 一体化开发实战图谱
DataWorks 数据开发现支持使用 GPU 资源,打破“大数据+AI”融合瓶颈。开发者可在同一平台完成从数据处理到模型推理的全流程,无需跨平台迁移数据。
2025-03-19 10:59:45
971
原创 阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024,该奖项于近日在新加坡 ElasticON 2025的 Elastic 合作伙伴峰会上颁发,旨在表彰基于 Elastic 平台开发企业级生成式人工智能(GenAI)应用的顶尖合作伙伴
2025-03-19 09:54:06
1295
原创 Hologres实时湖仓能力入门实践
Hologres 3.0版本为一体化实时湖仓平台,通过统一数据平台实现湖仓存储一体、多模式计算一体、分析服务一体、Data+AI 一体,实现一份数据、一份计算、一份服务,极大提高数据开发及应用效率
2025-03-18 10:00:52
907
原创 Flink CDC+Hologres高性能数据同步优化实践
本文详细介绍了 Hologres 在与 Flink 结合时的高性能数据同步优化实践,涵盖写入和消费的多方面优化策略。通过这些优化,可以显著提高数据同步的速度和稳定性,确保数据在不同系统之间的高效流转。
2025-03-18 09:43:31
1104
原创 演讲实录|分布式 Python 计算服务 MaxFrame 介绍及场景应用方案
MaxFrame 是基于云原生的分布式 Python 计算服务,支持 Python 编程接口,兼容 Pandas、XGboost 等数据处理及 ML 算子接口且自动实现分布式处理,同时能直接使用 MaxCompute 的弹性计算资源和数据接口,与 MaxCompute Notebook、镜像管理等功能共同构成了 MaxCompute 的 Python 开发生态。
2025-03-17 13:20:47
938
原创 查询队列(Query Queue)快速入门
查询队列(Query Queue)是资源队列方案,针对突发的流量高峰及未知大任务影响OLAP系统稳定性问题,通过并发控制、排队能力、查询隔离和查询熔断四大功能,保证任务有序、按量使用资源,搭配Serverless Computing等相关能力,实现大任务的隔离与熔断,保证实例稳定性。
2025-03-13 09:43:15
597
原创 Hologres 计算组实例&分时弹性入门实践
Hologres 计算组实例(Virtual Warehouse)是基于物理隔离的存算分离架构,只需保留一份存储,将多个业务需求拆分多个计算组实例,即可解决复负载隔离问题。搭配分时弹性能力,实现资源的规划与有效利用,帮助客户降低整体成本。
2025-03-12 14:55:40
873
原创 DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen2.5是阿里云人工智能平台PAI推出的全新蒸馏大语言模型系列。通过黑盒化和白盒化蒸馏结合的自研蒸馏链路,DistilQwen2.5各个尺寸的模型在多个基准测试数据集上比原始Qwen2.5模型有明显效果提升。
2025-03-12 13:52:46
960
原创 中免日上使用阿里云向量检索服务 Milvus 版搭建在线推荐系统
阿里云向量检索服务 Milvus 版,为中免日上搭建在线推荐系统提供了有力的技术支持。阿里云 Milvus 具备优秀的可观测性、弹性扩缩能力、版本平滑升级能力和极高的稳定性,较好地支撑了中免日上的在线推荐业务。
2025-03-11 14:08:53
951
原创 基于 Megatron 的多模态大模型训练加速技术解析
本文以 Qwen2-VL 为例,从易用性和训练性能优化两个方面介绍基于 Megatron 构建的 Pai-Megatron-Patch 多模态大模型训练的关键技术。
2025-03-11 13:28:25
932
原创 云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践
本文以 Qwen2-VL 为例,从易用性和训练性能优化两个方面介绍基于 Megatron 构建的 Pai-Megatron-Patch 多模态大模型训练的关键技术。
2025-03-11 11:47:48
774
原创 降价46%,Hologres Serverless Computing 快速入门
Hologres Serverless Computing可以通过按量付费的形式稳定执行大规模ETL与查询,实现资源负载隔离,同时提高查询速度,降低成本,
2025-03-11 10:40:28
1024
原创 通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统
阿里云向量检索服务 Milvus 最新版本 2.5 在全文检索、关键词匹配以及混合检索(Hybrid Search)方面实现了显著的增强,在多模态检索、RAG等多场景中检索结果能够兼顾召回率与精确性。
2025-03-05 10:19:56
1122
原创 基于 Hologres & DeepSeek & PAI-EAS 搭建 RAG 检索增强对话系统
Hologres 与阿里云自研高性能向量计算软件库 Proxima 深度整合,支持高性能、低延时、简单易用的向量计算能力。本文将介绍如何使用 PAI-EAS 部署基于 DeepSeek 大模型的 RAG 服务,并关联 Hologres 引擎实例,以及对 RAG 对话系统的基础功能和 Hologres 高性能向量的功能进行说明。
2025-03-04 10:00:22
970
原创 阿里云Milvus 2.5:支持全文检索,1次查询实现文本+向量双精度匹配
目前,阿里云向量检索服务 Milvus 版集成开源 Milvus2.5版本内核,在支持向量检索的基础上,新增支持原生全文检索、基于特定词汇的精准文本匹配等功能,在 RAG、多模态搜索等场景下搜索精度明显提升,使用体验大幅优化。
2025-03-03 10:06:46
652
原创 演讲实录 | MaxCompute 智能物化视图
MaxCompute 智能数仓对用户来说是一个无需人工干预的系统,并且具备自我学习的能力。本文将围绕资源分配优化、执行计划优化、智能物化视图、增量计算、数据排布和作业管理,基于 MaxCompute 智能数仓核心能力图展开讲解。
2025-02-28 13:42:29
761
原创 Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名
阿里云人工智能搜索是一种将高级人工智能功能与 Elasticsearch 工具相结合的解决方案,利用 Qwen LLM/DeepSeek-R1 系列提供高级推理和分类模型。在本文中,我们将使用同一作者撰写的小说和戏剧的描述来测试阿里巴巴重新排名和稀疏嵌入端点。
2025-02-28 10:41:47
770
原创 MaxCompute x DataWorks × DeepSeek,实现使用自定义数据集微调DeepSeek-R1蒸馏模型
本文将为您带来基于阿里云云原生大数据计算服务 MaxCompute 以及大数据治理开发平台 Dataworks 实现使用自定义数据集微调 DeepSeek-R1 蒸馏模型,通过这一过程能够简化模型微调和数据集构建的过程,提高开发效率。
2025-02-28 09:47:08
592
原创 AI 搜索开放平台 × DeepSeek,面向企业及开发者的首选解决方案
作为阿里云的一站式智能搜索解决方案,AI 搜索开放平台提供丰富的组件化服务,助力企业及开发者快速搭建智能搜索、RAG(检索增强生成)和多模态搜索等应用场景
2025-02-27 09:53:01
498
原创 阿里万相重磅开源,人工智能平台PAI一键部署教程来啦
阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署阿里万相重磅开源的4个模型,可获得您的专属阿里万相服务。
2025-02-27 09:43:05
947
原创 云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理
DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核,显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。
2025-02-26 10:38:55
811
原创 DistilQwen2.5发布:通义千问蒸馏小模型再升级
为解决大语言模型在资源有限环境下的高计算成本和复杂性问题,阿里云推出了基于 Qwen2.5 的轻量化模型系列 DistilQwen2.5。该模型通过双层蒸馏框架、数据优化策略及参数融合技术,在保留性能的同时显著降低计算资源消耗。
2025-02-26 09:47:50
1050
原创 Milvus x DeepSeek 搭建低成本高精度 RAG 实战
本文介绍如何使用阿里云 Milvus+DeepSeek + PAI LangStudio 低成本搭建高精度的RAG(检索增强生成)系统。通过此文,开发者可以搭建一个支持私域知识库和联网功能的智能问答助手,助力企业应对数据管理和业务挑战。
2025-02-25 16:28:08
1331
原创 MaxCompute x Dataworks × DeepSeek,实现使用自定义数据集微调DeepSeek-R1蒸馏模型
本文以MaxCompute+Dataworks+PAI为基础,快速微调DeepSeek-R1蒸馏模型。
2025-02-24 14:09:29
977
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人