• 博客(23)
  • 收藏
  • 关注

原创 AI原生的下一代湖仓智能:大模型应用的新范式

在当今快速演进的技术领域,Data+AI 已成为数据架构的热点方向,涵盖了从数据为AI服务(Data for AI)到利用AI增强数据仓库(AI for Data)的广泛应用,LakeSoul 作为领先的湖仓一体架构主要关注后者的应用。AI for Data 的核心在于运用人工智能技术优化数据处理、分析及管理,以智能化方式突破传统数据仓库的局限。

2025-02-28 13:44:34 1092 1

原创 LakeSoul - 新一代的数智化底座

关于湖仓一体,网上的介绍不少,渠道服务商也很多,但似乎鲜有能真正介绍明白原理和应用定位;与此同时,也经常有人问,你们一帮做 AI 的,怎么就做数据库了?只能尴尬笑笑,我们是做湖仓智能的。不管怎样,想来还是很有必要写一写,聊一聊,权当创业故事。

2025-02-27 10:18:01 898

原创 案例分享!Dmeta-Embedding 融入大模型技术栈

自 Dmeta-Embedding 系列模型发布以来,模型已累积下载近 6 万次、API 产品也有大量内测申请用户。同时我们也收到了很多用户反馈,这些反馈具有很大价值,是我们不断迭代改进、完善的动力,在此也表达下对大家真诚的谢意,让我们一起共建 AI 技术生态!

2025-02-26 11:00:00 696

原创 现在!就请您使用 DMeta Embedding 轻松开启 RAG 之旅吧!

我们的初心依然不变:既要开源优秀的技术能力,又希望大家能够在实际业务中使用起来,用起来的技术才是好技术、能落地创造价值的技术才是值得长期投入的。

2025-02-25 10:00:00 490

原创 大模型时代,我们需要怎样的数据湖?

在大模型的时代背景下,大数据与 AI 无疑是两个最重要的技术生态,尽管如此,大数据和 AI 的技术生态却在许多方面表现出明显的割裂感。这种割裂在存储、格式、流程、框架、平台等方面尤为突出,这使得开发者在实现端到端的数据处理和 AI 工作流程时,常常面临着重重挑战。

2025-02-24 09:52:46 588

原创 向量化计算加速大规模数据湖分析:LakeSoul 支持 Spark Gluten Vectorized Engine

在大数据与人工智能融合的时代,数据处理和分析的效率直接关系到企业的决策速度和创新能力。作为开源数据湖仓项目 LakeSoul,致力于为 BI、AI 计算提供数据支撑的底座。

2025-02-22 10:00:00 958

原创 当湖仓遇上大模型:LakeSoul 实现 Data+AI 一体化湖仓架构的新思考

自 OpenAI 发布 ChatGPT 以来,其惊艳的效果迅速吸引了大量关注,大模型成为了炙手可热的方向。而大模型的相关技术生态也在蓬勃发展。其中在大模型的训练、微调等过程中,都需要大量的输入训练数据来提升模型效果...

2025-02-21 10:00:00 1918

原创 LakeSoul 国产湖仓框架新篇章:开源基金会孵化,国产信创认证,新版本重磅发布

LakeSoul 作为国产自研开源湖仓框架,具备湖仓一体、流批一体、BI/AI 一体等核心设计理念和实现,在并发读写和 IO 性能等方面有着显著的优势。

2025-02-20 13:23:40 963

原创 数元灵科技荣登“千言数据集-语义解析”权威评测榜首,让湖仓智能触手可及

“千言语义解析”评测榜提供了来自业界和学界的 NL2SQL、DuSQL 以及 CSpider 共三个权威数据集,既包含了领域广泛的真实业务数据,也包含了高级复杂的 SQL 查询语句,是中文 Text2SQL 领域的权威榜单。

2025-02-19 15:00:00 588

原创 LakeSoul 发布 2.2.0 版本,全面升级 Native IO,扩大云原生湖仓性能领先幅度

LakeSoul 2.2.0 发布了全新的 Native IO ,进一步扩大了云原生湖仓框架领域的性能优势。提供了快照和增量的接口,能够更好地支持流式数据建模开发。

2025-02-19 10:00:37 573

原创 助力电商出海,Shopify 电商推荐一站式解决方案来啦~

面对琳琅满目的商品,消费者往往会感到困惑和无从选择。推荐算法的作用就是为消费者提供个性化的商品推荐,从而提高其购买意愿和购买率。

2025-02-18 11:40:30 532

原创 赋能产学融合,共创科技未来,数元灵携手CCF BDCI总决赛暨颁奖典礼圆满落幕

数元灵携手CCF BDCI举办数据湖流批一体性能挑战赛

2023-03-03 11:22:50 344

原创 ChatGPT 助力智能文案生成

来自真实业务场景的文案生成方案,我们借助 LLM 预训练模型,再结合前沿的 ChatGPT 模型训练手段,极大的提升了文案生成效果。

2023-02-21 10:44:14 5045

原创 AlphaIDE 服务使用引导

新一代一站式AI开发生产平台

2022-08-19 17:52:22 545

原创 国产唯一开源湖仓框架LakeSoul 2.0 重磅升级:支持快照回滚、Flink和Hive对接

国产唯一开源湖仓框架LakeSoul 2.0 重磅升级:支持快照回滚、Flink和Hive对接。

2022-07-22 18:43:41 1202

原创 基于MetaSpore on AlphaIDE快速落地风控算法

本文以天池贷款违约数据集为例,在数元灵科技推出的MetaSpore on AlphaIDE 开发环境中,训练、评估违约预估模型,并根据概率给出智能信用评分。

2022-07-22 17:52:44 419

原创 案例分享:LakeSoul 独有的 MergeOperator 功能

使用自定义MergeOperator支持null字段非覆盖语义

2022-07-22 15:51:41 736

原创 AlphaIDE - 新一代AI开发生产平台开放内测

AlphaIDE - 新一代AI开发生产平台开放内测

2022-07-22 11:56:24 321

原创 多模态语义检索 | 基于 MetaSpore 快速部署 HuggingFace 预训练模型

MetaSpore是数元灵团队推出的开源一站式机器学习平台,可以帮助开发者快速落地工业级AI系统。本文将向读者将介绍基于MetaSpore使用HuggingFace社区提供的预训练模型实现多模态检索的技术方案,并给出代码实现和效果展示。...

2022-06-01 16:28:43 1502 1

原创 使用 LakeSoul 构建实时机器学习样本库

LakeSoul 是数元灵研发并开源的流批一体表存储框架。本文以实时机器学习样本库场景为落地案例,带大家探索体验使用 LakeSoul 强大的流批一体入湖能力是解决实际业务痛点。

2022-05-26 14:24:37 671

原创 开源湖仓平台LakeSoul设计理念详解

LakeSoul是国产唯一开源湖仓一体框架,围绕大数据架构体系新趋势进行了大量的设计优化。

2022-04-14 16:33:27 1201

原创 新一代一站式机器学习平台MetaSpore的设计理念

MetaSpore是数元灵出品的开源一站式机器学习平台,提供数据预处理、模型训练、离线实验、在线推理、在线应用框架的全流程框架和开发接口。

2022-04-11 17:21:29 1641

原创 基于新一代MetaSpore平台快速搭建工业级推荐系统

使用MetaSpore快速搭建工业级推荐系统

2022-04-01 18:50:46 1111 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除