- 博客(23)
- 收藏
- 关注
原创 AI原生的下一代湖仓智能:大模型应用的新范式
在当今快速演进的技术领域,Data+AI 已成为数据架构的热点方向,涵盖了从数据为AI服务(Data for AI)到利用AI增强数据仓库(AI for Data)的广泛应用,LakeSoul 作为领先的湖仓一体架构主要关注后者的应用。AI for Data 的核心在于运用人工智能技术优化数据处理、分析及管理,以智能化方式突破传统数据仓库的局限。
2025-02-28 13:44:34
1092
1
原创 LakeSoul - 新一代的数智化底座
关于湖仓一体,网上的介绍不少,渠道服务商也很多,但似乎鲜有能真正介绍明白原理和应用定位;与此同时,也经常有人问,你们一帮做 AI 的,怎么就做数据库了?只能尴尬笑笑,我们是做湖仓智能的。不管怎样,想来还是很有必要写一写,聊一聊,权当创业故事。
2025-02-27 10:18:01
898
原创 案例分享!Dmeta-Embedding 融入大模型技术栈
自 Dmeta-Embedding 系列模型发布以来,模型已累积下载近 6 万次、API 产品也有大量内测申请用户。同时我们也收到了很多用户反馈,这些反馈具有很大价值,是我们不断迭代改进、完善的动力,在此也表达下对大家真诚的谢意,让我们一起共建 AI 技术生态!
2025-02-26 11:00:00
696
原创 现在!就请您使用 DMeta Embedding 轻松开启 RAG 之旅吧!
我们的初心依然不变:既要开源优秀的技术能力,又希望大家能够在实际业务中使用起来,用起来的技术才是好技术、能落地创造价值的技术才是值得长期投入的。
2025-02-25 10:00:00
490
原创 大模型时代,我们需要怎样的数据湖?
在大模型的时代背景下,大数据与 AI 无疑是两个最重要的技术生态,尽管如此,大数据和 AI 的技术生态却在许多方面表现出明显的割裂感。这种割裂在存储、格式、流程、框架、平台等方面尤为突出,这使得开发者在实现端到端的数据处理和 AI 工作流程时,常常面临着重重挑战。
2025-02-24 09:52:46
588
原创 向量化计算加速大规模数据湖分析:LakeSoul 支持 Spark Gluten Vectorized Engine
在大数据与人工智能融合的时代,数据处理和分析的效率直接关系到企业的决策速度和创新能力。作为开源数据湖仓项目 LakeSoul,致力于为 BI、AI 计算提供数据支撑的底座。
2025-02-22 10:00:00
958
原创 当湖仓遇上大模型:LakeSoul 实现 Data+AI 一体化湖仓架构的新思考
自 OpenAI 发布 ChatGPT 以来,其惊艳的效果迅速吸引了大量关注,大模型成为了炙手可热的方向。而大模型的相关技术生态也在蓬勃发展。其中在大模型的训练、微调等过程中,都需要大量的输入训练数据来提升模型效果...
2025-02-21 10:00:00
1918
原创 LakeSoul 国产湖仓框架新篇章:开源基金会孵化,国产信创认证,新版本重磅发布
LakeSoul 作为国产自研开源湖仓框架,具备湖仓一体、流批一体、BI/AI 一体等核心设计理念和实现,在并发读写和 IO 性能等方面有着显著的优势。
2025-02-20 13:23:40
963
原创 数元灵科技荣登“千言数据集-语义解析”权威评测榜首,让湖仓智能触手可及
“千言语义解析”评测榜提供了来自业界和学界的 NL2SQL、DuSQL 以及 CSpider 共三个权威数据集,既包含了领域广泛的真实业务数据,也包含了高级复杂的 SQL 查询语句,是中文 Text2SQL 领域的权威榜单。
2025-02-19 15:00:00
588
原创 LakeSoul 发布 2.2.0 版本,全面升级 Native IO,扩大云原生湖仓性能领先幅度
LakeSoul 2.2.0 发布了全新的 Native IO ,进一步扩大了云原生湖仓框架领域的性能优势。提供了快照和增量的接口,能够更好地支持流式数据建模开发。
2025-02-19 10:00:37
573
原创 助力电商出海,Shopify 电商推荐一站式解决方案来啦~
面对琳琅满目的商品,消费者往往会感到困惑和无从选择。推荐算法的作用就是为消费者提供个性化的商品推荐,从而提高其购买意愿和购买率。
2025-02-18 11:40:30
532
原创 ChatGPT 助力智能文案生成
来自真实业务场景的文案生成方案,我们借助 LLM 预训练模型,再结合前沿的 ChatGPT 模型训练手段,极大的提升了文案生成效果。
2023-02-21 10:44:14
5045
原创 国产唯一开源湖仓框架LakeSoul 2.0 重磅升级:支持快照回滚、Flink和Hive对接
国产唯一开源湖仓框架LakeSoul 2.0 重磅升级:支持快照回滚、Flink和Hive对接。
2022-07-22 18:43:41
1202
原创 基于MetaSpore on AlphaIDE快速落地风控算法
本文以天池贷款违约数据集为例,在数元灵科技推出的MetaSpore on AlphaIDE 开发环境中,训练、评估违约预估模型,并根据概率给出智能信用评分。
2022-07-22 17:52:44
419
原创 多模态语义检索 | 基于 MetaSpore 快速部署 HuggingFace 预训练模型
MetaSpore是数元灵团队推出的开源一站式机器学习平台,可以帮助开发者快速落地工业级AI系统。本文将向读者将介绍基于MetaSpore使用HuggingFace社区提供的预训练模型实现多模态检索的技术方案,并给出代码实现和效果展示。...
2022-06-01 16:28:43
1502
1
原创 使用 LakeSoul 构建实时机器学习样本库
LakeSoul 是数元灵研发并开源的流批一体表存储框架。本文以实时机器学习样本库场景为落地案例,带大家探索体验使用 LakeSoul 强大的流批一体入湖能力是解决实际业务痛点。
2022-05-26 14:24:37
671
原创 新一代一站式机器学习平台MetaSpore的设计理念
MetaSpore是数元灵出品的开源一站式机器学习平台,提供数据预处理、模型训练、离线实验、在线推理、在线应用框架的全流程框架和开发接口。
2022-04-11 17:21:29
1641
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人