VMware Greenplum 团队近日正式发布了 GreenplumPython 1.0 开源版 。在 GreenplumPython 支持下,用户可以使用 Python 作为编程语言与 Greenplum 数据库进行交互,无需额外写 SQL。
具体来说,GreenplumPython 提供了与 pandas 库类似的 DataFrame API,它具有如下特点:
-
对于 Python 用户,特别是 pandas 用户来说比较熟悉,容易上手;
-
能够方便地对各种数据进行复杂的分析,包括统计和机器学习等;
-
包含了常用的 Greenplum 最佳实践,可以方便地写出正确高效的查询。
在实现上,所有对 DataFrame 的操作都会被翻译成 SQL 语句,然后发送到 Greenplum 集群去执行。 因此,所有的计算都在集群内部完成。除了 Greenplum,PostgreSQL 理论上也可以用作 GreenplumPython 的后端,用于存储数据和执行计算。
我们非常希望大家能够尝试 GreenplumPython 并给予一些反馈。如果您对此感兴趣,可以使用
pip3 install --user greenplum-python
来安装 GreenplumPython,并通过
import greenplumpython as gp
使用它的各种功能。
更多信息
欢迎访问 https://greenplum-db.github.io/GreenplumPython/stable/
阅读 GreenplumPython 的文档。谢谢!
来一波 “在看”、“分享” 和 “赞” 吧!
本文分享自微信公众号 - Greenplum中文社区(GreenplumCommunity)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。