PandasAI这个工具最突出的优点就是通过结合了Pandas和生成式LLMs,极大地为开发人员降低了工作量。
-
传统的开发调用流程(数据分析相关):
可以看到,对于开发人员来说实现一个需求需要完成多个步骤。
-
使用PandasAI之后的开发调用流程:
PandasAI 使用生成式 AI 模型来理解和解释自然语言查询,并将其转换为 python 代码和 SQL 查询。然后,它使用代码与数据进行交互,并将结果返回给用户。可以看到,PandasAI从很大程度上降低了后端开发的工作量。
1.使用PandasAI进行开发的流程
- 要使用PandasAI进行开发,首先,需要导入数据,可以是非数据库的pandas.DataFrame()或者数据库的connector如MySQLConnector。
- 然后,声明主类对象,根据数据的不同可以选择单帧数据一次提问的SmartDataFrame、多帧数据一次提问的SmartDatalake或多帧数据多次提问的Agent。
- 接下来,调用方法进行回答,包括基础问、响应式提问、针对回答进行解释、对用户的查询语句进行优化重组。
- 最后,返回结果,不仅支持结构化数据返回,还支持图表(如下图所示):
代码示例如下:
"""Example of using PandasAI with a pandas dataframe"""
from pandasai import SmartDataframe