使用 Streamlit 与 PandasAI 搭建多文件处理与智能分析平台

最新推荐文章于 2025-10-14 15:04:02 发布

原创

最新推荐文章于 2025-10-14 15:04:02 发布 · 1.4k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python #pandas #ai #azure

文章目录

前言
环境准备
项目结构
实现功能详解
总结
参考

前言

在数据处理和分析过程中，快速、高效地操作多个数据文件是至关重要的。随着人工智能技术的发展，尤其是 OpenAI 的应用，我们可以将 AI 能力集成到数据处理工作中，显著提升效率。本文将介绍如何结合 Streamlit 和 PandasAI，构建一个多文件处理与智能分析平台，并集成 Azure OpenAI 提供的数据处理支持。

环境准备

在开始之前，需要准备好以下环境：

1、Python 环境：本文使用 Python 3.8 以上版本。
2、必要库安装：

pip install streamlit pandas openpyxl chardet pandasai

3、Azure OpenAI 配置：确保已经在 Azure 中创建了 OpenAI 资源，并获取了 API Key、Endpoint 和 Deployment ID 等信息。将这些信息存储在 .env 文件中，以便代码中调用。

项目结构

.
├── .env               # 存放 Azure OpenAI 配置信息
└── app.py             # 主应用代码

.env 文件内容示例：

AZURE_API_KEY=your_azure_api_key
AZURE_ENDPOINT=https://your-azure-endpoint
AZURE_DEPLOYMENT_ID=your_deployment_id
AZURE_API_VERSION=2023-05-15

实现功能详解

在这个项目中，我们的主要目标是构建一个能够处理多个 CSV 和 Excel 文件的 Streamlit 应用，并集成 Azure OpenAI，帮助用户实现更高效的数据分析和处理。

加载环境变量
通过 python-dotenv 库加载 .env 文件中的环境变量：

import os
from dotenv import load_dotenv

load_dotenv()

api_key = os.getenv('AZURE_API_KEY')
azure_endpoint = os.getenv('AZURE_ENDPOINT')
deployment_id = os.getenv('AZURE_DEPLOYMENT_ID')
api_version = os.getenv('AZURE_API_VERSION')