Chatgpt 最近可是火出了圈,今天我们来分享如何使用 chatgpt 来减轻数据分析师的工作。
数据可视化
在执行探索性数据分析时,用 Python 快速生成可视化图,通常可以帮助我更好地理解数据集。
不幸的是,这项任务可能会变得非常耗时—尤其是当你不知道如何使用正确的语法来获得所需结果时。
我经常发现自己在搜索 Seaborn 的大量文档并使用 StackOverflow 生成单个 Python 图。
让我们看看 ChatGPT 是否可以帮助解决这个问题。
这里我们使用的数据集是来自 kaggle 上的 Pima Indians Diabetes。
下载数据后,让我们使用 Pandas 进行读取并显示。
ini
复制代码
import pandas as pd
df = pd.read_csv('diabetes.csv')
df.head()
该数据集中有九个变量。其中 “Outcome” 变量是告诉我们一个人是否会患上糖尿病的目标变量。其余的是用于预测结果的自变量。
好的!所以我想看看这些变量中的哪些变量会影响一个人是否会患上糖尿病。
为实现这一点,我们可以创建一个聚类条形图来查看。
这实际上很容易编写出来,但让我们从简单的开始。随着文章的进展,我们将转向更复杂的提示。
现在,让我们输入以下提示以使用糖尿病数据集生成可视化。
下面是 chatgpt 生成的完整代码片段。
ini
复制代码
import seaborn as sns
import pandas as pd
# 读取数据
df = pd.read_csv("data.csv")
# 绘制聚类条形图
sns.catplot(x="variable", y="value",hue="Outcome",
data=pd.melt(df, id_vars=["Outcome"]),
kind="bar", height=4, aspect=2)
把数据集的名称换一下,就真的生成了我们想要的图。
这张图表看起来很完美!这正是我在 ChatGPT 中输入提示时的设想。
然而,一个突出的问题是该图表上的文本重叠。
我将通过键入以下提示询问模型是否可以帮助我们解决此问题:
生成的图形中 x 轴的标签有重叠,我们如何修改它呢
这看起来很棒!
通过简单地查看此图表,我现在可以更好地理解数据集。似乎葡萄糖和胰岛素水平较高的人更容易患上糖尿病。
这里给大家分享一份Python全套学习资料,包括学习路线、软件、源码、视频、面试题等等,都是我自己学习时整理的,希望可以对正在学习或者想要学习Python的朋友有帮助!
优快云大礼包:全网最全《全套Python学习资料》免费分享🎁
😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓
1️⃣零基础入门
① 学习路线
对于从来没有接触过Python的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
② 路线对应学习视频
还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~
③练习题
每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
因篇幅有限,仅展示部分资料
2️⃣国内外Python书籍、文档
① 文档和书籍资料
3️⃣Python工具包+项目源码合集
①Python工具包
学习Python常用的开发软件都在这里了!每个都有详细的安装教程,保证你可以安装成功哦!
②Python实战案例
光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。100+实战案例源码等你来拿!
③Python小游戏源码
如果觉得上面的实战案例有点枯燥,可以试试自己用Python编写小游戏,让你的学习过程中增添一点趣味!
4️⃣Python面试题
我们学会了Python之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
5️⃣Python兼职渠道
而且学会Python以后,还可以在各大兼职平台接单赚钱,各种兼职渠道+兼职注意事项+如何和客户沟通,我都整理成文档了。
上述所有资料 ⚡️ ,朋友们如果有需要 📦《全套Python学习资料》的,可以扫描下方二维码免费领取 🆓
😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓