Python 数据可视化框架 Plotly 4.0 发布

Plotly团队已发布Plotly.py 4.0版本,新增功能包括默认离线模式、内置PlotlyExpress及改进渲染框架,支持多种IDE和notebook系统,如Jupyter、Colab和VSCode。
导读昨天,Plotly团队宣布发布Plotly.py 4.0版本,现在可从PyPI下载。此版本包括一些令人兴奋的新功能和更改,包括默认情况下切换到“离线”模式,包含Plotly Express作为库中的推荐入口点,以及新的渲染框架。

昨天,Plotly团队宣布发布Plotly.py 4.0版本,现在可从PyPI下载。此版本包括一些令人兴奋的新功能和更改,包括默认情况下切换到“离线”模式,包含Plotly Express作为库中的推荐入口点,以及新的渲染框架,不仅兼容Jupyter notebook,还兼容其他notebook系统例如Colab,Azure和Kaggle notebook,以及PyCharm,VSCode,Spyder等流行的IDE。

要升级到最新版本,您可以运行pip install plotly==4.0.0或conda install -c plotly plotly==4.0.0。

Python 数据可视化框架 Plotly 4.0 发布Python 数据可视化框架 Plotly 4.0 发布

让我们看看Plotly 4.0中的主要功能

 

仅限离线

 

用于在“在线”和“离线”模式下创建图形的图形包含功能的先前版本。在“在线”模式下,数字被上传到Plotly的Chart Studio服务的实例然后显示,而在“离线”模式下,数字在本地呈现。这种二元性是多年来混淆的常见原因,因此在第4版中,团队进行了一些重要的更改以帮助明确这一点。

在这个版本中,plotly包中唯一支持的操作模式是“离线”模式,它不需要互联网连接,没有帐户,没有身份验证令牌,也没有任何类型的付款。对“在线”模式的支持已经转移到一个名为chart-studio的单独安装的软件包中。

 

重要的Express

 

今年早些时候,该团队发布了一个名为Plotly Express的独立库,旨在通过简洁的数据创建简洁明快的数据,从而简化和快速创建简单的数据 - 就像单行Python一样简单。 Plotly Express非常受社区欢迎,从版本4开始,现在包括Plotly Express内置的,可以作为plotly.express访问。

 

可显示的地方

 

除了“离线”模式外,还有剧情。离线包已经在一个新的可扩展渲染器框架上重新实现,这个框架不仅可以在Jupyter notebooks上显示图形,还可以在任何地方显示图形,比如:

  • JupyterLab和经典的Jupyter notebooks
  • 其他notebooks,如Colab,nteract,Azure和Kaggle
  • IDE和CLI,如VSCode,PyCharm,QtConsole和Spyder
  • 其他背景如狮身人面像画廊
  • 破折号应用程序(使用dash_core_components.Graph())
  • 静态栅格和矢量文件(使用fig.write_image())
  • 独立的交互式HTML文件(使用fig.write_html())
  • 嵌入任何网站(使用fig.to_json()和Plotly.js)

除了上述新功能外,还有其他更改,例如Plotly.py 4.0中提供的新默认主题。该团队推出了一套新的数字方法,用于在数据构建完成后更新数据。它还支持所有子图和跟踪类型:2D,3D,极性,三元,地图,饼图,sunbursts,Sankey图等。JupyterLab 1.0也支持Plotly.py 4.0。

要详细了解这些功能更新,请查看Plotly团队的Medium帖子

原文来自:https://www.linuxprobe.com/plotly-4-0-python.html

### 三级标题:基于Python爬虫的图书数据获取与可视化实现方法 Python作为一门功能强大的编程语言,广泛应用于自动化、数据爬虫、管理系统和人工智能等领域。在图书数据获取方面,可以利用Python编写网络爬虫程序从各大图书网站(如豆瓣读书、京东图书、当当网等)抓取图书的基本信息,包括书名、作者、出版社、出版时间、评分、评论等内容,并将这些非结构化或半结构化的网页数据转换为结构化数据存储于本地数据库或文件中[^1]。 在数据爬取过程中,常用的Python库包括`requests`用于发送HTTP请求,`BeautifulSoup`或`lxml`用于解析HTML文档结构,以及`Scrapy`框架用于构建更复杂的爬虫系统。对于需要处理JavaScript渲染页面的数据源,还可以结合`Selenium`或`Playwright`等工具模拟浏览器行为获取动态加载内容[^1]。 完成数据采集后,接下来是数据清洗与预处理阶段。使用`Pandas`库对原始数据进行去重、缺失值处理、字段标准化等操作,确保后续分析结果的准确性。例如,可以通过以下代码片段实现对图书评分字段的格式统一: ```python import pandas as pd # 示例:清理并转换评分字段 data = pd.read_csv('books.csv') data['rating'] = data['rating'].str.replace('分', '').astype(float) ``` 数据可视化是将处理后的图书数据以图表形式呈现,帮助用户快速识别数据特征和趋势。常见的可视化任务包括图书评分分布、销量排行、热门类别统计等。可借助`Matplotlib`和`Seaborn`库绘制柱状图、折线图、饼图等静态图形;若需构建交互式可视化界面,则可选用`Plotly`或`Bokeh`等高级可视化工具[^2]。以下是一个展示图书评分分布的示例代码: ```python import matplotlib.pyplot as plt # 绘制图书评分分布柱状图 ratings = [4.0, 4.2, 4.5, 4.7, 4.9] counts = [150, 300, 450, 200, 100] plt.bar(ratings, counts, color='skyblue') plt.xlabel('评分') plt.ylabel('数量') plt.title('图书评分分布') plt.show() ``` 此外,在构建完整的图书数据获取与可视化系统时,通常会采用Django框架搭建Web应用平台,提供前后端分离的数据服务和可视化展示界面。该框架支持快速开发、设计和部署网站,能够有效整合数据采集、处理、存储及可视化展示等多个模块[^1]。 整个系统的实现流程包括:定义目标网站的数据结构 → 编写爬虫程序抓取所需信息 → 数据清洗与格式转换 → 存储至数据库(如MySQL、MongoDB)→ 利用数据分析库进行统计计算 → 使用可视化库生成图表 → 集成到Web应用中实现交互式展示。 通过上述技术手段,不仅可以提升图书数据处理的效率和质量,还能够在图书馆管理系统、电商平台数据分析、个性化推荐系统等多个应用场景中发挥重要作用[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值