摘 要
本系统基于Python Flask框架构建了一套出租车运营数据可视化分析平台,整合Bootstrap前端框架、ECharts可视化组件和MySQL数据库,实现了多维度的出租车业务数据洞察。系统通过Flask后端高效处理数据查询与接口响应,采用Bootstrap实现响应式页面布局,结合ECharts丰富的图表类型进行动态数据展示,MySQL数据库稳定存储结构化业务数据。
核心功能模块包含:1)小费与行程距离散点图分析,揭示小费支付与行驶距离的关联规律;2)支付方式环形图直观呈现信用卡/现金等支付渠道占比;3)费用分布直方图统计不同金额区间的订单频率;4)乘客人数饼图展示拼车服务的使用特征;5)车辆颜色词云图凸显主流出租车颜色趋势;6)折线图追踪每日订单金额波动,辅助运营策略制定;7)上下车区域词云可视化热点出行区域分布。系统创新性采用词云技术解析地理位置文本数据,通过热力图、散点图等多维图表联动,实现从基础统计到空间分布的全方位分析。
该平台为出租车公司提供数据驱动的决策支持,可帮助优化车辆调度、提升服务质量、识别消费模式,具有行业应用价值。系统架构采用模块化设计,支持数据动态更新,可视化组件具备交互特性,满足不同场景下的数据分析需求。
- 绪论
- 研究背景及意义
随着城市化进程加速和居民出行需求多样化,出租车作为城市交通体系的重要组成部分,其运营效率和服务质量直接影响城市交通承载力与居民生活体验。近年来,共享出行模式兴起、交通数据规模激增,传统依赖经验的粗放式管理模式逐渐暴露出资源配置不均、供需匹配滞后、运营成本攀升等问题。尤其在超大城市中,高峰期车辆调度失衡、热门区域服务供给不足、乘客个性化需求难以满足等现象频发,制约了行业可持续发展。与此同时,全球智慧城市建设的推进对交通系统数字化、智能化转型提出更高要求,如何从海量运营数据中挖掘潜在规律、优化决策路径,成为提升行业竞争力的关键突破口。在此背景下,对出租车运营数据进行系统性分析具有重要现实意义:一方面,通过解析乘客出行特征、费用结构、支付偏好等核心指标,可精准识别用户行为模式,为动态定价、车辆调度和路线规划提供科学依据,助力企业降本增效;另一方面,结合时空分布特征挖掘城市交通热点区域和流动规律,能够为政府部门优化交通基础设施布局、缓解道路拥堵、制定低碳出行政策提供数据支撑。此外,深入分析小费文化、拼车习惯等社会行为特征,有助于理解城市居民出行文化变迁,推动服务模式创新与行业生态升级,最终实现城市交通系统高效运转、企业精细化管理、乘客体验提升的多维共赢,对促进城市交通智慧化转型和绿色可持续发展具有深远价值。
在国内外交通数据研究领域,出租车运营数据分析因其高时空精度与丰富的用户行为信息,已成为城市交通管理和智慧出行研究的热点。以下从研究视角、方法创新与应用实践三个维度对相关研究现状进行梳理:
发达国家较早将大数据技术应用于出租车运营分析,研究体系相对成熟。美国学者以纽约、芝加哥等城市为样本,聚焦出行需求预测与交通资源配置优化。例如,通过GPS轨迹挖掘高峰期出行热点,提出动态定价模型以平衡供需矛盾(Zhan et al., 2019);欧洲研究则侧重低碳出行导向,如伦敦学者结合出租车能耗数据构建碳排放评估框架,为城市交通减排政策提供量化依据(Li et al., 2021)。在方法论层面,国外研究注重多源数据融合与复杂模型构建,如结合天气、社交事件等外部变量分析出行模式突变(Wang & Noland, 2022),或利用强化学习算法优化车辆调度路径(Alisoltani et al., 2023)。然而,现有研究多集中于宏观运营效率提升,对支付习惯、小费文化等微观用户行为特征的挖掘相对不足,且较少关注数据驱动的服务模式创新。
国内研究起步较晚但发展迅速,主要依托超大城市海量运营数据展开实证分析。北京、上海等地的学者通过聚类算法识别通勤潮汐现象,揭示职住分离对出租车供需时空错配的影响(张等,2020);深圳团队则构建了基于LBS的热点区域识别模型,辅助政府部门优化出租车停靠点布局(李等,2021)。近年来,研究主题逐步从单一运力分析转向多维度价值挖掘,例如结合订单费用与乘客属性研究出行消费分层特征(王等,2022),或利用词云技术可视化出行目的文本信息(陈等,2023)。尽管取得显著进展,国内研究仍存在三方面局限:一是过度依赖静态数据分析,缺乏对实时交通状态与用户行为的动态交互研究;二是理论框架创新不足,多数成果沿用国外模型进行本土化验证;三是跨区域对比研究与长周期趋势分析较少,制约了普适性规律的提炼。
当前研究呈现两大趋势:一是分析维度从宏观运营效率向微观用户行为延展,二是技术方法从传统统计分析向人工智能驱动转变。然而,国内外研究仍存在共性短板:首先,多数成果侧重车辆调度与路径优化,对支付方式、小费习惯等社会经济属性与出行服务的关联机制探讨不足;其次,现有可视化分析多停留在基础图表层面,缺乏交互式、多维度联动的深度数据探索工具;最后,跨学科融合程度有限,较少将出行数据与城市治理、社会文化等研究领域结合。这些不足为本研究的创新方向提供了突破空间,即通过构建多维度、动态化的分析体系,揭示出租车运营数据中潜藏的社会经济价值与城市管理启示。
本研究聚焦城市出租车运营数据的多维度解析与可视化呈现,旨在通过构建系统性分析框架,揭示乘客行为特征、费用分布规律及城市交通动态,为行业精细化管理和城市交通优化提供决策依据。研究内容涵盖四大核心维度:一是乘客出行行为分析,包括小费支付与行程距离的关联性、支付方式偏好及乘客人数分布特征,挖掘消费习惯对服务选择的影响机制;二是费用结构研究,通过总费用区间分布与每日订单金额波动分析,解析出行成本的时间演化规律及消费分层现象;三是时空特征挖掘,利用上下车区域词云与热力图识别城市交通热点区域,揭示职住通勤、商业活动等城市功能分区对出行需求的驱动作用;四是车辆属性与运营效率关联分析,探究出租车颜色占比、车辆调度频次等指标与服务质量、运营收益的内在联系。研究注重微观行为与宏观趋势的交叉验证,通过多维度数据关联分析,阐释社会经济属性(如支付方式)、文化因素(如小费习惯)与城市空间结构如何共同塑造出租车出行生态。研究成果将形成动态可视化的分析体系,既为出租车企业优化定价策略、车辆调度和资源配置提供数据支撑,也为政府部门识别交通瓶颈、规划基础设施和制定低碳出行政策提供科学参考,同时通过揭示出行行为背后的社会文化特征,推动交通服务向人性化、智能化方向升级。
由Armin Ronacher通过Python语言编写的轻量级Web应用开发框架Flask,可以通过简洁的结构和灵活的机制,快速的构建中小型Web应用程序,Flask虽然是一个微框架,但这并不意味着它不能够预设特定的开发模式,而是能够提供路由管理、请求响应处理、模板渲染等构建Web最基本的功能,开发者可以根据需求引入数据库、表单验证、用户认证等第三方扩展[6]。
随着Web应用的发展,传统的前端开发存在开发效率低、样式不统一、兼容性差的问题,不能满足系统界面的交互性、美观性与响应性要求,Bootstrap作为前端开发框架,可以解决上述问题。
数据库可以在现代Web系统中进行数据的存储与管理,本系统选用MySQL数据库,存储查询与维护用户数据等信息。
从技术可行性上来看,本系统所采用的技术均是成熟的开源工具与框架,后端采用Python语言配合Flask框架,实现了数据接口的编写、模型调度与数据库交互等功能;前端使用Bootstrap框架构建响应式的页面;数据库层选用MySQL系统进行数据存储与管理。本系统的技术可行性较高。
在经济可行性方面,本系统的整体开发与部署过程中没有涉及到其余的高额成本的花费,开发系统使用的全部开发语言和技术组件都是开源或者免费的软件,不用支付授权费用。本系统运行所需要的硬件环境也没有很高的要求,仅仅需要使用普通的计算机设备就可以完成系统的开发、测试与演示,系统所需要数据处理过程也可以通过本地计算资源完成,而且本系统面向毕业设计开发,开发周期可控,不需要额外的人力投入,在经济上具备可行性。
从政策可行性上,本系统所涉及到的开发和数据采集的过程,都严格的遵守国家有关网络数据安全、信息采集与使用的相关法律法规,系统所采集的数据均是平台对外公开展示的信息,不涉及到平台用户的敏感隐私内容,且数据使用只进行学术研究与教学展示范围,不涉及到商业用途,本文在政策层面有着较高的可行性。
出租车数据分析与可视化系统由一个平台实现,本节将对系统的功能性需求分析进行描述。
- 用户注册与登录功能
注册与登录是用户进入系统的入口,用户通过该页面通过输入账号密码信息后进行注册账号并登录系统后,就可以访问系统中的主要数据和分析内容。在用户进行注册登录的过程中,系统自动完成对代表用户身份的账号密码信息的验证,确保当前用户的操作是合法的,以及保障系统中所有数据的安全。
- 数据展示功能
该功能将数据库信息在前端页面会通过数据表格的方式展示数据的详情信息,用户可以在前端页面进行分页浏览并通过关键词进行检索。
- 数据可视化分析功能
该功能将数据信息通过可视化图表的方式展示在前端页面,主要包括:
- 小费与乘车距离分布散点图
- 支付方式占比饼图
- 总费用区间分布图、
- 乘客人数分布图等、
- 出租车颜色占比、每日订单金额分析、上下车地区词云
- 首页数据概览功能
该功能汇总并展示系统中的数据总量、上车最多的地点、付款最高金额、下单时间段分布统计等指标信息,帮助用户了解当前数据的整体状况。
本系统的用户用例图主要展示了系统的参与者与其所能执行的功能之间的关系,根据系统设计,本系统的主要参与者只有普通用户的角色。

图2.1出租车数据分析与可视化系统用例图
下面主要是对系统中注册、登录、数据可视化图表展示、首页信息查看、数据表格查看进行用例说明。
表3.1注册
说明项 |
说明 |
用例名称 |
用户注册 |
用例描述 |
用户通过输入用户名、密码等必要信息进行账号注册,完成后可用于登录系统使用功能。 |
参与者 |
用户 |
前置条件 |
用户已访问系统前端注册页面 |
基本操作流程 |
|
异常事件 |
|
后置条件 |
用户信息写入数据库,注册成功,跳转至登录页面 |
表3.2登录
说明项 |
说明 |
用例名称 |
用户登录 |
用例描述 |
用户通过账号密码登录系统,验证身份后访问各功能模块 |
参与者 |
用户 |
前置条件 |
用户已完成注册 |
基本操作流程 |
|
异常事件 |
|
后置条件 |
用户登录成功,系统记录其登录状态,可访问其他功能页面 |
表3.3数据可视化图表展示
说明项 |
说明 |
用例名称 |
可视化图表展示 |
用例描述 |
系统将分析后的数据以图表形式在前端展示,提升用户理解效率 |
参与者 |
用户 |
前置条件 |
数据库中已有分析结果数据 |
基本操作流程 |
|
异常事件 |
|
后置条件 |
图表正常加载并支持交互式浏览 |
表3.4首页信息查看
说明项 |
说明 |
用例名称 |
首页信息查看 |
用例描述 |
用户登录系统后进入首页,可以查看系统已采集数据的汇总信息,包括数据总量、上车最多的地点、付款最高金额、下单时间段分布统计等指标信息。 |
参与者 |
用户 |
前置条件 |
用户已成功登录系统,数据库中已有分析结果数据 |
续表3.7首页信息查看
说明项 |
说明 |
基本操作流程 |
|
异常事件 |
|
后置条件 |
用户可查看系统总体运行情况与数据概况 |
表3.8数据表格查看
说明项 |
说明 |
用例名称 |
数据表格查看 |
用例描述 |
用户在系统中查看以表格形式展示的微博评论数据,内容包括订单时间、金额、上下车地点等,并支持分页与筛选 |
参与者 |
用户 |
前置条件 |
用户已登录系统,数据库中已有爬取并分析的数据 |
基本操作流程 |
|
异常事件 |
|
后置条件 |
用户可查看、筛选、分析已有微博数据 |
除了系统的基本功能模块外,还需要明确性能需求、安全性需求、可用性需求、可扩展性需求和可维护性需求等一系列非功能需求。
- 性能需求
由于本系统需要处理和分析数据,要求后端能够高效地读取和写入数据库,前端页面加载响应时间控制在合理范围内。系统在进行分析等运算密集型任务时,需通过异步处理机制避免阻塞用户操作,确保整体响应流畅。
- 安全性需求
系统需要对用户账户信息进行安全的存储,同时,对系统访问权限进行分级控制,对于爬虫操作和数据调用过程,系统应具备基本的防注入、防恶意请求能力,防止信息泄露与非法攻击,数据接口应通过token或session机制进行用户身份验证。
- 可用性需求
系统应保持良好的用户界面设计,操作逻辑清晰、交互简洁,兼容Chrome、Edge等主流浏览器,适配主流屏幕分辨率。即便在部分功能失败或异常时,系统应通过提示信息指导用户继续使用其他功能,避免系统整体崩溃,提高容错性。
- 可扩展性需求
系统结构设计应采用模块化、松耦合的开发方式,使得在后期维护过程中便于添加新的分析模型、支持其他社交平台数据接入。数据库结构需预留扩展字段,满足未来数据字段增加的需求;前端可视化模块需保留插件接口,方便日后添加新的展示图表。
- 可维护性需求
强调系统应具备良好的代码结构与注释规范,便于开发人员后期进行功能修复或优化升级。系统日志模块应完整记录关键操作、异常事件及系统状态,方便管理员对系统运行状况进行追踪和问题排查。同时,系统应提供版本更新说明文档,便于团队维护与协作。
- 系统设计
- 系统总体设计
本系统功能模块设计围绕出租车运营数据分析的核心需求,划分为3大功能域,具体架构如下:
1. 数据管理模块:负责清洗与存储,支持订单时间、位置、费用、支付方式等字段的结构化存储,并提供数据更新、异常值过滤及历史数据回溯功能,为上层分析提供高质量数据池。
2. 核心分析模块:
支付行为分析:统计信用卡、现金等支付方式占比,计算小费支付率与行程距离的相关系数;
费用分布分析:通过聚类算法划分总费用区间,统计各区间订单量,追踪每日订单金额波动趋势;
乘客行为分析:统计单人、多人乘车频次,分析拼车行为的时间分布特征;
车辆属性分析:统计出租车颜色占比,关联车辆颜色与运营区域、时段的关系;
时空特征分析:基于上下车坐标生成热力区域,结合文本挖掘技术提取高频地点生成词云。
3. 可视化交互模块:集成ECharts图表与词云组件,支持散点图、饼图、折线图等多视图联动展示,提供时间轴拖动、区域框选等交互控件,实现动态数据钻取与多维度对比。各模块的具体功能如图4.1中所示。

用户管理模块实现了注册和登录的基本功能,系统在登录的时候采用基于Session的身份认证,在用户注册时对用户的信息进行校验并进行存储,在用户登录时通过数据库中已有的数据比对并创建用户会话,注册登录流程图如图4.2所示。

系统利用ECharts库设计了多个可视化界面,可以展示小费与乘车距离分布分析、支付方式占比、总费用区间分布、乘客人数分布、出租车颜色占比、每日订单金额分析、上下车地区词云,首页展示数据总条数、订单下单时间数量分布等核心指标的统计情况展示,可视化流程图如图4.6所示。
用户实体是记录系统中所有用户的注册信息,包括用户名、密码、学号、专业等字段,如下图图4.8所示。

出租车数据实体是记录的系统从出租车订单数据信息,包括下单时间、金额、上下车地点等,如下图4.5所示。

本系统使用MySQL进行数据的存储,通过MySQL保存并管理用户的注册信息、出租车订单数据,设计的表包括用户信息表、出租车订单表。
字段名 |
类型 |
长度 |
描述 |
id |
INT |
用户唯一标识 | |
username |
varchar |
50 |
用户名,唯一不可重复 |
password |
varchar |
100 |
密码 |
create_timE |
DATETIME |
注册时间 | |
Student ID |
varchar |
128 |
学号 |
major |
varchar |
128 |
专业 |
- 出租车数据表
字段名 |
类型 |
长度 |
描述 |
上车时间 |
varchar |
255 |
上车时间 |
下车时间 |
varchar |
255 |
下车时间 |
乘客人数 |
int |
0 |
乘客人数 |
乘车距离 |
float |
255 |
乘车距离 |
费用 |
float |
255 |
费用 |
小费 |
float |
255 |
小费 |
过路费 |
float |
255 |
过路费 |
总费用 |
float |
255 |
总费用 |
出租车颜色 |
varchar |
255 |
出租车颜色 |
支付方式 |
varchar |
255 |
支付方式 |
pickup_zone |
varchar |
255 |
上车地点 |
dropoff_zone |
varchar |
255 |
下车地点 |
- 系统实现
本系统的首页页面采用了蓝白色的整体风格,首页分为上下两部分,上半部分是数据统计结果,下半部分是情感评分区间数量图,用户可以在首页完整的看到系统整体的数据统计情况。
- 首页数据统计图
订单数量分布图如下所示,该图通过折线图的方式把微博评论在不同时间区间内的统计分布情况给展示了出来,在折线图中,X轴为时间区间,Y轴是该区间内的数量,通过该图可以看出在,大多数的订单集中在17-22事的区间内。
- 首页订单数量分布
- 注册登录实现
本系统设计了注册与登录两个基础的认证页面来实现用户对系统功能的访问和数权限的控制,该模块是通过Flask后端框架与Bootstrap前端组件协作实现的。
- 注册页面
登录页面的设计风格与注册页面的设计风格保持一致。
- 登录页面
- 数据概览
数据的数据表格部分如下所示,用户登录到系统后,可以在数据表格导航下查看到系统中所有的数据,这些数据通过列表的形式展示在前端页面,包括订单时间、位置、费用、支付方式等字段信息,用户可以通过输入关键字来查找相关的数据,并且可以通过下一页的按钮对数据进行分页查看。
- 数据预览页面
- 数据可视化分析实现
通过get_chart2()函数实现,该功能使用散点图展示小费金额与乘车距离的分布关系。
在get_chart3()模块中,采用环形饼图可视化支付方式的市场份额。
get_chart4()函数运用漏斗图分析订单金额分布特征。通
通过get_chart5()函数构建柱状图展示拼车行为特征。
在get_chart6()模块中,使用双层饼图呈现车辆颜色分布。
get_chart7()函数通过折线图追踪每日营收波动。
get_wordcloud()函数融合文本挖掘与可视化技术。
- 地区词云
本系统采用黑盒测试的方法,验证系统中各个模块的功能是否是按照设定的需求正常进行运行。
-
- 测试用例的设计
(1)用户注册与登录模块
表6.1用户注册登录测试用例表
测试名称 |
测试流程 |
期望结果 |
测试结果 |
结果 |
正常注册测试 |
正确填写所有注册信息并点击提交按钮 |
显示“注册成功”,跳转登录页面 |
与期望结果相同 |
通过 |
重复用户注册测试 |
注册时使用已存在的用户名或学号 |
显示“用户已存在”提示 |
与期望结果相同 |
通过 |
密码不一致测试 |
密码和确认密码不一致 |
提示“密码不一致” |
与期望结果相同 |
通过 |
正常登录测试 |
输入正确的用户名和密码点击登录 |
登录成功,跳转至系统首页 |
与期望结果相同 |
通过 |
错误登录测试 |
输入错误的用户名或密码 |
显示“用户名或密码错误”提示 |
与期望结果相同 |
通过 |
空字段校验测试 |
留空任一字段点击注册或登录 |
提示“请填写完整信息” |
与期望结果相同 |
通过 |
(2)数据可视化模块
表6.2数据可视化测试用例表
测试名称 |
测试流程 |
期望结果 |
测试结果 |
结果 |
小费与乘车距离分布分析图正常显示测试 |
数据加载成功后访问小费与乘车距离分布分析页面 |
散点图正常显示,数据有变化 |
与期望结果相同 |
通过 |
交互测试 |
鼠标悬浮、缩放或拖动散点图 |
可响应悬浮事件显示详细数据,缩放拖动无卡顿 |
与期望结果相同 |
通过 |
小费与乘车距离分布分析据点一致性测试 |
随机选取几个点反查比对数据 |
散点图信息基本一致 |
与期望结果相同 |
通过 |