2、数据科学入门：术语、领域与Python基础

最新推荐文章于 2025-10-08 10:56:48 发布

网恋被骗八块八

最新推荐文章于 2025-10-08 10:56:48 发布

阅读量29

点赞数

CC 4.0 BY-SA版权

分类专栏：数据科学的艺术与实践文章标签：数据科学术语结构化数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ipfs8storage/article/details/151093106

数据科学的艺术与实践专栏收录该内容

26 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据科学入门：术语、领域与Python基础

1. 数据科学简介

在当今的数据时代，无论你身处IT、时尚、食品还是金融等行业，数据都无疑影响着你的生活和工作。新闻媒体也越来越多地报道数据泄露、网络犯罪以及现代人工智能和机器学习算法如何改变我们的工作和生活方式。

数据科学，简单来说，是通过数据获取知识的过程。它涵盖的内容极为广泛，包括如何处理数据、收集见解，并利用这些见解做出明智的决策和预测。

1.1 基本术语

数据：指以结构化或非结构化格式存在的信息集合。
- 结构化数据 ：按行/列结构排列的数据，每行代表一个观测值，列代表该观测值的特征。例如，在线购物历史记录，每笔交易的产品、价格、日期和时间以及支付方式等信息按行和列排列，能清晰呈现购物习惯、偏好和模式。
- 非结构化数据 ：自由形式的数据，通常是文本、原始音频或信号，需要进一步解析才能转化为结构化数据。如社交媒体或电商网站上的评论和评价，包含文本、图像甚至视频，难以组织和分析，但处理后可提供如情感分析等有价值的见解。

1.2 数据科学的作用

数据科学并非要取代人类大脑，而是对其进行增强和补充。在数据时代，我们拥有海量数据，但由于数据量巨大、格式多样且可能存在缺失、不完整或错误等问题，传统分析方法难以应对。数据科学通过清理和分析数据，揭示隐藏在其中的关系和知识。

例如，在医疗领域，数据科学技术可预测哪些患者可能不按时就诊，

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。