2020-10-27

大数据理解

大数据. 一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据的本质就是一大堆结构化的和非结构化的数据。因为数据量太大,你没办法使用,你需要从中抓取出有价值的内容或你想要的数据,这就是大数据应用。
大数据有五大特点,即量(Volume)、速度(Velocity)、多样(Variety)、价值(Value)、***真实性(Veracity)***。

以下内容为初学者理解

比如:

  1. 当下特别火的快手、抖音等短视频软件会根据你的喜好来推荐你喜欢的视频
  2. 浏览器、淘宝、京东等软件会根据你的需求进行筛选提供你的需要
  3. 对天气分析进行预报 根据交通情况制作合适路线等等

在这里插入图片描述

自我认知:
处理 有点像统计学只不过多了使用计算机等方面的知识
获取 类似于网络爬虫 利用网络爬虫获取网站的信息对网络数据的抓取和处理(可以利用Python制作网络爬虫 Python简洁方便)以此进行数据整理

推荐网址:https://blog.youkuaiyun.com/kailzhu/article/details/106895450

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值