6、AI 中的数据与算法:从采集到应用

AI 中的数据与算法:从采集到应用

1. 数据采集的现状与局限

如今,数据采集似乎成了一种普遍现象,各类组织都在不加思索地收集、分类和存储人们的数据。据“Data Never Sleeps”报告显示,全球每天收集的数据量高达 2.5 千兆字节,这些数据以各种形式呈现:
- Google 每天进行 3,607,080 次搜索。
- Twitter 用户每天发送 456,000 条推文。
- YouTube 用户每天观看 4,146,600 个视频。
- 收件箱每天接收 103,447,529 封垃圾邮件。
- 天气频道每天接收 18,055,555.56 次天气请求。
- GIPHY 每天提供 694,444 个 GIF 动图。

然而,数据采集本身并不能带来实际价值。就像在《银河系漫游指南》中,超级生物建造巨型计算机计算“生命、宇宙以及一切的意义”,得到的答案 42 却无法解决实际问题。这表明,数据采集可以是无限量的,但确定正确的问题却极具挑战性。

对于组织而言,数据采集的关键在于明确要问的问题以及这些问题的重要性。例如,经营一家商店时,可能需要回答以下问题:
- 每天有多少人从店前走过?
- 这些人中,有多少人会停下来看橱窗?
- 他们看橱窗的时间有多长?
- 他们在一天中的什么时间看橱窗?
- 某些陈列是否会产生更好的效果?
- 哪些陈列实际上会吸引人们进店购物?

创建针对特定业务需求的问题列表至关重要,之后还需验证每个问题的重要性,并确定回答这些问题所需的信息。

2. 数据采集自动化的问题

手动

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值