预测网络流量
1. 数据概述
我们将使用回归分析来预测2011年互联网上排名前1000的网站的页面浏览量。数据集中的部分列如下:
- Rank :网站在排名前1000的列表中的位置。这是一个序数,仅用于表示顺序,不代表实际数值。例如,Facebook在数据集中排名第一,YouTube排名第二。
- PageViews :我们要预测的输出,代表该网站在当年被访问的次数,是衡量网站受欢迎程度的一个指标。
- UniqueVisitors :在统计期间,访问该网站的不同人数。若认为页面浏览量容易因用户不必要的刷新而虚高,这个指标能更好地衡量网站的实际访问人数。
- HasAdvertising :表示网站是否有广告。可以通过回归分析来明确广告对用户访问的影响。
- IsEnglish :表示网站是否主要使用英语。研究该因素有助于了解语言对网站受欢迎程度的影响。
以下是数据集的前五行:
| Rank | Site | Category | UniqueVisitors | Reach | PageViews | HasAdvertising | InEnglish | TLD |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| 1 | facebook.com | Social Networks | 880000000 | 47.2 | 9.1e+11 |
超级会员免费看
订阅专栏 解锁全文
1490

被折叠的 条评论
为什么被折叠?



