看了《从数据角度解析福州美食》后难免心痒,动了要分析合肥餐饮业的念头,因此特地写了Node.js爬虫爬取了合肥的大众点评数据。分析数据库我并没有采用MySQL而是用的MongoDB,是因为爬取的数据存在字段缺失的情况(schema不一致)。
1. 数据准备
MongoDB简介
不同于MySQL,MongoDB是一种Schema-less的NoSQL数据库;与ElasticSearch类似,最小存储单元Document为BSON object。MySQL与MongoDB的基本概念对比:
| MySQL | MongoDB |
|---|---|
| DB | DB |
| Table | Collection< |
本文使用MongoDB对合肥餐饮业进行分析,通过Node.js爬虫获取大众点评数据,探讨商家、商圈特点。发现火锅类餐馆受欢迎,价格与口味不成正比,本土品牌在连锁店中有优势,三里庵商家数量多但平均口味评分不高。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



