问题描述 在做Github爬取数据的时候,从别人处拿到一份9种语言stars数量排名前一千的数据。验证数据的时候发现c与c++语言的项目重复了900个左右。 思考 首先考虑是否github认为c与c++语言就是相通的?经过验证发现不是 答案 原来是通过api爬取数据的时候,lang:c++不能这样写,要写成c%2B%2B