深入浅出数据科学
文章平均质量分 95
Principles of Data Science,Sinan Ozdemir 的读书笔记。
一只可爱狗勾
双非一本咸鱼一条
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第3章 数据科学的5个步骤
数据科学严格遵循结构化、一步一步的操作过程,保证了分析结果的可靠性。原创 2023-04-14 09:28:11 · 1732 阅读 · 0 评论 -
第2章 数据的类型
很多人认为平均值也可以作为测度中心,这是不正确的,因为两个变量相减或相加得到的值无任何意义,比如4分减去2分,差异的2分没有任何意义,所以数学运算得出的平均值也没有任何意义。温度是最常见的定距尺度数据。所以,我们可以增加一个叫“相对长度”的新特征,用来表示这条推文的长度相对平均推文长度的倍数。比如,对于世界卫生组织的酒精消费量数据,出现次数最多的洲是Africa,因此Africa可以作为continent列的测度中心。比如,体重可以是68千克,也可以是89.66千克,注意小数点,所以体重是连续型数据。原创 2023-04-14 09:27:40 · 1270 阅读 · 0 评论 -
第1章 如何听起来像数据科学家
案例:分析一条推文在本例中,我们将分析一些含有股票价格信息的推文。下面解释一下上面的代码片段:(1)用变量tweet存储推文信息(Python中的string类型):RT @robdv: $TWTR now top holding for Andor,unseating $AAPL(3)用for循环对切分开的列表进行迭代,逐个查看列表中的内容(4)用if语句判断推文中的每一个词是否包含$符号(人们在推文中使用$表示股票行情)(5)如果推文中包含$符号,则输出该词。原创 2023-04-14 09:26:53 · 514 阅读 · 0 评论
分享