
数据分析
dabingsun
这个作者很懒,什么都没留下…
展开
-
hadoop、spark、hive概念及关系
来自:这里大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特性,虽然奇怪的组合也能工作,但是未必是最佳选择。大数据,首先你要能存的下大数据传统的文件系统是单机的,不...原创 2020-04-06 09:23:31 · 232 阅读 · 0 评论 -
实体抽取、关系抽取和事件抽取概念
目录关系抽取关系抽取方法事件抽取及方法参考:读书笔记:关系抽取和事件抽取关系抽取定义:自动识别实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取(三个及以上实体)。通过关注两个实体间的语义关系,可以得到(arg1, relation, arg2)三元组,其中arg1和arg2表示两个实体,relation表示实体间的语义关系。(...原创 2020-03-23 09:31:46 · 9983 阅读 · 1 评论