大数据
文章平均质量分 89
数字化刘老师
AI算法咨询师,数字化转型专家,著有《AIGC新纪元》
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
如何区分“数据”、“信息”、“知识”,和“智能”?
智能的具体表现形式是数据模型,这些数据模型具有分类或预测的能力,可以基于已知信息推断得到有利于业务决策的未知信息,甚至基于算法的推断结果还可以自动产生相应可靠的行为活动。从数据中直接提取的信息很多时候往往是离散的、碎片化的,而知识则具有比较严格的内容组织形式,在信息节点之间,具有比较明显的和统一的关联关系。来看,数据可以分为:事务数据、文件和内容、主数据、参考数据,以及元数据等,其中,元数据又进一步分为业务元数据、技术元数据、操作元数据。数据是客观世界上直接可得可见的数字化内容,是信息的直观物理表现形式。原创 2023-09-20 15:47:14 · 536 阅读 · 1 评论 -
“概念模型”、“逻辑模型”,和“物理模型”之间的区别
数据模型分为三个层级,抽象程度上由高到低依次是概念数据模型(Concept Data Model,CDM)、逻辑数据模型(Logical Data Model,LDM),和物理数据模型(Physical Data Model,PDM)。低抽象程度的数据模型是在高抽象程度的数据模型基础之上的具体内容细化 ...原创 2023-09-20 11:20:31 · 905 阅读 · 1 评论 -
大数据の协同过滤——发现新的兴趣点
智能推荐算法是电子商务领域中非常关键的大数据应用技术。B2C平台上的智能引擎可以根据记录的用户信息,对用户感兴趣的商品进行推荐,从而促成更高的成交额。实现智能推荐需要对用户的行为规律、兴趣爱好、购物能力等诸多方面的信息具有充分的了解,因此,成熟的B2C网站都会客户的相关信息进行详细的存储统计。当对用户进行产品推荐时,智能引擎所采用的推荐策略大致可以分为两类:基于内容的推荐策略和协同过滤推荐原创 2015-06-26 15:43:04 · 1458 阅读 · 0 评论 -
判别式模型与产生式模型解析(Discriminative Model vs. Generative Model)
学习Machine Learning的朋友们一定会接触到两个概念,判别式模型(DiscriminativeModel)和产生式模型(Generative Model)。很多技术贴都尝试对二者进行详细的解释,但是往往由于初学者的积累不够,不能迅速理解其中的内涵,于是本文不吝笔墨对其再进行梳理一翻,希望对初学Machine Learning的学者提供一些理论性的支持。原创 2015-07-12 11:59:15 · 2036 阅读 · 0 评论 -
原来很容易! 清晰解读MapReduce
大数据时代的数据分析任务比传统的数据分析任务要复杂,因为往往涉及的数据量巨大,比如要分析汇总某个大型零售商在全国的销售数据,查看某个搜索引擎的特定词条的访问日志… … 通常来讲,我们的笔记本电脑可以同时干很多事儿,比如听音乐,编辑Word文档,下载电影,这些都可以同时进行,为什么呢?因为这些程序任务所处理的数据量规模小。而对于大规模的数据处理任务来说,就不是一台电脑同时做许多任务了,...原创 2015-07-06 12:25:19 · 760 阅读 · 0 评论 -
浅谈LDA主题模型(一)
文本挖掘是大数据应用的十分关键的技术之一,对网络上海量的User generatedContent进行商业分析大多离不开对于文本的处理。对文本进行分析分为有监督的方法和无监督的方法。这里涉及了两个概念,“有监督”和“无监督”或许让对数据挖掘没有太深入基础的朋友们有点恍惚,说简单了,有监督方法就是用户预先给出一些学习的实例,对文本内容进行标注,然后计算机程序通过分析”人”对于文本的...原创 2015-07-06 12:36:33 · 2551 阅读 · 1 评论
分享