
人工智能
tinyid
Java/Python
Hadoop/Spark/Presto/Kafka/Druid
numpy/matplotlib/pandas/scipy
展开
-
R+Hadoop Rhipe部署
R版本R-2.14.2 Rhipe版本0.66 protobuf版本2.4.1 首先安装R语言软件,需要注意configure时,先设置几个环境变量,编译长shared lib cd R-2.14.2 export CFLAGS=-fPIC export CXXFLAGS=-fPIC ./configure --with-x=no --enable-R-shlib原创 2012-03-12 14:41:49 · 2907 阅读 · 0 评论 -
信息的混杂度——香农熵
熵被定义为信息的期望值。一个人的性别——男、女——可以看成是一个信息;一件衣服的颜色——很多颜色——也是信息。但是这两种信息一个非常简单,只有两个可能的值,而颜色是非常多的。也可以说颜色的信息量要比性别的信息量要大、要更加混杂。而熵就是衡量这种混杂度的数学指标。 那么具体一点,一个符号A的信息被表示为: >>> from math import log >>> probabilityA原创 2013-06-21 11:47:33 · 3166 阅读 · 0 评论 -
语义网组件
结构化数据处理依赖于对某个知识领域(感兴趣的领域、学科)内的概念、术语和关系进行描述的技术。知识表示和推理被用来在AI中以机器可读的形式表示信息的,计算机系统可以利用这些信息完成复杂的任务。分类学和受控词表是术语的结构化集合,可以将它们作为元数据元素值来使用。比如,一个事件词汇可以被用来以机器可读的形式来表述音乐会、演讲和节日,而一个组织词汇适用于产出关于一个学校、一个公司或一个俱乐部的机器可读的...翻译 2018-10-08 14:16:53 · 446 阅读 · 0 评论