- 博客(24)
- 收藏
- 关注
转载 2020-09-28
windows10下用pip安装fastText和cysignals报错系统找不到指定的文件背景在运行知识图谱相关demo时,需要安装fastText,安装fastText又要安装cysignals,但安装时报错系统找不到文件,具体如下: ERROR: Command errored out with exit status 1: command: 'd:\develop\python\python36\python.exe' -c 'import sys, setuptool
2020-09-28 15:30:33
354
转载 MATLAB-R2015b-win64安装详细教程
https://wenku.baidu.com/view/5a902e76856a561253d36f53.html?from=search
2016-12-22 16:52:31
2177
转载 DBN爬坑记之RBM
想要了解DBN想让我们来搞一搞RBM吧 RBM中文名字叫受限制的玻尔兹曼机,英文全称Restricted Boltzmann Machine. 其实在这个兄弟出来之前,有个叫Boltzmann Machine的东东。也即是玻尔兹曼机的意思,这是一种基于热力学统计方法。已经在多个领域里应用起来,以前做过煤方法的工作,也接触过BM这东东,那个时候还是用了研究流体。命名玻尔兹曼可能
2015-10-27 20:52:54
1046
转载 PSO优化BP神经网络在Matlab中的实现
粒子群优化算法(Particle Swarm Optimization, PSO)是在1995年由美国社会心理学家James Kennedy和电气工程师Russell Eberhart共同提出的,其基本思想是受他们早期对鸟类群体行为研究结果的启发,并利用了生物学家Frank Heppner的生物群体模型。PSO算法与遗传算法类似,是一种基于迭代的优化算法,但无交叉变异等操作,其搜索过程是通过粒
2015-05-05 20:07:44
41304
8
转载 遗传算法优化的BP神经网络建模
遗传算法优化的BP神经网络建模。目标: 对y=x1^2+x2^2非线性系统进行建模,用1500组数据对网络进行构建网络,500组数据测试网络。由于BP神经网络初始神经元之间的权值和阈值一般随机选择,因此容易陷入局部最小值。本方法使用遗传算法优化初始神经元之间的权值和阈值,并对比使用遗传算法前后的效果。步骤:未经遗传算法优化的BP神经网络建模1、 随机生成2000组两维随机数
2015-05-05 20:06:13
16648
3
转载 机器学习新方向 Submodularity machine learning
原址:http://submodularity.org/OverviewThis page collects some material and references related to submodular optimization, with applications in particular in machine learning and AI. Convex o
2015-05-04 15:37:57
1243
转载 十分钟了解分布式计算:GraphLab
GraphLab是一个面向大规模机器学习/图计算的分布式内存计算框架,由CMU在2009年开始的一个C++项目,这里的内容是基于论文Low, Yucheng, et al. "Distributed GraphLab: A Framework for Machine Learning in the Cloud" Proceedings of the VLDB Endowment 5.8 (
2014-10-29 11:06:21
835
转载 十分钟了解分布式计算:Spark
Spark是一个通用的分布式内存计算框架,本文主要研讨Spark的核心数据结构RDD的设计思路,及其在内存上的容错。内容基于论文Zaharia, Matei, et al. "Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing" Proceedings of
2014-10-29 11:05:49
629
转载 十分钟了解分布式计算:GraphX
GraphX原型论文GraphX是Spark中用于图(e.g., Web-Graphs and Social Networks)和图并行计算(e.g., PageRank and Collaborative Filtering)的API,可以认为是GraphLab(C++)和Pregel(C++)在Spark(Scala)上的重写及优化,跟其他分布式图计算框架相比,GraphX最大的贡
2014-10-29 11:03:54
1532
转载 快刀初试:Spark GraphX在淘宝的实践
摘要:由于Spark GraphX性能良好,又有丰富的功能和运算符,能在海量数据上自如运行复杂的图算法,淘宝尝试将它作为分布式图计算平台,进行各种算法尝试和生产应用。本文结合GraphX的原理和特点,分享其在淘宝的应用实践。早在0.5版本,Spark就带了一个小型的Bagel模块,提供了类似Pregel的功能。当然,这个版本还非常原始,性能和功能都比较弱,属于实验型产品。到0.8版本时,鉴于业
2014-10-29 10:22:30
2239
转载 大数据、小模式、深影响
大数据、小模式、深影响2014-08-11 09:18 Luciano Floridi 凤凰财经 字号:T |TLuciano Floridi,我今天想跟大家分享的是大数据以及大数据所延伸出来的商业价值。AD:2014WOT全球软件技术峰会北京站 课程视频发布11月21日-22日 与WOT技术大会相约深圳 现在抢票可能有些人会问这样的问题,我所代表的
2014-09-12 14:35:30
490
转载 七大最具影响力的大数据应用案例
七大最具影响力的大数据应用案例2014-08-13 09:17 佚名 36大数据 字号:T |T在当前的互联网领域,大数据的应用已经十分广泛,尤其以企业为主,企业成为大数据应用的主体。大数据真能改变企业的运作方式吗?答案毋庸置疑是肯定的。随着企业开始利用大数据,我们每天都会看到大数据新的奇妙的应用,帮助人们真正从中获益。大数据的应用已广泛深入我们生活的方方面面,涵盖医疗
2014-09-12 14:34:51
2492
转载 移动医疗大数据的几个伪命题:大数据的陷阱
移动医疗大数据的几个伪命题:大数据的陷阱2014-08-08 09:48 Dr.2 雷锋网 字号:T |T在医疗大数据项目中,很多情况下,由于无法验证有效性、敏感性和特异性,所以即使得出了100个结果趋势,却没有几个是有临床参考意义的,就是说即使看起来是那么一回事,又怎么样,能反过来指导临床吗?AD:2014WOT全球软件技术峰会北京站 课程视频发布11
2014-09-12 14:34:05
682
原创 再谈大数据行业里的两大误区
再谈大数据行业里的两大误区2014-08-14 10:02 数控小V 36大数据 字号:T |T之前发了一篇文章《如何落地才是硬道理 大数据行业里的两大误区》,很多朋友评价还不错,受此激励,结合最近目睹、经历的项目,想多写一些。经过笔者总结,发现大数据的误区还真是不少,尤其是国内,很多人以讹传讹,造成了很多基本概念的偏差。接上一篇文章,再来谈谈大数据中的一部分误区,供大
2014-09-12 14:33:38
490
转载 快数据:大数据发展的下一个起点
快数据:大数据发展的下一个起点2014-08-15 10:34 核子可乐译 51CTO 字号:T |T开源工具正帮助企业大量处理数据流,而为了引入复杂查询与事务型处理能力,VoltDB公司的John Hugg建议采用内存内NewSQL数据存储模式。AD:2014WOT全球软件技术峰会北京站 课程视频发布11月21日-22日 与WOT技术大会相约深圳 现在
2014-09-12 14:32:15
804
转载 大数据项目:购买还是自开发?
大数据项目:购买还是自开发?2014-08-15 09:09 风格 TechTarget中国 字号:T |T对于大数据相关的技术,CIO应该从外部引入还是在公司内部自行开发?这个问题没有简单明了的答案。但是,有一个原则是必须遵循的,即从增强公司竞争力的角度来进行选择。在之前的文章里,专家们认为,在做出大数据技术买入抑或自建的决策前,CIO们要比以往任何时候都更加重视对业
2014-09-12 14:30:54
613
转载 大数据Hadoop技术在银行的七个应用实例
大数据Hadoop技术在银行的七个应用实例2014-08-25 10:24 佚名 36大数据 字号:T |T如今,Hadoop几乎存在于各个方面,其通过利用大数据来分析信息和增加竞争力。许多金融机构和公司已经开始使用Hadoop成功地解决问题,即便他们本没有计划这样做。因为如果他们不这样做,就会面临市场份额损失的巨大风险。以下是一些特别有趣和重要的大数据和Hadoop用
2014-09-12 14:30:11
4608
转载 5个大数据实践项目
5个大数据实践项目2014-08-20 09:40 佚名 36大数据 字号:T |T由于大多数被过度炒作的技术趋势已经褪去了他们最初的光环,而且这种退潮的速度很快,因而一些怀疑论者对于大数据技术也持有一种保守的看法。然而,大数据目前已被看成是能够改变世界的最新技术趋势,且实际上,那些怀疑论者对于大数据的质疑程度远远低于对云计算和社交的质疑。AD:2014WOT全球软
2014-09-12 14:29:10
4351
转载 Hadoop的梦想与现实
Hadoop的梦想与现实2014-08-27 09:51 佚名 36大数据 字号:T |T可以说,Hadoop的出现是计算技术发展进程中一个重要的里程碑,它使实用的大规模分布式计算和存储成为可能。因此,有专家评论,Hadoop是到目前为止最为成功的通用分布式处理框架,也是这些年来影响最为深远的系统性开源项目之一。AD:2014WOT全球软件技术峰会北京站 课程视频发
2014-09-12 14:28:50
1329
转载 大数据基础知识:分布式计算、服务器集群
大数据基础知识:分布式计算、服务器集群2014-04-16 09:12 雪姬 虎嗅 我要评论(0) 字号:T | T大数据,官方定义是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity
2014-09-12 14:24:36
1043
转载 Hadoop分布式计算——克服大数据挑战的曙光
Hadoop分布式计算——克服大数据挑战的曙光2012-05-30近来大数据的议题窜起,而分布式计算是大数据的关键技术。当分布式计算发展出巨量数据平台,对企业而言可以不再依赖价格高昂的大型专属设备,而可以透过自建大量服务器群集来解决。大数据大概是继云端运算之后,最热门的科技名词了。一些科技大厂不约而同,纷纷打出大数据口号,情况就像当年的云端运算热潮一样。这到底是怎么回事?大数据
2014-09-12 14:23:29
822
转载 Hadoop是什么?及其创始故事
Hadoop是什么?及其创始故事2012-05-30Hadoop是什么?Hadoop是基于Google搜索引擎的分布式计算技术,Google的哲学是蚂蚁雄兵精神,利用大量平价的服务器,搭配平行运算架构,以最符合经济效益的方式创造庞大的运算量。当Hadoop以此技术发展出巨量资料平台,对企业而言无疑是一道克服巨量数据挑战的曙光,因为企业可以不再依赖价格高昂的大型专属设备,而可以透
2014-09-12 14:19:58
871
转载 分布式计算平台Hadoop 发展现状
解读:分布式计算平台Hadoop 发展现状2012年05月04日01:23IT168字号:T|T 【IT168 技术】雅虎开发者Doug Cutting六年前创建了一个用于管理,存储和分析大量数据的分布式计算平台hadoop,现在大家也称云计算平台,用他儿子的玩具大象命名,并把它交给阿帕奇软件基金会。鉴于围绕Hadoop建立的整个行业的迅速,这会使某些人觉得非常惊讶,那就
2014-09-12 14:17:04
1235
转载 左路Deep Learning+右路Knowledge Graph,谷歌引爆大数据
左路Deep Learning+右路Knowledge Graph,谷歌引爆大数据发表于2013-01-18 11:35|9248次阅读| 来源sina微博|15 条评论| 作者邓侃数据分析智能算法机器学习大数据Google摘要:文章来自邓侃的博客。数据革命迫在眉睫。各大公司重兵集结,虎视眈眈。Google 兵分两路,左路以 Jeff Dean 和 Andrew Ng 为首
2014-08-27 16:29:05
420
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人