
技术层-scala
文章平均质量分 77
小丁丁_ddxdd
这个作者很懒,什么都没留下…
展开
-
scala--Scala 强大的集合数据操作示例
来源:http://blog.youkuaiyun.com/pzw_0612/article/details/45936165Scala是数据挖掘算法领域最有力的编程语言之一,语言本身是面向函数,这也符合了数据挖掘算法的常用场景:在原始数据集上应用一系列的变换,语言本身也对集合操作提供了众多强大的函数,本文将以List类型为例子,介绍常见的集合变换操作。一、常用操作符(操作符其实也转载 2017-04-09 23:50:34 · 323 阅读 · 0 评论 -
scala---文档主题生成模型(LDA)算法原理及Spark MLlib调用实例(Scala/Java/python)
来源:http://m.blog.youkuaiyun.com/article/details?id=53485305算法介绍:LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,我们认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择转载 2017-05-10 22:29:50 · 1450 阅读 · 0 评论 -
Scala入门到精通——第三节 Array、List
来源:http://blog.youkuaiyun.com/lovehuangjiaju/article/details/46963721本节主要内容数组操作实战列表List操作实战数组操作实战1 定长数组//定义一个长度为10的数值数组scala> val numberArray=new Array[Int](10)numberArray: Array[Int]转载 2017-04-05 23:15:14 · 365 阅读 · 0 评论 -
Scala List
来源:http://www.yiibai.com/scala/scala_lists.htmlScala中列表是非常类似于数组,这意味着,一个列表的所有元素都具有相同的类型,但有两个重要的区别。首先,列表是不可变的,这意味着一个列表的元素可以不被分配来改变。第二,列表表示一个链表,而数组平坦的。具有T类型的元素的列表的类型被写为List[T]。例如,这里有各种数据类型定义的转载 2017-07-07 08:32:12 · 259 阅读 · 0 评论 -
Scala--集合
来源:http://www.yiibai.com/scala/scala_collections.htmlScala有一组丰富的集合库。集合是对事物的容器。这些容器可被测序,线性集像List, Tuple, Option, Map等集合的项目可具有元素的任意数量或有界到零个或一个元素(例如,Option)。集合可能是严格或懒惰。懒集合有可能不消耗内存,直到他们被访问,就像范转载 2017-07-07 08:22:18 · 281 阅读 · 0 评论 -
Scala Sets
来源:http://www.yiibai.com/scala/scala_sets.htmlScala集合为相同类型的配对的不同元素的集合。换句话说,集合是不包含重复元素的集合。有两种集合,不可改变的和可变的。可变和不可变的对象之间的区别在于,当一个对象是不可变的,对象本身不能被改变。默认情况下,Scala中使用不可变的集。如果想使用可变集,必须明确地导入scala.col转载 2017-07-14 08:30:17 · 331 阅读 · 0 评论 -
Scala Map[K, V]
来源:http://www.yiibai.com/scala/scala_maps.htmlScala中的映射是键/值对的集合。任何值可以根据它的键进行检索。键是在映射唯一的,但值不一定是唯一的。映射也被称为哈希表。有两种类型的映射,不可变以及可变的。可变和不可变的对象之间的区别在于,当一个对象是不可变的,对象本身不能被改变。默认情况下,Scala中使用不可变的映射。如果想转载 2017-07-14 08:38:00 · 1449 阅读 · 0 评论 -
Scala元组
来源:http://www.yiibai.com/scala/scala_tuples.htmlScala的元组结合件多个固定数量在一起,使它们可以被传来传去作为一个整体。不像一个数组或列表,元组可以容纳不同类型的对象,但它们也是不可改变的。这里是一个元组持有整数,字符串和Console,如下的一个例子:val t = (1, "hello", Console)这是语法修饰(快转载 2017-07-14 08:45:24 · 456 阅读 · 0 评论 -
Scala--- Set(集合)
来源:http://www.runoob.com/scala/scala-sets.htmlScala Set(集合)是没有重复的对象集合,所有的元素都是唯一的。Scala 集合分为可变的和不可变的集合。默认情况下,Scala 使用的是不可变集合,如果你想使用可变集合,需要引用 scala.collection.mutable.Set 包。默认引用 sc转载 2017-07-05 22:08:06 · 1111 阅读 · 0 评论 -
Scala 容器基础(十七):使用filter方法过滤集合元素
来源:https://my.oschina.net/nenusoul/blog/658238Problem 你想要筛选出集合中的一些元素形成一个新的集合,这些元素都是满足你的筛选条件的。Solution 在10.3节中,“选择一个集合方法来解决问题”,大量的方法可以被用来过滤输入集合的元素然后生成新的集合。这一节中展示了filter方法。那么如何正确使用转载 2017-07-05 22:15:48 · 42259 阅读 · 2 评论 -
Scala---字符串
来源:http://www.yiibai.com/scala/scala_strings.htmlobject Test { val greeting: String = "Hello, world!" def main(args: Array[String]) { println( greeting ) }}在这里,上面的值类型是从Jav转载 2017-07-05 22:37:51 · 499 阅读 · 0 评论 -
快速了解Breeze(二)
来源:http://blog.youkuaiyun.com/zhuqing2020/article/details/37605553https://github.com/scalanlp/breeze/wiki/Quickstart点击打开链接https://github.com/scalanlp/breeze/wiki/Linear-Algebra-Cheat-Sheet点击打开转载 2017-06-02 08:39:57 · 1106 阅读 · 1 评论 -
ScalaNLP-breeze&breeze-viz总结
来源:http://m.blog.youkuaiyun.com/article/details?id=46942061统计分布breeze.stats.distributions.Guassian(0,1) 正态分布/高斯分布breeze.stats.distributions.Binomial(n,p) 伯努利二项分布breeze.stats.distribut转载 2017-06-02 08:37:26 · 1409 阅读 · 0 评论 -
Spark RDD API详解(一) Map和Reduce
来源:http://blog.youkuaiyun.com/jewes/article/details/39896301本文由cmd markdown编辑,原始链接:https://www.zybuluo.com/jewes/note/35032 RDD是什么?RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD。从编程的角度来看,RDD可以简转载 2017-04-10 23:23:02 · 274 阅读 · 0 评论 -
Scala入门到精通——第一节 Scala语言初步
来源:http://blog.youkuaiyun.com/lovehuangjiaju/article/details/477463911 变量定义//声明一个val变量//与java final关键字声明的变量一样//一旦被赋值,便不能更改//Scala会帮我们进行类型推断scala> val helloString="Hello World"helloString: Str转载 2017-04-04 23:34:25 · 435 阅读 · 0 评论 -
Scala入门到精通——第四节 Set、Map、Tuple、队列操作实战
来源:http://blog.youkuaiyun.com/lovehuangjiaju/article/details/46984575本节主要内容mutable、immutable集合Set操作实战Map操作实战Tuple操作实战队列操作实战栈操作实战mutable、immutable集合以下内容来源于Scala官方文档:http://www.scala-lan转载 2017-04-28 22:56:57 · 349 阅读 · 0 评论 -
Scala入门到精通——第五节 函数与闭包
来源:http://blog.youkuaiyun.com/lovehuangjiaju/article/details/46992275本节主要内容(一)函数字面量(值函数)(二)匿名函数(三)函数的简化(四)函数参数(四)闭包函数字面量(值函数)函数字面量(function literal),也称值函数(function values),指的是函数可以赋值给转载 2017-04-29 22:37:57 · 276 阅读 · 0 评论 -
Scala入门到精通—— 第二节Scala基本类型及操作、程序控制结构
来源:http://blog.youkuaiyun.com/lovehuangjiaju/article/details/46953423整数类型变量定义://16进制定义法scala> val x=0x29x: Int = 41//十进制定义法scala> val x=41x: Int = 41//八进制定义法scala> 051res0: Int = 41浮点类型变量定转载 2017-04-05 23:13:47 · 519 阅读 · 0 评论 -
scala--标签和索引的转化:StringIndexer- IndexToString-VectorIndexer
来源:http://mocom.xmu.edu.cn/article/show/587f11deaa2c3f280956e7ba/0/1 版权声明: 本文发自http://mocom.xmu.edu.cn,为 赖永炫 老师的个人博文,文章仅代表个人观点。无需授权即可转载,转载时请务必注明作者。Spark的机器学习处理过程中,经常需要把标签数据(一般是字符串)转化转载 2017-04-19 09:39:02 · 3023 阅读 · 0 评论 -
scala--快速了解Breeze
来源:http://blog.youkuaiyun.com/zhuqing2020/article/details/37605553https://github.com/scalanlp/breeze/wiki/Quickstart点击打开链接https://github.com/scalanlp/breeze/wiki/Linear-Algebra-Cheat-Sheet点击转载 2017-05-02 14:39:40 · 3727 阅读 · 0 评论 -
LDA主题模型评估方法--Perplexity
来源:http://blog.youkuaiyun.com/pirage/article/details/9368535在LDA主题模型之后,需要对模型的好坏进行评估,以此依据,判断改进的参数或者算法的建模能力。Blei先生在论文《Latent Dirichlet Allocation》实验中用的是Perplexity值作为评判标准。一、Perplexity定义源于转载 2017-05-10 22:30:35 · 5605 阅读 · 0 评论 -
Scala入门到精通——第六节:类和对象(一)
来源:http://blog.youkuaiyun.com/lovehuangjiaju/article/details/47009607本节主要内容1 类定义、创建对象 2 主构造器 3 辅助构造器类定义、创建对象//采用关键字class定义class Person { //类成员必须初始化,否则会报错 //这里定义的是一个公有成员 var转载 2017-05-03 22:46:25 · 332 阅读 · 0 评论 -
Scala数据类型
来源:http://www.yiibai.com/scala/scala_data_types.htmlScala的数据类型全部相同于Java中,具有相同的内存占用和精度。以下表是有关可在Scala中所有的数据类型的细节:数据类型描述Byte8位有符号值。范围从-128到127Short16位有符号值。转载 2017-05-07 22:44:05 · 418 阅读 · 0 评论 -
Scala---数组
来源:http://www.yiibai.com/scala/scala_arrays.htmlScala中提供了一种数据结构-数组,其中存储相同类型的元素的固定大小的连续集合。数组用于存储数据的集合,但它往往是更加有用认为数组作为相同类型的变量的集合。取替声明单个变量,如number0, number1, ..., 和number99,声明一个数组变量,如号码和使用numbe转载 2017-07-05 22:47:40 · 1008 阅读 · 1 评论