开源集群计算环境:Spark 1.1.0发布

Spark开发团队宣布开源集群计算环境Spark1.1.0发布,该版本是Spark1.X系列版本的第二个API兼容版本,带来了性能和可用性的改进,新增了SparkSQL、MLlib、GraphX和SparkStreaming的功能,以及PySpark的增强,提供了大规模负载任务的新功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

近日,Spark开发团队宣布开源集群计算环境Spark 1.1.0发布,该版本是Spark 1.X系列版本的第二个API兼容版本,它是目前改变最大的一个版本,具有171个开发者。该版本带来了一些操作性和性能的提升,主要体现在核心模块上,扩展了Spark的一些最新模块(MLlib 和Spark SQL)的功能;该版本开始支持 Python,并为Spark streaming模块增加了新的组件,该版本主要的改进如下:

\\

1、性能和可用性方面的改进

\\

Spark 1.1.0在稳定性和性能方面做了大量改进,并为大规模的负载任务提供了新功能。当内存不足时,Spark可以做到将整个缓存块刷新到磁盘中,以防止内存溢出;Spark引入了新的算法的实现,优化了大规模计算,还改进了复杂的、耗时的任务的监控可用性,做到了Accumulator内容可以在Spark的Web页面中显示、任务处理进度的动态更新、读取输入数据的任务进度报告。

\\

2、Spark SQL

\\

Spark SQL新增了许多新功能,还进行了许多优化,从而性能也得到了大大的提高。新增的JDBC/ODBC server使得用户能够从很多不同的应用连接到SparkSQL,并且还提供了共享访问缓存的功能;新增了将JSON数据直接加载成Spark的SchemaRDD格式的功能模块;新增动态字节码生成的功能,能够显著的加快复杂表达式求值的查询;新增了将Python、Java、Scala和Java lambda函数注册为UDF的功能,从而做到在SQL中直接调用;新增了一个公共API使得用户能够使用自定义的数据源创建SchemaRDD。

\\

3、MLlib

\\

MLlib 新增了很多算法,并对一些旧算法进行了优化,使得它们的性能得到了大大提高。新增一个用作统计功能的功能包,提供了试探性统计功能;新增了特征抽取工具(Word2VecTF-IDF)和特征转换工具(标准化和标准度量);使用Lanczos算法做到了对非负矩阵分解(Non-negative matrix factorization)和可缩放矢量图形(SVG)的支持;添加Python和Java的决策树算法API。

\\

4、GraphX和Spark Streaming

\\

Spark Streaming新增了Amazon Kinesis数据源;新增了一个可以从Apache Flume拉取数据的模式,简化了部署和提高了高可用性;一组基于流的机器学习算法首先引入基于流的线性回归;Spark Streaming做到了接收数据速率的控制;GraphX为图的顶点和边添加了自定义存储级别,并提高了数值计算的精度;GraphX还新增了一个标签传播算法。

\\

5、其他值得关注的改进

\\

PySpark 能够读取和写入任意的Hadoop InputFormats,包括SequenceFiles、 HBase、 Cassandra、Avro以及其他数据源;在Spark的UI界面上能够进行阶段性的提交;Spark为所有的网络端口实行严格的防火墙规则 ;GraphX中的一个溢出Bug得以修复,该Bug影响了超过4亿个顶点的图。

\\

另外,Spark 1.1.0现已提供下载,更多相关信息请查看Release Notes。Spark由加州大学伯克利分校 AMP实验室基于Scala开发,可用来构建大型的、低延迟的数据分析应用程序。Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,主要体现在Spark启用了内存分布数据集,使Spark 在某些工作负载方面表现得非常优越。尽管创建 Spark是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop文件系统中并行运行。

\\

感谢郭蕾对本文的审校。

\\

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

资源下载链接为: https://pan.quark.cn/s/9648a1f24758 这个HTML文件是一个专门设计的网页,适合在告白或纪念日这样的特殊时刻送给女朋友,给她带来惊喜。它通过HTML技术,将普通文字转化为富有情感和创意的表达方式,让数字媒体也能传递深情。HTML(HyperText Markup Language)是构建网页的基础语言,通过标签描述网页结构和内容,让浏览器正确展示页面。在这个特效网页中,开发者可能使用了HTML5的新特性,比如音频、视频、Canvas画布或WebGL图形,来提升视觉效果和交互体验。 原本这个文件可能是基于ASP.NET技术构建的,其扩展名是“.aspx”。ASP.NET是微软开发的一个服务器端Web应用程序框架,支持多种编程语言(如C#或VB.NET)来编写动态网页。但为了在本地直接运行,不依赖服务器,开发者将其转换为纯静态的HTML格式,只需浏览器即可打开查看。 在使用这个HTML特效页时,建议使用Internet Explorer(IE)浏览器,因为一些老的或特定的网页特效可能只在IE上表现正常,尤其是那些依赖ActiveX控件或IE特有功能的页面。不过,由于IE逐渐被淘汰,现代网页可能不再对其进行优化,因此在其他现代浏览器上运行可能会出现问题。 压缩包内的文件“yangyisen0713-7561403-biaobai(html版本)_1598430618”是经过压缩的HTML文件,可能包含图片、CSS样式表和JavaScript脚本等资源。用户需要先解压,然后在浏览器中打开HTML文件,就能看到预设的告白或纪念日特效。 这个项目展示了HTML作为动态和互动内容载体的强大能力,也提醒我们,尽管技术在进步,但有时复古的方式(如使用IE浏览器)仍能唤起怀旧之情。在准备类似的个性化礼物时,掌握基本的HTML和网页制作技巧非常
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值