
大数据
文章平均质量分 87
云栖精选
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MySQL自动测试框架介绍
摘要: 1、概述 在我们給MySQL打了patch后,不仅需要测试新增的功能,同时更重要的问题是,需要对原有的功能作回归――若新增的patch导致原有其他功能产生bug,就得不偿失。 MySQL自动测试框架是一个以MySQL框架和内部引擎为测试对象的工具。主要执行脚本在发布路径的mysql-test目录下...1、概述在我们給MySQL打了patch后,不仅需要测试新增的功能,原创 2016-07-11 18:06:51 · 1939 阅读 · 1 评论 -
【玩转数据系列三】利用图算法实现金融行业风控
(本文数据为虚构,仅供实验)一、背景本文将针对阿里云平台上图算法模块来进行实验。图算法一般被用来解决关系网状的业务场景。与常规的结构化数据不同,图算法需要把数据整理成首尾相连的关系图谱。图算法更多的是考虑边和点的概念。阿里云机器学习平台上提供了丰富的图算法组件,包括K-Core、最大联通子图、标签传播聚类等。本文的业务场景如下:下图是已知的一份人物通联关系图,每两个人之间的原创 2016-07-06 17:57:52 · 1328 阅读 · 0 评论 -
BaaS云架构核心模式之Serverless架构 - 用服务代替服务器(Martin Fowler)
Martin Fowler最近非常推崇的serverless架构模式,是BaaS云架构实现的核心架构模式。Martin Fowler在2016.6.17号发表了一篇博客: 《Serverless Architectures》,引起业界广泛关注:在这篇博客里,他介绍了serverless架构,以及FaaS,Microservice,Docker等流行的架构和概念,描述了Amazon AW原创 2016-07-07 17:40:55 · 1128 阅读 · 0 评论 -
BaaS云架构核心模式之Serverless架构 - 用服务代替服务器(Martin Fowler)
摘要: Martin Flower在2016.6.17号发表了一篇博客: [《Serverless Architectures》](http://martinfowler.com/articles/serverless.html),引起业界广泛关注: 在这篇博客里,他介绍了serverless架构,以及FMartin Fowler最近非常推崇的serverless架构模式,是BaaS云原创 2016-07-08 16:08:42 · 5576 阅读 · 0 评论 -
DataV首次实战分享:教你30分钟创建汽车大屏
https://yq.aliyun.com/articles/57775?&utm_source=qq转载 2016-07-20 15:50:22 · 3089 阅读 · 0 评论 -
大规模图搜索和实时计算在阿里反作弊系统中的应用
针对电商平台上的作弊行为,阿里巴巴一直秉承着零容忍的态度,在虚假交易的识别防控以及处罚力度上没有最强只有更强。经过多年在全球最大的电商平台大数据上的沉淀和积累,阿里电商反作弊形成了一套监控预警、识别分析和处罚管控的多维度监管机制,特别是对虚假交易的数据监控和算法识别上应用了覆盖全链路大数据的实时分析转载 2016-09-22 16:24:34 · 883 阅读 · 0 评论 -
SQL Server 表变量和临时表系列之概念篇
问题引入“菜鸟啊,最近我看到阿里云开发者论坛的数据库RDS中有人在提SQL Server表变量和临时表如何选择的问题,你去深入探讨下这个问题吧,解答解答他们的疑惑吧”,老鸟又开始为菜鸟找活干了。“鸟哥啊,关于表变量和临时表使用选择的问题啊,向来行业里争论不休,我比较担心我们的观点被人家拍砖啊”。“鸟啊,有争论才说明这个问题有价值啊,所以我们才更应该去弄清楚,道明白啊”。反正老鸟总会转载 2017-01-06 15:25:49 · 785 阅读 · 0 评论 -
【双11技术揭秘】万亿级数据洪峰下的分布式消息引擎
点击打开链接摘要: 作者:冯嘉、誓嘉、尘央、牟羽 前言 通过简单回顾阿里中间件(Aliware)消息引擎的发展史,本文开篇于双11消息引擎面临的低延迟挑战,通过经典的应用场景阐述可能会面临的问题 - 响应慢,雪崩,用户体验差,继而交易下跌。为了应对这些不可控的洪峰数据,中间件团队通过大量研究和实践,推出了低延迟高可...作者:冯嘉、誓嘉、尘央、牟羽 前言转载 2017-01-13 15:22:10 · 1853 阅读 · 1 评论 -
飞天5K实战经验:大规模分布式系统运维实践
点击打开链接 传统的运维人员通常只面对几十或者上百台的服务器,但在大规模分布式集群中,运维人员面临工作任务明显不同。本文分别阐述服务器数量激增,要求提升全局掌控能力,如何实现系统的自我保护和自动化恢复,大规模与精细化平衡,以及需要开发和运维更加紧密合作等方面,通过对真实数据进行分析和预测,将判断失误概率降到最低。2013年,云梯1实现空间优化与跨机房集群扩展,云梯2单集群规模从15转载 2017-01-10 12:51:18 · 777 阅读 · 0 评论 -
Docker网络深度解读
在云栖TechDay : Docker深度实践专场,来自阿里云容器服务的王炳燊分享了题为《Docker网络深度解读》的演讲。他主要介绍了Docker概念和默认网络、Docker跨主机网络、阿里云服务的网络方案。转载 2017-01-10 12:53:37 · 726 阅读 · 0 评论 -
【一个批量计算的调度系统的设计与实现】如果需要对成千上万的网络抓包数据文件在规定的时间内进行解析,应该怎么做?
原文链接:http://click.aliyun.com/m/9390/上传图片1、图片大小不能超过2M2、支持格式:.jpg .gif .png .bmp中间水印 右下水印 无水印文章标签(添加Tag,你的内容能被更多人看到)我们为什么要转载 2017-01-16 14:21:42 · 755 阅读 · 0 评论 -
理解Docker容器网络之Linux Network Namespace
点击打开链接摘要: 本文中我们将尝试理解Linux Network Namespace及相关Linux内核网络设备的概念,并手工模拟Docker容器网络模型的部分实现,包括单机容器网络中的容器与主机连通、容器间连通以及端口映射等。由于2016年年中调换工作的原因,对容器网络的研究中断过一段时间。随着当前项目对Kubernetes应用的深入,我感觉之前对于容器网络的粗转载 2017-01-16 14:25:14 · 674 阅读 · 0 评论 -
阿里云上搭建Docker Swarm模式集群最佳实践
点击打开链接摘要: Docker技术体系和生态在2016年得到飞速发展、成熟,在2016中国容器技术调研报告中也发现了国内绝大部分用户都在关注Docker,80%的用户都会考虑使用容器技术。本文将讲解如何利用资源编排快速搭建Docker Swarm模式集群。Docker技术体系和生态在2016年得到飞速发展、成熟,在2016中国容器技术调研报告中也发现了国内绝大部分用户都在转载 2017-01-16 14:27:25 · 979 阅读 · 0 评论 -
2016年短视频大数据研究报告
点击打开链接2016年,短视频行业在悄然发生着转变。她从风口走下来,融入到各个行业里,变成移动应用中与文字和声音一样常见的媒介。相对于直播的爆发,短视频以一种门槛更低的社交内容形态慢慢进入人们的视野。据悉,中国短视频市场活跃用户规模已达到近5000万人,短视频内容领域创业的不断兴起、内容分发渠道的完善、短视频服务产业链的完整与繁荣,也无一不证明着短视频行业的风起云涌。作为国内领先的转载 2017-01-17 14:31:53 · 1095 阅读 · 0 评论 -
舆情中的热词分析,没你想的那么简单
http://click.aliyun.com/m/9455/点击打开链接背景阿里云公众趋势分析产品通过云服务的方式,将阿里巴巴成熟的舆情分析技术共享给广大开发者。热词分析是公众趋势分析最近刚刚上线的功能,用户反馈效果还不错。这个功能听起来很简单,不就是对数据源进行分词,然后再统计一下热度么?No!它可没那么简单。分词和实体识别良好的分词是热词分析的基础。对于绝转载 2017-01-17 14:33:12 · 1264 阅读 · 0 评论 -
怎么才能向技术大牛提切中要点的问题?本文教你如何高质量提问
点击打开链接作者介绍:Julia Evans,Stripe公司架构师,相关地址twittergithub(以下为译文)在软件开发的过程中,问问题是一个非常重要的技能。根据我同事的反映,我在这个方面比较擅长。以下是我的一些经验技巧,现在和大家分享一下。在以前,我总是问出质量很差的问题。要么就是提出一些让别人无法回答的问题,要么就是提出一些在Google上或者代码库上很转载 2017-01-17 14:35:12 · 959 阅读 · 0 评论 -
异地多活设计辣么难?其实是你想多了!
点击打开链接1. 引言有幸参与了阿里游戏的一个高可用方案的设计,并且在网上发表了方案(面向业务的立体化高可用架构设计),后来参加GOPS全球运维大会深圳站,与众多行业高手交流,发现大家对“异地多活”这个方案设计非常感兴趣,毕竟“异地多活”的方案价值非常大,尤其是互联网行业,规模稍微大一点几乎都必须是标配;但同时大家都觉得“异地多活”的方案设计又很难,网络、数据、事务等各种问题混杂在一起转载 2017-01-20 14:58:07 · 564 阅读 · 0 评论 -
无人驾驶背后的技术_-_PostGIS点云(pointcloud)应用
摘要: 标签 PostgreSQL , PostGIS , box , grid , pointcloud , pgpointcloud , point聚合 , KNN , 自动驾驶 , 自动配送 , 无人驾驶 背景 科幻电影的场景随着技术的发展,正在一步步的从荧幕变成现实。标签PostgreSQL , PostGIS , box , grid , pointcloud转载 2017-05-23 14:59:37 · 3962 阅读 · 0 评论 -
PHP优化杂烩
摘要: PHP优化杂烩 讲 PHP 优化的文章往往都是教大家如何编写高效的代码,本文打算从另一个角度来讨论问题,教大家如何配置高效的环境,如此同样能够达到优化的目的。 pool 一个让人沮丧的消息是绝大多数 PHP 程序员都忽视了池的价值。PHP优化杂烩讲 PHP 优化的文章往往都是教大家如何编写高效的代码,本文打算从另一个角度来讨论问题,教大家如何配置高效的环境,如此同样能够达到转载 2017-05-23 15:04:32 · 416 阅读 · 0 评论 -
帝国cms_7.2_版本_使用465端口发邮件_教程
摘要: 越来越多的服务器禁止了25端口,但是大家又要发信件,这时候就要使用SSL加密安全连接。下面是教程众所周知云服务器为了减少垃圾啊邮件,默认封掉了smtp 25端口,允许ssl 链接 smtp 465端口或者其他端口,接下来我就给大家发一下帝国cms 7.2版本的修改教程,完成ssl的发件修改。1、修改php.ini找到extension=php_openssl转载 2017-05-23 15:17:29 · 717 阅读 · 0 评论 -
webstorm等Jetbrains工具_激活破解
摘要: 2017.4.27更新 选择“license server” 输入:http://idea.imsxm.com/ 2016.2.2 版本的破解方式: 安装以后,打开软件会弹出一个对话框;选择“license server” 输入:http://114.2017.4.27更新 选择“license server” 输入:http://idea.imsxm.com/2016转载 2017-05-23 15:22:43 · 1866 阅读 · 0 评论 -
5月19日云栖精选夜读:性能追求之路——MaxCompute2.0的前世今生
摘要: 《大数据计算服务MaxCompute产品最新动态》,首先介绍了MaxCompute的发展历程和技术架构,然后对MaxCompute 2.0版本新特性和新技术进行了详细介绍。《大数据计算服务MaxCompute产品最新动态》,首先介绍了MaxCompute的发展历程和技术架构,然后对MaxCompute 2.0版本新特性和新技术进行了详细介绍。转载 2017-05-23 15:26:10 · 278 阅读 · 0 评论 -
Siri真的要离开我们了?
我们都知道,在5月17日的GoogleI/O大会上,谷歌推荐了一系列的人工智能助手,其中一个就是智能语音助手——GoogleAssistant。这不是关键,因为其实GoogleAssistan去年就发布了,不过现在它可以在美区AppStore下载使用了!这简直是在直接和Siri宣战啊!!!宝宝们应该对GoogleAssistant都不熟悉,那就简单介绍一下,它能干这转载 2017-05-23 15:34:09 · 329 阅读 · 0 评论 -
抛弃格子衫和冲锋衣_程序员该如何穿?
在众多人眼中,程序猿是最不会穿衣搭配的物种了,他们一年四季的标配就是格子衫加牛仔裤,冷的时候再加件冲锋衣。每到春夏,码农的大花格子衬衫就会在互联网公司的格子间遍地开花,如同冲锋衣是秋冬标配一样,格子衬衫就是程序员的夏季制服,一堆程序员在一起都不是连连看。人靠衣装,佛靠金装”这句话很多人都听过,但是放在心上的未必有几个,对于不善于穿衣打扮的程...序...员...来说,更是如转载 2017-05-23 15:38:24 · 1105 阅读 · 0 评论 -
10个值得深思的_PHP_面试问题
摘要: 10个值得深思的 PHP 面试问题 文章所罗列的问题虽然看似简单,但是每个背后都涵盖了一个或几个大家容易忽视的基础知识点,希望能够帮助到你的面试和平时工作。 Q1 第一个问题关于弱类型 $str1 = 'yabadabadoo'; $str2 = 'yaba'; if (strpos($str1,$str2)) { echo "\"" .10个值得深思的 PHP 面试问题转载 2017-05-24 13:55:12 · 893 阅读 · 0 评论 -
学习和使用_PHP_应该注意的10件事
摘要: 学习和使用 PHP 应该注意的10件事 1 多阅读手册和源代码 没什么比阅读手册更值得强调的事了–仅仅通过阅读手册你就可以学习到很多东西,特别是很多有关于字符串和数组的函数。就在这些函数里面包括许多有用的功能,如果你仔细阅读手册,你会经常发现在以往的项目开发过程中,很多时候你在“重复发明轮子”,而实际上你只需要一个核心函数就可以完成相应的功能。学习和使用 PHP 应该注意的10转载 2017-05-24 14:04:25 · 547 阅读 · 0 评论 -
PHP_实现四种基本排序算法
摘要: PHP 实现四种基本排序算法 许多人都说算法是程序的核心,算法的好坏决定了程序的质量。作为一个初级phper,虽然很少接触到算法方面的东西。但是对于基本的排序算法还是应该掌握的,它是程序开发的必备工具。PHP 实现四种基本排序算法许多人都说算法是程序的核心,算法的好坏决定了程序的质量。作为一个初级phper,虽然很少接触到算法方面的东西。但是对于基本的排序算法还是应转载 2017-05-24 14:14:16 · 410 阅读 · 0 评论 -
使用HAProxy、PHP、Redis和MySQL支撑每周10亿请求
摘要: 使用HAProxy、PHP、Redis和MySQL支撑每周10亿请求 在公司的发展中,保证服务器的可扩展性对于扩大企业的市场需要具有重要作用,因此,这对架构师提出了一定的要求。Octivi联合创始人兼软件架构师Antoni Orfin将向你介绍一个非常简单的架构,使用HAProxy、PHP、Redis和MySQL就能支撑每周10亿请求。使用HAProxy、PHP、Redis和M转载 2017-05-24 14:22:40 · 925 阅读 · 0 评论 -
无人驾驶的分级以及产品化后会带来的改善
摘要: 人工智能是时代,机器人开始作为服务的承载体出现,其中的一个具体事例就是无人驾驶的产品化。无人驾驶并不是一个单一的新技术,而是一系列技术的整合。本文将向您介绍这一技术对生活带来的改善以及无人驾驶的分级。 本文选自《第一本无人驾驶技术书》引言:人工智能是时代,机器人开始作为服务的承载体出现,其中的一个具体事例就是无人驾驶的产品化。无人驾驶并不是一个单一的新技术,而是一系列技术的转载 2017-05-24 14:28:57 · 650 阅读 · 0 评论 -
Eclipse曾经的行业之王_为何堕落了?
Eclipse,曾经的行业之王Eclipse 是一款用 Java 编写的免费 Java IDE,Eclipse 允许你创建各种跨平台的可用于手机、网络、桌面和企业领域的 Java 应用程序,通过插件,它还支持对诸如包括C、C ++、JavaScript、Perl、PHP、Prolog、Python、R、Ruby等语言的开发。可以说Eclipse是那个时代当之无愧的王者。Eclips转载 2017-05-24 14:36:21 · 467 阅读 · 0 评论 -
什么样的_BUG_会让你目瞪口呆?
是这样的,我叫--,曾经我想注册一个新浪微博的账号,起昵称的时候出现了这样的事……起初我以为只不过是重名,这个名字已经被抢注了……后来发现这事没这么简单……我这名字简直跟某邪教组织词汇和国家领导人是一个级别的…… 到最后才发现,比脏话的屏蔽等级还要高……上图……刚刚我又登陆微博试了一下……结果……那么您遇到过何种奇葩的BU转载 2017-05-24 14:40:54 · 395 阅读 · 0 评论 -
UNIX/Linux_C_程序员需要掌握的七种武器
摘要: 我是一名普通的软件工程师,不是什么技术大牛。这篇文章所提到的“七种武器”只是我这些年工作经验的一点体会和感悟,如果有错误的地方,还请大家指正。 (一)C语言 作为一名C程序员,熟练掌握C语言是最基本的一项技能。我是一名普通的软件工程师,不是什么技术大牛。这篇文章所提到的“七种武器”只是我这些年工作经验的一点体会和感悟,如果有错误的地方,还请大家指正。(一)C语言转载 2017-05-25 13:41:47 · 814 阅读 · 0 评论 -
六招教你用Python构建好玩的深度学习应用
摘要: 导读 深度学习是近来数据科学中研究和讨论最多的话题。得益于深度学习的发展,数据科学在近期得到了重大突破,深度学习也因此得到了很多关注。据预测,在不久的将来,更多的深度学习应用程序会影响人们的生活。导读深度学习是近来数据科学中研究和讨论最多的话题。得益于深度学习的发展,数据科学在近期得到了重大突破,深度学习也因此得到了很多关注。转载 2017-05-25 13:49:32 · 1327 阅读 · 0 评论 -
想用R和Python做文本挖掘又不知如何下手?方法来了!
摘要: 1、对文章产生好奇 在数据科学中,几乎做所有事情的第一步都是产生好奇,文本挖掘也不例外。 文本挖掘应用领域无比广泛,可以与电影台本、歌词、聊天记录等产生奇妙的化学反应:如南方公园的对话,电影对白的文本挖掘和分析等也都是受到了文本挖掘的启发;近期大数据文摘相关文章《从恋爱到婚后的短信词频图发生了这些变化,你中了几枪?》带各位分析了聊天记录中隐藏的文本信息;而对各类歌词的文本信息分析,也颇有意转载 2017-05-25 13:59:36 · 1828 阅读 · 0 评论 -
业务技术协同线上化的硬盘式研发管理实践
摘要: 在云效平台策划推出的《持续集成与交付:阿里最佳实践》专题中,阿里云效产品专家代平为大家深入浅出地分享了互联网的研发管理理念,解析了企业研发管理面临的挑战和困难,揭密了如何结合云效产品进行业务技术协同线上化的硬盘式研发管理实践。摘要:在云效平台策划推出的《持续集成与交付:阿里最佳实践》专题中,阿里云效产品专家代平为大家深入浅出地分享了互联网的研发管理理念,解析了企业研发管理面临的挑战转载 2017-05-25 14:28:17 · 952 阅读 · 0 评论 -
做一个美女图片大全那种的网站怎么提高网站流量?
摘要: 大家都看到了美女图片大全网站流量是很巨大的,但是不知道怎么入手。其实,百度图库很多是收录来自各个网站里的图片的,你只要在你的网站做好图片,或者在高权重的网站里发布带有你网站图片的内容就比较容易了。 在说其他内容之一,有一个很重要,之前由于考虑不周全,选择了一个带宽不够足大的服务器,结果么想到,网站把图片都上传之后,http://www.tjygapp.com/mei/index.htm打不转载 2017-05-25 14:34:05 · 15702 阅读 · 0 评论 -
几个简单步骤可以提高网站浏览体验
摘要: STEP 1确定网站定位 你的网站定位是要以企业形象官网为主,或是以单纯贩售商品的购物网站,还是要跟使用者做互动活动的网站? 每个网站的目的都不尽相同,形象官网,可能需要着重于品牌理念、品牌故事、公司介绍等等;购物网站,除了要有动线明确的金物流外,商品要有明确分类方式让消费者易于找到目标商品;互动活动网站,要在访客进入网站的当下就让他知道要怎样做互动,和明确指出活动信息等等。转载 2017-05-25 14:41:14 · 368 阅读 · 0 评论 -
玩转大数据_顺利渡过34岁裁退危机!
某菊花厂要把34岁以上的员工都裁退,中年都没到就危机了,票子木有了,工作木有了,连最热爱的数据库都没机会玩了,还好,有一个快速上手玩转大数据的机会!一定要好好珍惜啊!阿里云有一款大数据产品,云HBase,其是基于 Hadoop 的一个分布式数据库,支持海量的PB级的大数据存储,适用于高吞吐的随机读写的场景,有Hadoop基础的程序员上手是极快地!再还有免费申请公测的机会,不花钱就能学会大数据,棒棒转载 2017-05-25 14:55:45 · 351 阅读 · 0 评论 -
盲人程序员是怎样炼成的
摘要: 一个星期前,本网站根据劳工部残疾人就业政策办公室(Office of Disability Employment Policy)的报道,编发了一篇文章“通讯手段为所有人提供机会”,介绍为国防部制作网页的盲人程序员张海伦,引起了人们的惊叹,一位读者赞扬张海伦 “了不起,技术难度赶上贝多芬”,另一位则表示“简直难以置信,但是不得不信”。一个星期前,本网站根据劳工部残疾人就业政策办公转载 2017-05-26 13:38:11 · 570 阅读 · 0 评论 -
成都云栖大会_阿里1582.73亿营收背后的持续交付如何玩?
摘要: 随着普惠金融业务的深入,以及消费金融业务竞争的白热化,针对信用白户的风控显得尤为重要。如何面向信用白户进行快速有效的信用评级,卧龙大数据根据自己的实践经验,就电商、社交数据在风控上的应用价值与大家进行一些分享。随着普惠金融业务的深入,以及消费金融业务竞争的白热化,针对信用白户的风控显得尤为重要。如何面向信用白户进行快速有效的信用评级,卧龙大数据根据自转载 2017-05-26 13:45:19 · 444 阅读 · 0 评论