
大快分享
文章平均质量分 85
DKhadoop
这个作者很懒,什么都没留下…
展开
-
互联网数据化运营基础应用之信息质量模型
信息质量模型在互联网行业和互联网数据化运营中也是有着广泛基础性应用的。具体来说,电商行业和电商平台连接买卖双方最直接、最关键的纽带就是海量的商品目录、商品Offer、商品展示等,无论是B2C(如当当网、凡客网),还是C2C(如淘宝网),或者是B2B(如阿里巴巴),只要是以商业为目的,以交易为目的的,都需要采用有效手段去提升海量商业信息(商品目录、商品Offer、商品展示等)的质量和结构,从而促进交...原创 2018-11-26 13:16:35 · 393 阅读 · 0 评论 -
Python图像处理:图像腐蚀与图像膨胀
图像的膨胀(Dilation)和腐蚀(Erosion)是两种基本的形态学运算,主要用来寻找图像中的极大区域和极小区域。其中膨胀类似于“领域扩张”,将图像中的高亮区域或白色部分进行扩张,其运行结果图比原图的高亮区域更大;腐蚀类似于“领域被蚕食”,将图像中的高亮区域或白色部分进行缩减细化,其运行结果图比原图的高亮区域更小。1.图像膨胀膨胀的运算符是“⊕”,其定义如下: 该公式...转载 2018-11-23 11:53:15 · 2547 阅读 · 0 评论 -
大数据分析技术在新型智慧能源建设中的应用
智慧一概念已经提出很多年,这是一种全新的能源形式,包括符合生态文明和可持续发展要求的相关能源技术和能源制度体能源这系。智慧能源是以互联网技术为基础,以电力系统为中心,将电力系统与天然气网络、供热网络以及工业、交通、建筑系统等紧密耦合,横向实现电、气、热、可再生能源等“多源互补”,纵向实现“源、网、荷、储”各环节高度协调,生产和消费双向互动,集中与分布相结合的能源服务网络。其依托互联网、物联网、...转载 2018-11-21 13:31:12 · 1074 阅读 · 0 评论 -
大规模特征构建实践总结
背景一般大公司的机器学习团队,才会尝试构建大规模机器学习模型,如果去看百度、头条、阿里等分享,都有提到过这类模型。当然,大家现在都在说深度学习,但在推荐、搜索的场景,据我所知,ROI并没有很高,大家还是参考wide&deep的套路做,其中的deep并不是很deep。而大规模模型,是非常通用的一套框架,这套模型的优点是一种非常容易加特征,所以本质是拼特征的质和量,比如百度、头条号称特征到...原创 2018-11-16 15:11:48 · 340 阅读 · 0 评论 -
非局部神经网络,打造未来神经网络基本组件
将非局部计算作为获取长时记忆的通用模块,提高神经网络性能在深度神经网络中,获取长时记忆(long-range dependency)至关重要。对于序列数据(例如语音、语言),递归运算(recurrent operation)是长时记忆建模的主要解决方案。对于图像数据,长时记忆建模则依靠大型感受野,后者是多层卷积运算堆叠的结果。卷积和递归运算处理的都是一个局部邻域,可以是空间局部邻域,也可以...转载 2018-11-12 14:00:13 · 409 阅读 · 0 评论 -
大数据分析在新型智慧能源建设中的应用
智慧一概念已经提出很多年,这是一种全新的能源形式,包括符合生态文明和可持续发展要求的相关能源技术和能源制度体能源这系。智慧能源是以互联网技术为基础,以电力系统为中心,将电力系统与天然气网络、供热网络以及工业、交通、建筑系统等紧密耦合,横向实现电、气、热、可再生能源等“多源互补”,纵向实现“源、网、荷、储”各环节高度协调,生产和消费双向互动,集中与分布相结合的能源服务网络。其依托互联网、物联网、大数...转载 2018-11-14 11:27:24 · 1012 阅读 · 0 评论 -
云计算的云数据安全与加密技术
云计算、大数据等信息技术正在深刻改变着人们的思维、生产、生活和学习方式,并延深进入人们的日常生活。伴随着社交媒体、电商、健康医疗、智能交通、电信运营、金融和智慧城市等各行业各领域的大数据的产生,大数据分析技术和应用研究使大数据呈现出不可限量的经济社会价值和科学研究意义,引起了国内外学术界和产业界的研究热潮,对此各国政府也高度重视并不断上升为国家战略高度。数据信息在很多环节暴露出的大数据安全...原创 2018-11-06 14:21:10 · 2301 阅读 · 1 评论 -
动态分配多任务资源的移动端深度学习框架
与云相比,移动系统受计算资源限制。然而众所周知,深度学习模型需要大量资源 。为使设备端深度学习成为可能,应用程序开发者常用的技术之一是压缩深度学习模型以降低其资源需求,但准确率会有所损失。尽管该技术非常受欢迎,而且已被用于开发最先进的移动深度学习系统,但它有一个重大缺陷:由于应用程序开发者独立开发自己的应用,压缩模型的资源-准确率权衡在应用开发阶段的静态资源预算的基础上就被预先确定了,在应用部署后...原创 2018-10-31 15:13:45 · 589 阅读 · 0 评论 -
详谈分布式系统缓存的设计细节
详谈分布式系统缓存的设计细节在分布式Web程序设计中,解决高并发以及内部解耦的关键技术离不开缓存和队列,而缓存角色类似计算机硬件中CPU的各级缓存。如今的业务规模稍大的互联网项目,即使在最初beta版的开发上,都会进行预留设计。但是在诸多应用场景里,也带来了某些高成本的技术问题,需要细致权衡。服务端数据缓存一种区分缓存基于不同的条件有很多种划分方式,本地缓存(Local cac...原创 2018-10-29 15:17:56 · 283 阅读 · 0 评论 -
深度剖析HBase负载均衡和性能指标
在分布式系统中,负载均衡是一个非常重要的功能,HBase通过Region的数量实现负载均衡,即通过hbase.master.loadbalancer.class实现自定义负载均衡算法。下面将为大家剖析HBase负载均衡的相关内容以及性能指标。内容HBase系统负载均衡是一个周期性的操作,通过负载均衡来均匀分配Region到各个RegionServer上,通过hbase.balancer.p...转载 2018-10-13 10:20:49 · 543 阅读 · 0 评论 -
利用大规模无监督数据建立高水平特征
在大数据时代下,人工智能作为国际上未来几年、几十年发展的重要方向,具有十分广阔的应用空间,适用于各行各业,并且当今生产和生活中也融入了人工智能技术,特别是在计算机网络领域中,应用人工智能技术有着重要意义。1、 大数据和人工智能技术1.1 大数据简单来说,大数据就是海量数据的集合体。“大”不仅仅是指数据的总量,同时也包括数据类型。大数据之所以成为了信息的集合体主要是因为其具备了一下几个特...原创 2018-11-28 11:31:39 · 480 阅读 · 0 评论