
杂谈
文章平均质量分 80
longshenlmj
这个作者很懒,什么都没留下…
展开
-
工作十年:从大厂到小厂
系列文章目录提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、初入公司,嚣张跋扈个人感觉前言从XX离职,得过一些奖励。期间从研发转岗为解决方案架构师(高级售前),因为ai研发,我在团队一直给其他人打杂,不让写算法,就只能把博士(或其他垃圾)写的算法部署上线,建demo环境。当时真的人生只黑暗的一段时间,数次想死。工作让人崩溃,没有未来,周围只有士武一个朋友,每天我俩工作完,他不善言辞,就听我bb,说谁傻X,谁有病,自己怎么不好。自己一个人在 八百里黄土中原创 2022-04-29 18:41:29 · 860 阅读 · 1 评论 -
Google的两种广告推广方式
1搜索关键字广告推送:AdWords; 覆盖广泛:在全球最大的搜索和网络平台上进行推广。 定位精准:锁定目标客户群体,让潜在客户轻松找上门。 成本可控:仅当用户点击广告时,您才支付费用。2.网站内容相关广告推送: GoogleAdSense (google AdSense,根据用户正在浏览的网页内容,推荐与网页内容相关ad)增加收益:通过内容定位广告释放网站最大原创 2014-09-10 10:47:51 · 2657 阅读 · 0 评论 -
手机广告投放(phone advertising)唯一标识
目前有很多,很多人使用设备id。慢慢已不允许使用。原创 2014-09-02 13:50:05 · 2684 阅读 · 0 评论 -
Impala:新一代开源大数据分析引擎
impala架构分析Impala是Cloudera公司主导开发的新型查询系统,提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。那么Impala如何实现大数据的快速转载 2014-10-08 17:22:31 · 2610 阅读 · 0 评论 -
Google Dremel 原理 - 如何能3秒分析1PB
摘自:http://www.yankay.com/google-dremel-rationale/简介Dremel 是Google的“交互式”数据分析系统。可以组建成规模上千的集群,处理PB级别的数据。MapReduce处理一个数据,需要分钟级的时间。作为MapReduce的发起人,Google开发了Dremel将处理时间缩短到秒级,作为MapReduce的有力补充。Dreme转载 2014-10-08 16:42:41 · 1218 阅读 · 0 评论 -
一个大数据方案:基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎
网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,用来对网络爬虫抓取到的网络资源进行实时的索引和搜索。 搜 索引擎架构在ElasticSearch之上,是一个典型的分布式在线实时交互查询架构,无单点故障,高伸缩、高可用。对大量信息的索引与搜索转载 2014-10-08 11:22:18 · 3371 阅读 · 0 评论 -
互联网广告的个性化推荐平台设计--相关知识
人群分类模型根据用户人群数据记录,建立人群属性分类模型,根绝用户特点,将用户标记为特定类别。据此进行精准定向服务,并进行效果评估。主要分类方法:1.采用模糊数学综合判定理论,构建关系矩阵,判定类别属性的映射关系。采样真实数据,模拟真实数据分布,统计属性取值的概率分布,作为概率的估计值,另外,将广告类别的点击次数作为权重矩阵R。构建映射关系公式:R是关系矩阵,W是出现次数矩阵,C是计原创 2014-11-14 18:32:04 · 2936 阅读 · 0 评论 -
最优解算法的讨论
不懂优化的人希望能有通用的方法来解决他手头的问题,但不幸的事没有这种方法存在,快速的方法都需要某些条件,比如常见的有强凸,线性,可分解啥的。目前研究的比较成熟的就是强凸光源可分解 非凸没有特别有效的方法来解,如果是强凸的,何必用那么复杂的方法求最优解?正是因为不是强凸的,才用到优化方法。就算是凸的,也分好几种不同的情况,只用一阶梯度,达到牛顿梯度法的收敛速度,在convex问题中,还有no原创 2014-11-18 13:29:45 · 24205 阅读 · 0 评论 -
竞价拍卖理论的介绍(RTB模型中使用第二竞价模型,为的是纳什平衡,保护所有多方利益)
英式拍卖是最普通的拍卖方式,其形式是拍卖过程中,竞价按阶梯,从低到高,依次递增。最终由出价最高者获得拍卖物品(竞买人变成买受人)。The first price auction: a form ofauction, where bidders submit one bid in a concealed fashion. The person withthe highest bid wi原创 2014-10-31 18:50:10 · 7070 阅读 · 0 评论 -
我所见过最全的互联网广告相关介绍
http://dirlt.com/computational-advertising.html#sec-1-9-2-2转载 2015-01-07 17:47:42 · 951 阅读 · 0 评论 -
看人装X,我就来气,开启极限装X模式
4进制比二进制更合理,在01的状态中添加了两种状态,从无到有和从有到无的两种过度状态。如果非要用数值表示,用概率表示。01作为近代计算机的基础,但终究淘汰,构成下一代计算机的基础,应该是3进制或者是4进制。有人说四进制是这种形式:有到无,最终还是无;无到有,最终还是有。致命的是,这是不稳定的状态。事实上,有到无、无到有,电子电气行业早就在用,就是上升沿和下降原创 2015-01-23 11:13:44 · 880 阅读 · 0 评论 -
移动端设备广告投放的用户唯一识别码
互联网广告投放,目前技术已经成熟,大部分的技术架构都相似。而移动端,作为新的互联网渠道,广告投放也纷纷趋向这个新战场。互联网pc上,使用cookie作为标示,记录用户上网行为信息,来分析人群定向和精准投放。而移动端使用什么作为用户标识呢?目前,移动端使用的用户唯一标示很多:android有android id和device idiphone的UDID、openUDID和原创 2015-02-05 15:57:11 · 4711 阅读 · 0 评论 -
sublime test2 快捷键
文件 File新建文件Ctrl + N打开文件Ctrl + O打开最近关闭的文件Ctrl + Shift + T保存Ctrl + S另存为…Ctrl + Shift + S关闭文件Ctrl + W新建窗口Ctrl + Shift + N关闭窗口Ct转载 2014-08-20 15:10:54 · 1437 阅读 · 0 评论 -
outlook邮箱邮件与企业邮箱同步(outlook本地文件夹邮件,web邮箱里没有)
用惯了outlook2010,问题:今天将邮件放到自定义文件夹后,发现在web邮箱中看不到邮件了。不能同步到企业邮箱。解决忙了一天,才知道是账户类型问题,pop3,只下载不上传。所以outlook本地修改后,web邮箱看不到。创建账户类型imap,才能将本地文件夹邮件上传到邮箱服务器。创建imap新账户,然后将老账户中的本地文件夹直接拖动到新用户下,然后选择”发送/接受“下的”所有用户组“原创 2014-08-18 16:06:16 · 20684 阅读 · 0 评论 -
幂次法则power law
幂次法则分布和高斯分布是两种广泛存在的数学分布。可以预测和统计相关数据。pig中用其处理数据倾斜,实现负载均衡。个体的规模和其名次之间存在着幂次方的反比关系,R(x)=ax(-b次方)其中,x为规模(如:人口、成绩、营业额…),R(x)为其名次(第1名的规模最大),a为系数,b为幂次。当二边均取对数(log)时,公式成为log(R(x)) = log(a) - b˙log(x)转载 2014-08-06 16:12:16 · 3989 阅读 · 0 评论 -
易信,不改难成大事
微信 一家独大,称霸 智能手机市场的趋势,基本已经成型。而最可怕的是,腾讯土豪的推广方式,不断扩大的应用服务。这时候易信的退出本来是一个有力的竞争者,但易信真令人失望。我们几个安装上就卸载了。其实最为吸引人的方式就免流量,可是安装后,没有朋友聊天,我都不知道跟谁聊。门槛高,限制广。让大部分人感到没有切实感到免费流量。我都感觉收了欺骗所以大部分人一看麻烦就直接卸载了。原创 2013-11-27 14:07:05 · 1225 阅读 · 0 评论 -
新手阅读大型代码库
Casey问我:“对于新手,有什么有针对性的诀窍来阅读大型代码库吗?”碰巧,我认为这是一个非常好的问题。我觉得想要成为一个优秀的开发者,阅读代码库并弄清清楚内部是怎么回事的能力非常重要。在你的职业生涯中你会中途加入一个现有的项目并被要求迅速融入进去。或者,甚至更难,会有一个项目丢给你让你自己一个人搞清楚。最坏的情景就是你被带入一个项目,要你替换掉让工程运行失败的“那些肆无忌惮的*杂转载 2013-11-27 16:05:44 · 1168 阅读 · 0 评论 -
云时代的风云变换
读了IBM的云观点,我相信,他也要开始发力了在大数据的时代,云处理已经成为一种普遍的处理手段,至少目前为止,云框架还是最普遍接受,并且应用性最广泛的框架。不同于传统的分布式并行计算,云拥有者太多可以广泛的使用的特点。大数据是什么,就是青年人的性爱,大家都在谈论,可没人知道真正怎么做,大家都很感兴趣,却不知道到底是什么,都以为别人在搞,自己要假装很懂的样子, 在中国,但凡是家企业原创 2013-11-29 11:26:56 · 953 阅读 · 0 评论 -
ibm云时代的转型
好几个月了,有两个说法很流行。第一个说法,是老有人嚷嚷思科快被SDN整趴下了;第二个说法,是老有人嚷嚷IBM在云计算时代完全落后了,要倒下了。刚开始我还跟有些人辩论:1、裁员是西方企业常用的战略调整方法,对个体也许冷酷对企业却属常规;2、这两个企业不但财务状况很strong,而且技术上的leadership短期内无法替代;3、IBM也好思科也好,的确面临困难,但是它们的转型方向转载 2013-11-29 11:09:43 · 1889 阅读 · 0 评论 -
微信---风云际会霸天下
无线端的三分天下群雄逐鹿,微信一统移动无线端,广告推广线上线下,视频方向网购方向游戏唯一毒不死的 app的开发和应用 腾讯,引天下创意为我用。再加上 写轮眼似的高精尖复制团队(腾讯人全是卡卡西),土豪的推广方式。原创 2013-12-09 16:26:38 · 1294 阅读 · 0 评论 -
数据挖掘123
最近做数据处理,看了相关的工作,颇有感触。 1,数据分析的目的 提出方案,解决问题。所以,面对海量数据,先不要着急去分析。大致了解数据构成,内容,字段就可以了。否则,在数据沙漠里行走,不累死,也拖拉致死。 2,确定目标后,再筛选数据。选择你需要的数据,过滤掉无效数据(包括去除非必要字段,清洗脏数据,如去重,去空),如果是高手,可以分析出噪声数据,去掉对分析是大大有利的。原创 2014-01-10 11:06:26 · 1361 阅读 · 0 评论 -
那些超级成功的公司(看着不错,自己收藏)
转载自:http://blog.jobbole.com/56392/原文链接:Sam Altman 翻译:伯乐在线-周杰译文链接:http://blog.jobbole.com/56392/最近我一直在思考一个问题:那些超级成功的公司在初始阶段都做了些什么。我想到了如下几个方面。纯属个人经验,难免有不足之处。尽管有许多不太成功的创业公司也做了转载 2014-01-23 14:07:49 · 912 阅读 · 0 评论 -
BDA大数据处理流程
可以看出,数据处理用云,可以高效完成。而分析部分应该利用传统的bi工具。原创 2014-02-10 09:51:50 · 2311 阅读 · 0 评论 -
双马博弈:阿里死不了,腾讯路还长
腾讯未必生,阿里未必死http://www.huxiu.com/article/27176/1.html?src=se6_newtab 看了最近很多这样,说微信和阿里的文章。而且很多言者,都是信口胡说,自己意淫。当然其中不乏少数人拿数据说话的,认真分析了现有市场情况。(当中大部分喷都是为了博出位,聚敛名气,炒作,这在互联网圈很常见,我就知道几个,并且还不幸的和某人有过一次非常不愉快的谈原创 2014-01-29 17:17:27 · 1015 阅读 · 0 评论 -
地幔是报仇的利剑
地幔集团 (Digital Matrix Group) 是一家提供"互联网全程数字营销技术和服务"的提供商汇聚了业界最优秀的互动营销专家和互联网技术顾问原创 2014-05-16 13:07:21 · 970 阅读 · 0 评论 -
计算机编码方式详解(Unicode、UTF-8、UTF-16、ASCII)
整理这篇文章的动机是两个问题:问题一: 使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢?我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节,分别是FF、FE(Unic转载 2014-04-11 14:37:22 · 1536 阅读 · 0 评论 -
易迅,生的霸气,死的窝囊
数年前,我想做一个区域资源优势,服务本地的平台,去跟一个风投谈。人家以为我是忽悠钱,直接拒了。数月后,易迅以迅雷不及掩耳盗铃之势,席卷全国,各地基站纷纷建立,物流整合。让我苦叹:人家的命! 但事事难料,不知道,腾讯是出于什么考虑,是树敌太多,是累觉不爱,还是资本运营出现问题,居然放弃了电子商务。整体投给京东,人家这回可以痛快的喝口奶茶了。 我不明白,易迅如此有前景的企业原创 2014-07-24 09:54:14 · 1152 阅读 · 0 评论 -
个人的工作总结(和工作规划)
写在前面:结合我的工作经验,我对未来工作做出了一些规划。算是想法的总结,我希望能达到有效的沟通。请指正我哪里有不合适的。告诉我哪里能做,哪里不能做,哪里不足。 现在,我已经养成一个engineer思维,所以我可以教授如何像一个engineer一样思考。 思维方式:Engineer和scientist的思维方式,完全不同。 Scientist:why原创 2014-07-09 14:56:42 · 3190 阅读 · 2 评论 -
一分钟先生: 程序员面试真经
看见万兴所以就分享了,这是我本科毕业后签的第一家软件公司,当时感觉好累啊,所以就读研去了,没有去。现在才发现其实相对轻松了。作为面试官,在面试程序员时,都会关注哪些问题?而程序员应该从哪些方面做好面试的准备?本期话题相信对面试官和程序员都会有所启示。刘秋伟 深圳市万兴软件有限公司研发总监与其他岗位相比,程序员相对来说会内向一些,思维也会更严谨、更有个性。企业招聘程序员就是要转载 2013-11-06 13:42:45 · 1543 阅读 · 0 评论