【fraud detection】点击欺诈丛生 中国互联网广告一场骗局

艾瑞发布的数据报告显示,2011年中国互联网广告市场规模达到511.9亿,超过报纸广告规模453.6亿。预计2012年达790.9亿,2015年将达1873.2亿。这一串数据让我们惊叹互联网吸金能力的同时,也对互联网广告的价值多了一份探寻。如此庞大的投放金额背后,广告主收获的回报又有多少?

   有人说,中国互联网广告就是一场骗局。最基础的网站流量就是作弊的,后面的分析又怎能有效?所谓效果营销平台、联盟其实就是有组织的作弊,对下游渠道扣量,上游客户刷量……中国互联网广告的生态环境令人担忧!在传统广告模式下,“我知道广告费有一半被浪费了,但我不知道被浪费的是哪一半”;在互联网广告模式中,“我知道有人点击了我的广告,但我不知道这是不是我需要的”。一、中国互联网广告业的虚火1. 点击欺诈已成行业“潜规则”2011年互联网广告规模排行显示,百度143.6亿,位居第一,淘宝87.9亿,位居第二。谷歌中国36.5亿,位居第三。无论是百度、谷歌,还是雅虎,目前都采取CPC(每次点击付费)计价模式。无论是谁,只要每点击一次广告,广告主就必须支付一次点击的费用,CPC价格高低取决于关键词的热门程度。这种竞价排名服务已经成为搜索引擎公司最主要的收入来源。互联网虽是一种较为直接、有效的广告媒介,但令广告客户感到困扰的是,网络广告受到的点击有很大一部分都属于“欺骗性点击”。美国咨询公司Click Forensics通过对1300多家广告商的调研得出结论:在搜索引擎广告中,有14%的点击量为欺诈性点击。在国内,恶意点击也已经是行业公开的秘密,已经成为整个行业的“潜规则”。据北京正望咨询有限公司2007年3月的一份调查报告显示,百度的平均点击欺诈率为34%,而Google也达到24.1%。愈演愈烈的点击欺诈已成网络广告的梦魇,它或将毁掉网络广告的未来。如今,已经有一些大广告客户发出警告,如果搜索服务提供商不能尽快解决点击欺诈的问题,他们将削减网络广告支出。百胜集团媒介事业部张之彦副总监认为:目前互联网假流量、假点击率现象频频,如果说投入传统广告的广告费一半是被浪费掉的。难道投给互联网的广告费就一定百分百有效吗?互联网广告行业横生劣币驱散良币的现象,亟需有一个系统的评估体系,来评估互联网广告的有效性。2. 互联网广告的“作弊”产业链点击欺诈等互联网广告弊病之所以得以滋生,因为产业链上的几方可能形成“共谋”:以搜索引擎自身为广告发布载体的广告模式涉及广告主、广告代理商和搜索引擎公司三方利益实体,而广告联盟比前者更多了个人站长这一利益体。只要形成点击,广告代理商、搜索引擎和个人站长三方均可获益,只有广告主被孤立。也就是说,对能够带来巨大流量及点击量的联盟网站,搜索引擎们如果试图严格执法,就必须牺牲自己的利益。同样的问题存在于广告代理商一端。搜索引擎公司分次对广告代理商进行返点。行业内人士称,广告代理商可获得的返点最高可达70%,即使极为苛刻的Google,也会返点40%。这一交易方式决定了广告代理商不希望任何一个季度的业务量低于预期。点击欺诈,从根本上说,不是一个技术问题,而是一个商业模式问题。此外,我国到目前为止并没有将搜索竞价这种网络推广方式列入广告管理范畴。缺乏相关认定标准和管理制度的有效监管,也是互联网广告业弊病丛生的一大原因。3. 社会化营销中的“水军阴影”微博等社会化媒介现已成为全球最热门的研究焦点,随着Facebook推出搜索引擎和社区电子商务,尤其是Facebook的流量已超过Google,成为互联网最大的入口。很多企业已开始停止搜索引擎的营销投入。在中国,越  来越多的企业加入微博,微博营销在中国已经成为一种新的产业,如何在微博上加大营销投入成为企业关注的重点。一般有6个数据来衡量微博的应用程度:关注数、粉丝数、微博数、转发数、收藏数和评论数。但在中国,这些衡量的标准并不准确,中国特有的网络公关的“水军文化”导致社会化媒介营销泛滥。新“微博营销”正在向“灰色产业”转变,形成一种网络舆论营销行业:倒卖粉丝营销虚假繁荣、刷屏转发引发逆反情绪、恶意攻击透支企业信用、抢注官博造成信息混乱……有的企业一夜之间“粉丝”数量上升到几万人,但大多都是“僵粉”(指微博上的虚假粉丝,花钱就可以买到“关注”,有名无实的微博粉丝,他们通常是由系统自动产生的恶意注册用户)。目前甚至出现一些社会化媒介营销专业公司,往往拥有上万个虚拟账号,不同的账号模仿不同年龄和职业状态,并以相应的口气回复客户的微博。在发生对企业不利的舆论时,这些虚拟“粉丝”会发正面评论,以扭转舆论方向。有趣的是,一般发30个左右的正面评论后,负面的舆论会发生转向,一些不明真相的网民也会自发跟进做正面评论。这种独特的“水军文化”,使中国的社会化媒介营销应用效果发生了变异,也使得企业通过社会媒介与用户透明沟通的效果减弱。二、中国互联网广告价值有待商榷1.整体价值偏低且优质资源匮乏网络广告的最大优点在于能够直接引发行动,因而促销是广告主选择网络发布广告的首要原因。但中国网民的平均收入偏低,中国互联网的电子商务远远不及美国电子商务发达,中国互联网广告价值偏低。与电视媒体一样,网络媒体也面临通货膨胀的压力。以视频媒体为例,2012年优酷和土豆等视频网站的前导广告成本上升了约50%,成本的上涨必将推动广告价格的上涨,但网络视频的广告价值认可度并未跟上其价格的上涨幅度。互联网广告市场规模虽然高达500多亿,但每年互联网优质的广告资源不到10亿元规模。对于有实力的买家,问题是没广告可买,而不是没钱买。2.媒介特性制约投放热情首先,和电视等传统媒体相比,网络广告的覆盖率还较低。覆盖率的增长将在相当长的一段时间里受制于计算机和电话的普及。其次,供选择的广告位有限且创意局限性较大。目前网络广告的形式不外乎“旗帜广告"和”图标”等,而每个网页上可以提供的广告位置是很有限的。网络广告现在最常用的尺寸是468*60(或80)像素,相当于15*2厘米左右,要在这样小的广告空间里形成吸引目标消费者的广告创意,其难度可想而知。最后,调研数据匮乏效果评估困难。国内至今还没有完整的有关网上人口形态的调研、网络消费习惯的调研、网络广告的流量监测和网络广告效果的调研;尚未有一家公认的第三方机构可以提供量化的评估标准和方法。3.广告主集中于电商,价格虚高登录新浪、搜狐、网易等门户网站可以发现,广告主多为互联网电商行业,数量平均在十家左右,电商网站已成门户网站广告投放主力。事实上,互联网广告价格是跟着电商走。去年一二季度,电商尤其是团购业坐拥VC巨额融资,砸钱推广几乎成为投资方提出的任务。可以说电商企业在推广上的较劲,一时间将互联网广告价格哄抬至高点。目前各家电商鲜有融资,电商资本趋紧,行业进入寒冬期。网络广告价格尤其去年过分依赖电商资本的互联网广告形式(如导航网站和垂直电商类广告运营商),在今年均难逃价格下跌的厄运——去年上涨10倍的电商导航网站广告价格,今年遭遇腰斩;而门户网站广告涨幅也由去年的50%跌至15%。目前互联网广告价格仍在死撑。三、互联网广告投放“唯点击率”不可取1.  广告曝光量、点击量≠网络广告的投资回报目前网络广告所普遍采用的CPM、CPC、CPA等统计模式,作为一种数据指标,这种方法应用于结算、成本控制、创意效果监测等方面是可行的,但作为广告投资回则有些过于简单偏颇。和电视广告收视率指标一样,多少人看到、点击广告只能说明你在媒体选择或广告设计上比较成功,但不等于广告所传达的内容、品牌形象就深入人心了。广告投资回报率应该是一种延时效果,在这方面网络广告和传统广告本质上没有区别,只是因为网络广告具有互动性,所以容易把即时的互动效果(特别是点击)混淆为网络广告投资回报率,而电视广告就基本不会有这样的问题。2. 照搬电视广告模式 有违精准投放原则艾瑞联合总裁邹蕾认为,目前互联网广告效果评估标准比较偏向广告主一方。按目标群等电视广告的模式,有利于广告主,但不符合当下互联网广告精准投放的原则,肯定会造成浪费。以电视广告为例,尽管广告目标群设定为18-25岁,但广告在此年龄段外的观众群肯定也进行了一定曝光,但电视无需为此付出成本。互联网广告有所不同。如视频广告多一次点击,就会产生相应的带宽成本,那么目标群以外的人点击视频所产生的成本,只能由媒体来负责,这样势必无法达到媒体与广告主的共赢。因此完全平移电视广告模式是不够的,需要有更多互联网特色的设定。3. 不同投放诉求决定不同效果评估维度单从对受众的影响来看,网络广告和电视广告最核心的差异是“电视广告=不得不看,网络广告=想看就看”。我们无法证明哪个广告载体更优秀,只能说明当产品应用、行业特性、企业需求与互联网的互动性、自由性、多样性相结合时,要明确一个合适的效果诉求。不同的行业和产品对网络广告的效果诉求不一致。不同广告主,在相同位置投放且曝光量相等的情况下,所产生的点击效果、参与效果、认知效果肯定是有差距的。有很多广告主从一开始就对网络广告效果诉求不清晰,从而导致了对效果评估的偏差。4. 关注“点击后行为”,做深用户体验网络广告的实体构成应该是投放媒体、广告创意和广告主网站(minisite)的三结合,如果将网络广告对每个受众所产生的传播效果在流程上进行分解,应该是覆盖网民-吸引注意-诱导点击-继续浏览-持续关注这样一个流程,而每个环节都需要利用好互动性。但很多广告主只关注覆盖量(曝光量)和漂亮的广告创意,而相对忽视对“点击后行为”的设计,缺少对网络受众的深度浏览以及持续关注行为的引导,往往是有能力瞬间聚集上万受众的点击,没能力在三天内留住一个人关注,这也是严重影响网络广告投资回报率的原因之一。最后,笔者想说,互联网广告并不具有压倒性优势,反而有许多根本问题无法解决。互联网广告业应该寻求更有效率的商业模式,不然在未来内必会遭遇瓶颈。

IEEE-CIS Fraud Detection is a Kaggle competition that challenges participants to detect fraudulent transactions using machine learning techniques. KNN (k-Nearest Neighbors) is one of the machine learning algorithms that can be used to solve this problem. KNN is a non-parametric algorithm that classifies new data points based on the majority class of their k-nearest neighbors in the training data. In the context of fraud detection, KNN can be used to classify transactions as either fraudulent or not based on the similarity of their features to those in the training data. To implement KNN for fraud detection, one can follow the following steps: 1. Preprocess the data: This involves cleaning and transforming the data into a format that the algorithm can work with. 2. Split the data: Split the data into training and testing sets. The training data is used to train the KNN model, and the testing data is used to evaluate its performance. 3. Choose the value of k: This is the number of neighbors to consider when classifying a new data point. The optimal value of k can be determined using cross-validation. 4. Train the model: Train the KNN model on the training data. 5. Test the model: Test the performance of the model on the testing data. 6. Tune the model: Fine-tune the model by changing the hyperparameters such as the distance metric used or the weighting function. Overall, KNN can be a useful algorithm for fraud detection, but its performance depends heavily on the quality of the data and the choice of hyperparameters.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值