扫盲:如何进行流量造假 剖析虚假流量的原型

网络技术    2009-11-10 18:08  

  这是一个诱人的标题,不管你是正义的还是邪恶的,都欢迎你来阅读。因为正义与邪恶的共存,促进了事物的发展。

  俗话说,道高一尺,魔高一丈(While the priest climbs a post, the devil climbs ten)。没错,“道(Priest)”永远是慢“魔(Devil)”一拍。流量造假已寄生于网络营销的整个过程。

  本文将“陈列”时下常见的流量造假方式,并努力将其剖析得“体无完肤”(Critics pulled traffic fraud to pieces)。

  如果你想尝试开始流量造假,可以参考下方所谓的造假价格列表。

Www.Hdut.Com

  Level One: “原始社会(primitive communes)”

  Case A:在Cookie与IP不变的情况下,反复地点广告。

  造成 Ads 的 Click 增加,如果造假者愿意(等点击后的页面打开),还能造成 Landing Page 的 Pageview 增加。

  Case B:在 Cookie 与IP不变的情况下,反复地刷新页面。

  从 Ads 的角度,会造成 Impression 增加;从 Site 的角度,会造成 Impression 增加。

  总结

  在这个阶段的流量造假,是非常简单粗暴的,基本上所有的专业监测工具都能发现这种愚昧的行为。尽管如此低级,这种流量造假的组织或者个人还是乐此不疲(Always enjoy it)。因为这种方式效率高且技术含量低,编程容易实现。有时连自然人也会参与,他们与流量有着直接的利益关系。

  危险提示:请勿对自己 Google Adsense 广告进行尝试,否则保证一周内收到 Google Adsense 协议中止邮件。

  Level Two: “奴隶社会(slave society)”

  Case A:一定频率地清除 Cookie。

  反复地清除 Cookie,对于程序来说非常容易实现。很多监测工具的监测是基于 Cookie 的。Cookie 的清除,意味着每一次的访问都是一个新的 Visitors。

  Case B:召唤肉鸡,或者购买流量。

  有钱能使磨推鬼(Money makes the mare to go)。有些组织或者个人,会花10块钱购买流量进来,然后卖出的广告资源却能赚100块。如果没有分析师去监控网络营销的效果,在中国基本上50%以上的钱都会打水漂(当然剩下50%中按照基本的广告原理又浪费了一半)。

  总结

  这是时下最普及的造假方式,造假者不仅追求流量的增涨,还开始了海量化,并且具有基本的反侦查能力。然而这种造假还是较容易被发现。前提是你必须使用第三方监测!这里有两条建议:

  1.选择专业的第三方监测工具。

  一个专业的监测工具,能帮助收集足够的信息,而这些信息是打击造假的重要证据。

  比如广告监测工具,可以监测到广告点击者的 IP 与 Cookie。那么在监测工具中生成的 Report 中,就很清楚地看得出:Case A的情况同一个 IP 的人在变化 Cookie 在进行点击。

  2.从Engagement Level去分析。

  不要仅仅停留在Impression、Click、Pageview、Visits这种“Volume”式的度量上,更多的还需要考虑 Bounce Rate,Converions Rate,Action Rate 这种“Engagement”式的度量上。买来的流量,或者不相关的流量,自然地 Engagement 就会很低。

  Level Three: “工业革命(Industrial Revolution)”

  Case A:一定频率地更换IP,甚至连Cookie也一起清除。

  这种方法能让一台PC造成上成千上万个独立访问。不过变化IP地址实现起来较为复杂,变化IP地址段更为难实现。最简单的更换IP方法就是通过不固定IP的宽带拨号上网,但IP段一般不会有大的变化。

  所以如果有组织能采取这种方式作弊,说明已具体较强的技术实力与网络资源,基本上广告端的监测工具就开始捉襟见肘(have too many difficulties to cope with)了。

  Case B:剥离监测代码,到处乱放,或者软件虚拟执行。

  广告的监测代码不是绑定的也不是加密的,可以随意的剥离,到处使用。比如广告主A的广告代码可以加到广告主B的广告素材中。这样广告主B的广告显示了,广告主A也被统计了。这种作弊,我是屡见不鲜了。

  另外还有是软件虚拟执行,这是唯一一种我未验证的造假方式,但这种方式被许多人所假设。事实上,我曾规划过的程序上的实现机制,从理论上这是完全可行的。只需要一台服务器,一个程序与一些访问者。

  Case C:引入流量,并点击指定页面链接。

  前面我谈过从 Engagement Level 进行分析可以很大程度上发现流量造假。可是如果流量访问后,再进行点击怎么办呢?这时 Engagement Level 的分析方法就开始受到挑战了,可能会行不通。

  这是非常高级的流量造假,已经深入到Engagement Level。这种情况下,Bounce Rate 可以优化得非常的完美(50%-70%),甚至是极度不可思议(低于40%)。

  专业的“造假师”(虚构职位),可以让访问者分散地点击页面中的关键内容,并控制 Bounce Rate 在70%左右。这样,你会发现,自己的 Landing Page 惊人的好,而且用户的点击分布也非常的合理。

  总结

  这个层次的流量造假已经开始兴起,并且承结合之势(即Case A B C相互结合)。这时候普通的监测工具已经是完全失效了,这时需要的是专业的分析师(事实求是,我没在做广告)。分析师可以从数据结构、流量漏斗(Traffic Flow)、自定义监测、创新度量多个角度来结合分析。就像破案,再悬疑的奇案,好侦探也能破案。

  ——————————华丽的分割线———————————

  IP Cookie Browser总的来说,流量造假离不开三个元素:IP、Cookie、Browser,通过对三个元素的控制与变化,让监测工具表现上难分虚实。

  流量造假已经是互联网的一个产业,是一个潜规则,是许多网站赖以生存并持续发展的兴奋剂(exhilarate)。我不过是皇帝的新衣(Emperors New Clothes)中的小男孩,说几句话实话而已。不管在中国乃至世界流量造假现象如何猖獗,假的始终是假的!它们都有蛛丝马迹能被分析师发现他们的虚假性。

  当然我不排除有组织或者个人能够制造中与正常流量几乎一致的假流量。但我相信与其制造这种高质量的假流量,还不如真真实实地把自己的网站做好,吸引网友来得划算。

  最后对于网站所有者,希望踏踏实实地(down-to-earth )建站;对于广告主,希望小心翼翼(meticulous)地花钱。

  原文地址:http://www.ectend.com/2009/traffic-fraud/

在线留言

我要留言