360首席架构师刘鹏谈互联网变现与计算广告 |
时间: 2015/10/14 19:27:03 点击: 52695 |
进入到市场里面,是第一方数据,第一方是指广告主。前面我们说的那么多数据,母婴也好,都是供给方给的定义,但是会有一些定义,比如说京东,我的流失用户这是我自己的定义,别人没有任何能力给我定义,因为你没有这个数据,前两个月来过京东,现在不来了,谷歌的数据再强你也不会知道。我希望用我的数据来影响我的营销。这种数据的价值是极高的,甚至远远超过第二方数据的价值。要想这种数据用起来,交易过程中,我没有办法预先开出来这样一个数据的展示让你来买。现在大家认为比较先进的合理的模式就是程序化的模式,我实时问你,我这里有一次展示的机会,在这个展示即将发生的那一刻,我把请求送到京东的服务器,问你一下,你要不要这次广告展示机会,你如果要,你自己定一个价格传给我,仍然是需求方定价。除了定价以外,把这个选择的机会也都交给需求方。这盘活了很多东西,比如说今天的数据交易,如果没有需求方选择模式,数据交易量没有这么大,数据交易是程序交易规模化运转起来以后,才成为一个选择。
上面这个框是广告交易,下面这个框是数据加工和交易,但是下面这个是广告市场重要的支撑,如果你对数据感兴趣,对大数据的价值和交易感兴趣,广告里面的产品你是不能忽视的。因为这里面你确实已经做过很多东西了。它远远先进于其他行业所做的广告交易。 在这儿解释一下三方数据的概念,广告平台是第一方,广告主是第二方,其他的不跟广告关系的是第三方。 广告系统是一个典型的个性化系统,它由一个在线的投放引擎,一个分布式计算平台,分布式计算平台现在我们一般用的是Hadoop,对于大量的海量的数据,我要对十亿的Cookie,历史上三个月的数据做一次很浅的分析和挖掘,像这样大规模的数据,现在Hadoop仍然是唯一的选择,用spark也做不了,spark适合中等建模。他们两个长期共存,各有各的优势。机器性能越来越好,spark的能力越来越强,数据增长的速度比机器性能增长的速度还要快。流计算我们会用到,它的功能跟分布式计算平台是一样的,一个处理长时,一个处理短时的。 这个系统数据都是环形流动,尽量避免单点、高在线的同时读写。跟线上打交道的所有环节应该没有关系型数据库。你可以看出一个真正的大数据系统跟传统的商业智能和数据挖掘不一样的,尽量避免碰数据库,如果你线上系统发生了与数据库的数据交换,你一定不是一个自由体,一定是不太对的。他一定是更轻量级的,吞吐量更高的、容错量稍微高一点的系统来实现。 数据交易是很有意思的一个问题,国内最近有两个数据交易所,一个是贵阳交易所、一个是长江交易所,我也关注了他们做的事情,我觉得很好,让大家认识到数据的价值,并且想办法用商业化的方式来运作数据,因为如果你不以商业化的方式来运作,这个数据很难用起来。可是我又看到他们在交易机制上的设计,或者他们对交易数据的
本文标签:360首席架构师刘鹏谈互联网变现与计算广告 |
上一篇: 地方网站:别再用BBS的思维做APP 下一篇: 企业应该为出色的SEO投资多少? |