360首席架构师刘鹏谈互联网变现与计算广告 |
时间: 2015/10/14 19:27:03 点击: 52692 |
工作很有帮助。
从大数据说起,大数据这个词是一个咨询公司提出来的,这个词并不是来自于学术界。第二,也并不是来自于纯粹的工业界。这个词的立意非常好,让大家在大的场景下了解数据的价值和作用。由于它这样的起源,在中国现在的状态上,它与工业界实际发生的数据运用的现状以及学术界可落地的研究存在一定的距离,很多时候是概念到概念。所以我常常讲BIG是汉语的英译,是逼格的音译。我认为必须要找到一个落地的点来看看大数据到底做什么。 我自己对大数据的认识,我是从工业界来的,工业界对大数据最直观的认识是传统的工具用不了了,微博上有一些朋友来问我,我现在学大数据是不是应该学SASS这个软件,这让我觉得很难回答,我觉得跟那个没有关系,但是卖这个软件的人肯定跟我过不去。因为我们要了解大数据研究的是什么东西,传统的IOE的企业研究的是交易数据的加工和处理,交易数据的加工和处理是非常困难的,因为他要求正确率极高,一条都不能错,实时性要求极高,所以IOE整个这套系统就是IBM、Oracle和EMC。你别以为现在拉一个互联网企业出来就能做系统,他们绝对是吹牛。 可是互联网企业处理的大数据和IOE处理的交易数据有点不一样,我们关注的大数据是指行为数据,行为数据跟交易数据的区别,交易数据指业务实施过程中不得不计的数据,比如说存取款、利息,这些数据你不能不记,你不记你的业务没有办法开展,但是行为数据是可计可不计的数据,比如说网站的浏览日志。互联网企业一开始也不是想到要记这些数据,因为他的服务器自然而然的给它记下来了,后来他就想能不能给广告变现带来一点作用,于是他就开始挖掘这些数据。交易数据如果是1,行为数据一般都在100以上。第二,它对一致性的要求是比较低的,网站的日志丢千分之一对大多数业务都没有关系。意味着原来IOE所有架构对于处理这种行为数据是不合适的,因为它太贵,我们要用一种更便捷、更低成本的方案来处理。所以工业界我们看到的变化是我们所用到的工具完全的变掉了,去IOE化,阿里这么说他有他的技术,如果现在互联网企业一拥而上,把银行系统都换掉,那是灾难性的。可是原来IOE的你也不要轻易的说你们在做大数据,你们做的事情跟大数据严格来说也没有关系,你们还是在做传统交易数据的挖掘和整理。 这个图,A曲线,我认为的大数据是什么样的,如果数据可以采样,就不是大数据的问题,C类的数据可以采样,比如说我要统计360在各个省的用户占比,显然是我先对用户数据采样,采样十万分之一。可是你现在碰到大多大数据都拿这样的案例在糊弄大家,他们把数据大,就当成大数据。这种问题的特点是稀疏的采样数据,结果不变,或者结果的基本不变。就不是大数据的问题。大数据应该是A种曲线。什么样的问题是典型的大数据问题?什么样的问题不能采样?所谓的个性化问题,广告是一个个性化问题,我们要对每
本文标签:360首席架构师刘鹏谈互联网变现与计算广告 |
上一篇: 地方网站:别再用BBS的思维做APP 下一篇: 企业应该为出色的SEO投资多少? |