网易科技讯 8月14日消息 2013年中国互联网大会在北京举行,网易科技全程报道。在大会间隙,总裁梅涛接受了网易科技采访,梅涛认为,数据的有效采集必须将各个平台的数据打通,这就需要一个有效的分享机制。
梅涛介绍,缔元信作为一家从事互联网数据局的公司,每年的平均增长速度在40%到60%之间,未来也希望能将大数据平台建设好,但一定是有所为,有所不为。因为大数据也是一个产业链有所分工,上、中、下游的公司必须形成互动合作而不是竞争关系。
梅涛同时指出,数据的采集,不能仅靠各家各自圈数据,而要有一个数据分享和交换中心,这样才能把不同平台的数据打通,效果会更好。
以下是梅涛采访实录:
网易科技:请您介绍一下缔元信今年的一些收入状况,和去年同期相比有一些什么样的变化?
梅涛:我们说一下业务状况吧,缔元信应该说是国内比较早开始从事互联网数据的一家公司,我们公司成立于2007年3月,实际上我们自己的话说是在今天很流行的大数据概念的前夜,我们就很幸运的提前进入了这个市场。从去年到现在,我们可以相对比较自豪的跟业界讲的一件事情,就是我们在建设一个基于互联网的大数据应用平台,也就是dmp的平台,这个平台建成之后对于包括像网易这样的门户网站更深入的做数据挖掘,做内容推荐和广告推荐等等这方面,会有很大帮助的作用。
网易科技:那您如果不能透露具体数据的话,可以说一下今年的业务增长大概是什么样的比例吗?
梅涛:我们每年年平均增长速度都会在40%到60%之间。
网易科技:现在大数据时代已经来临了,您怎么理解大数据,缔元信又是怎么整理这些大数据的呢?
梅涛:我觉得大数据现在在行业之内有n多种版本的定义和不同角度的理解,我们站在从事这个行业服务的角度是这么理解大数据的,大数据可能对于互联网行业,甚至于更广义一点的,对于it行业而言作用有点像工业化时代的石油,从某种意义上说他实际上是一种战略资源,有点像工业时代没有石油的话,可能我们一天都生活不了,车也开不动,也没有电,能源没有了。那么在这种数字化的时代里大数据就真的像石油一样,将来可能没有数据在互联网的世界里面你就寸步难行,可能什么业务都做不好。
网易科技:那您觉得大数据这个东西和隐私有什么相关或者违背的东西吗?
梅涛:你这个问题可能发自于今年“3.15”的晚会,实际上我在跟很多媒体朋友谈类似的问题的时候都会打一个比喻,其实隐私也好,包括网络安全问题也好,其实是一个动态的平衡关系。为什么这么讲呢?你如果要追求的绝对隐私保护或者绝对的安全的话,可能会给你的生活带来很多不便,举一个例子,假如你家里有十间房子,可能有三十道门,最安全的做法可能就是把这三十道门时时刻刻都锁起来,出门就锁门,但是你设想一下这样的生活会不会让你崩溃?所以隐私问题也好,或者网络安全问题也好其实是一个平衡点,这个平衡点就是你的需求和你使用某些应用的便捷程度,和所谓隐私或者安全的动态平衡。我再举一个我自己亲身的例子,在基于手机的lds(音)服务刚推出的时候我特别不适应,总觉得好象有某一个眼睛在天上盯着你,你去哪他都知道,所以当时我特别抵制这个东西,大概是三年前这个东西刚刚冒出来的时候,那个时候我还看不惯同事到哪都签到,那个时候我还跟他们开玩笑,我说这个行为跟我们家的狗很像,到哪都留记号。后来我发现当他有具体应用的时候,你就发现他是一个很有用的东西了。所谓具体的应用是什么呢?比如你新到一个城市,你可能需要吃饭和逛景点等等,可能客观上需要一个位置或者地图的服务,而且这种地图服务又不是像传统的纸质的地图,或者是传统的没有位置服务的电子版地图,他是一个能够让你用户体验更好的一种服务。当你碰到这样的服务的时候,可能你再考虑你的位置,作为一个隐私的内容之一的东西,你把他分享出去可能对你来说就不那么敏感了,这可能就是我说的,是你付出什么获得什么的动态平衡的关系。
网易科技:那您能介绍一下,比如缔元信做了什么样的事情,如何去分析这些数据,让用户更方便的得到某些东西的例子吗?
梅涛:我正好可以举一个,就是我们给网易提供的一个服务。我们在一年多以前曾经帮助网易的女性频道做过网站用户的基本特征和访问行为,以及他的偏好的研究,这个研究我们采取两种方法结合的方式,所谓两种方法结合,比较传统的方法是说我们找一些你们典型的用户做一些所谓的用户深访,那是一个小样本的调查方式,既做了一些问卷提问,也通过一些方法记录你们典型用户在使用网站过程之中的一些行为习惯。除了这个之外,我们还有一个就是比较常项的服务,就是基于我们对网易的整个全站的7x24小时的数据统计,我们做一些数据挖掘的工作,在这个基础之上再去看更大范围的,甚至于可能是全样本的网易女性频道用户行为特征是什么样子的,内容偏好是什么样子,把这几种结合到一起,能够提升网易运营的水平。
网易科技:对于未来三到五年的发展,您有什么规划吗?
梅涛:从我们公司自己的角度来说,我们就是希望把我们的大数据平台建设好,而且我们也给自己设定了一些禁区,就是我们要知道我们擅长做什么,以及我们不能或者不应该做什么,本身在互联网大数据的行业里面也是一种类似产业链或者有分工的。那么在这一块我们打个比喻来说,就是我们可能更倾向于打造一个大数据的引擎,如果是用汽车来做比喻的话,我们可能更倾向于做数据引擎,而不见得会深入到说我也去造车这个环节。这样的话我们跟众多上、中、下游的企业会形成一个在产业链上是互动的关系,而不是恶性竞争的关系。
网易科技:那您觉得未来大数据的发展方向应该是什么样的?
梅涛:我经常会碰到这样的问题,我也是用一个类比的方法回答吧。我在很多场合都说将来的大数据应用可能会像我们在现代都市里面用水的感觉,就是用自来水,什么意思呢?因为他有一定的集约化,所谓的大数据是需要把原来分散在不同的环节的数据整合在一起,你要想整合在一起的话就必须要有一定的集约化,但是这个集约化并不是通过一些非市场化的手段实现,一定是通过市场化的手段实现,可能目前的阶段大家都在圈数据,但是最后大家发现光圈了自己的数据是没用的,一定要通过一个类似数据分享或者交换中心,或者说这样的一个机制才能把不同网站或者不同平台的数据打通,因为只有把这个数据打通了以后,应用的效果才会更好。
网易科技:所以您觉得未来大数据是要通过分享才能获得更全面的分析结果是吗?
梅涛:对。