张亚勤[微博] 微软[微博]全球资深副总裁 微软亚太研发集团主席
演讲主题:信息技术 重塑商业格局
张亚勤:我可能最后一分钟改了好几次话题,开始想讲讲第三次工业革命,但是感觉太宏观了,看了一下,今天是行业论坛,还是讲讲行业方面的事情。
我最近一直在谈一个话题,就是三个平台的问题,看一下IT产业过去十年,未来的五到十年,整个竞争有很多方面,有新的技术,包括新一代的界面,大数据、云计算、SNS network,以及很多的数据挖掘、机器学习,更重要的,IT行业集中在几个方面,尤其是三个平台。
第一个是云平台,云现在可以看到,有亚马逊[微博]、有微软,有Google、IBM[微博],很多跨国企业在花巨资建立云计算平台,国内很多企业也在做这样的事情,就是Cloud platform。第二个是PC的Platform,还有Smartphone,微软、Google、苹果,上演三国演义,我觉得很难有在这三个操作系统之外形成。
还有运用手机、汽车、电视以及所有的智能终端,Windows8推出之后,第一个月销售四千万,比Win7首月销售还要好,是有史以来卖得最好的系统软件,另外windows phone8推出之后,也是受到欢迎,包括HTC[微博]的mobile也是卖得很好。现在的Win8产品是去年同期整个销售量的四倍。
整个来讲的话,可以看到在终端操作系统平台上面,有一个很大的瓶颈,第三个平台是介于云和端之上的,社交、商务、通讯平台,包括Facebook,包括微信、包括Skype,已经比较成熟了。
为什么争夺这个平台,云的平台之外,将来的五年十年,新一代的IT格局会有主导权、话语权,更多是平台之上的这些新应用以及软件服务,或者说大数据。为什么说大数据最近变得这么火,如果大家从事IT产业的,特别是从事研究的话,会发现大数据做了很多年了,忽然这一两年之内成为主流,忽然怎么时髦起来了。
我觉得有三个重要的V。
第一,数据越来越多,讲产业,讲三个V,就是海量数据现在每两年的话,数据量就Double,在2010年年底,全球的数据量超过了2个Terabyte,过去两年是有史以来的总和。
第二个,V就是数据它的多元化,现在的数据,有各种各样结构化的、非结构化的,有互联网产生的,有手机产生的,有实时信息,有离线信息,这些信息给我们过去的数据库技术以及存储带来挑战。
第三个V就是速度越来越快,位置信息,传感器数据信息,毫秒级的处理。
另外一个驱动力就是云计算的兴起,人类历史上有如此之大的存储计算能力,而且造价越来越低,我们以前采集存储一个Terabyte是16万美金(音),但是现在不到一百美元可以存储一个Terabyte。
云计算和大数据是什么关系?其实是一个硬币的两边,由于云计算,所以我们可以处理大数据,由于大数据,我们需要云计算,所以云计算应该是我们在大数据里面,是云计算时代的杀手级应用。就像在PC时代是Office,在互联网是浏览器搜索,在云计算就是大数据杀手。
第三就是机器学习、数据挖掘,包括多少年研究的新理论算法,现在越来越成熟,可以使用大量数据,从很大量的数据,怎么样变成信号、怎么变成知识、怎么变成信息,最后成为决策,这个远远比收集存储数据更加重要,最后获得Date information。
第四个V就是Value,大数在很多领域都已经使用了,我经常举的例子,美国总统大选,两个月之前,看一下奥巴马团队利用大数据,很聪明的一个团队,这个团队有一个首席科学家,本人就是数据挖掘专家,他上一次竞选很好的利用了社交网络Facebook和Twitter,这次用更先进的数据挖掘和人工智能工具挖掘。比如通过数据的分析,在西部很多三十到四十岁的女性比较喜欢他,所以通过跟他的合作,得到了很多选票。
同样发现在东部,有一个演员叫Sara(音),也是深受四十多岁女性和三十多岁男性喜爱,也是通过这样的方式,通过精准数据的分析,找到了摇摆的选民,投给了他们。
另外一个例子,就是纽约警察局,到纽约去,在八十年代、九十年代,都很紧张,纽约四十二街这一块是最危险的地段,你现在去纽约,会发现纽约是全球最安全的城市,这里面很重要一点,就是利用了数据分析,到现在的DAS系统,大胆使用数据库,思科和微软开发的数据库,进行了智能分析,清晰锁定犯罪嫌疑人痕迹,犯罪地点,多种数据进行融合,降低了犯罪率。
另外大数据在科技方面也有很多的使用,我的一个同事叫Jemy Ly(音),做数据库的鼻祖,他07年提出了科学的第四范式,他的什么理论?在早期,我们做科学研究,更多的通过是观测天空、行星,找出一些模式。到了后来,通过方程式、公式,把物理现象通过科学公式来描述。到了后面八十年代后,计算机发明了,运用计算的能力,找到方程式所找不到的东西,大家很多人使用这些工具,现在数据越来越多,所以建立新的第四范式,就是很多科学分析,根据方程式、根据观测、根据计算机计算、根据大量数据进行科学研究。这些在整个科学界是很大的震动,可能会改变进行科学研究的方式。
微软做大数据很多年了,一方面是基于思科大的系统,第二个是基于开源的非结构化数据大的系统,我们最新的系统很好的融合结构化和非结构化的两个优势,结构化的设计好处是什么呢,它的整个ETL系统,是十分严密的、很精确的,有一个输入就有一个输出,在最短的时间做相应的反应。
新的大数据,没有结构化的优势在哪里呢,是说好多数据,有一个输入,我不知道会有什么输出,这是最大的区别,我搞不清楚我的系统会告诉我什么,这是目前大数据和过去商业智能数据很大的区别。我们最新的系统,有一个叫Pony base(音),很好的把非结构化和结构化的、关系型的和非关系型的、封闭的和开放的融合起来,对整个行业会有特别重大的影响。
总结一下,我们现在IT处于一个大变革时代,我们从PC走向互联网,从互联网虚拟社会走向更加物理真实的社会,大数据成为新的货币、新的能力、新的竞争力,所有企业要有大数据战略,如果没有这个战略的话,就会形成一个鸿沟,被打到沟的另一边。我的新词汇就是数据鸿沟,希望在座各位小的企业、大的企业,都能够很好的利用数据,把数据从虚拟黄金变成真正的黄金,谢谢大家。