天猫双11背后的力量:每秒54.4万笔订单是如何完成的?

天猫双11背后的力量:每秒54.4万笔订单是如何完成的?
2019年11月21日 15:20 界面

新浪财经联合黑猫投诉、微博航空,开启航空公司“金凤奖”评选,快来选出为你提供全方位、专业、安全服务的航空公司吧。【我要投票

  原标题:揭秘天猫双11背后的力量:54.4万笔/秒订单是如何顺利完成的? 

  记者 | 肖芳

  今年双11,阿里巴巴旗下平台总的交易额再次创记录。

  根据官方公布的数据,天猫双11的总交易额达2684亿元,同比增长25.7%。今年双11零点刚过1分36秒,成交总额突破100亿元,成交速度比去年更快。今年的订单峰值达到54.4 万笔/秒,是2009年第一次双十一的1360倍。

  今年,阿里巴巴平稳度过了世界级的流量洪峰。而11年前天猫双11刚刚诞生时,虽然订单量和现在相比微不足道,但系统崩溃频发。第一个双11夜晚,阿里巴巴技术人员都在抢修系统中度过。

  变化的背后是阿里巴巴技术力量的升级——今年阿里巴巴核心系统100%跑在阿里云公共云上。

  54.4 万笔/秒订单背后的秘密

  双11前两个月,阿里巴巴完成了将数以十万计的物理服务器从线下数据中心迁移到云上。这是一个浩大的工程,但前端的消费者毫无感知。

  阿里云近三年投入巨大资源研发出来的神龙服务器,是54.4万笔/秒订单的峰值能够平稳度过的保障。54.4 万笔/秒订单是什么概念?阿里云智能基础产品事业部研究员张献涛表示,其他公司可能还在为1000笔/秒的订单做斗争。

  神龙服务器能够实现稳定、高性能的关键是对云计算性能损失的优化。张献涛表示,业界通用的性能损失是10%,有些业务还要高于10%,这是云计算甚至在整个IT系统方面的历史遗留问题。

  过去十几年,服务器的架构没有太大的变化,芯片厂商、软件厂商、服务器厂商都在寻求创新,把自己的产品做得更强。但无论是这些产业链上的厂商,还是大大小小的互联网公司,此前都没有动力去对整个服务器、计算架构进行全面的衡量和设计,提升性能。

  在张献涛看来,云计算时代到来让行业变得不一样,最大的优势是资源集中化。可能中国未来只有1-2家公共云计算厂商在提供服务,它的每一个架构的改进和改良,带来的收益可能都是巨大的。

  神龙服务器对现有的IT系统进行了大变革,把芯片、软件、服务器厂商原来松散的关系整合起来。阿里云在思考下一代计算架构应该怎样定义的基础上,让芯片、软件、服务器厂商以此来设计产品。

  2016年,阿里巴巴CTO张建锋提出要把IT系统方面的性能损失降为0。今年9月的云栖大会,阿里云发布第三代神龙架构,终于把CPU和内存都做到了性能零耗损。

  不可忽视的算力

  双11当天,阿里巴巴处理了970PB的数据。一个可以对比的数字是,央视拍了几十年的节目,存下来的数据是80PB。

  支撑双11大规模算力的是流计算系统和飞天大数据平台。在系统和商家调度上,流计算系统发挥了重要作用。比如,双11当天商家会提前备货,当预测商家主推的商品卖得太快时,飞天大数据平台会给商家提示改变一下策略,不要开场就缺货;当预测主推的商品销量达不到预期时,飞天大数据平台会提醒考虑商家发优惠券拉动销量。

  阿里云智能计算平台事业部研究员关涛表示,2018年双11,实时推荐给商家的智能决策,90%都会被商家采用,比如系统认为商家换一个主推款更好或者推优惠券出去,几乎商家都会跟着做。

  在消费者端,飞天大数据平台实现了淘宝首页的千人千面。关涛表示,今年双11,淘宝不仅做到了展示商品的千人千面,还做到了同一件商品我们会有上千种不同的视频封面。同时,还可以在数千款商家和用户自己上传的视频中挑选出最合适的内容。

  过去几年,飞天大数据平台已广泛服务于电商、工业、医疗、农业、气象、教育等诸多行业企业,帮助数万企业用更低成本、更高效率计算海量数据,为社会和消费者提供服务。比如,在交通领域,城市大脑在杭州实时指挥1300个红绿灯路口、200多名交警。从2016年到2018年,杭州从全国最拥堵城市排行榜上下跌52名。

  不一样的双11

  在今年双11的媒体沟通会上,阿里巴巴集团CTO张建锋表示,阿里云在技术上完成了四个方面核心突破:

  第一、在核心虚拟机系统上,自研神龙架构,用自研的服务器来做虚拟化。神龙服务器在压力很大的情况下,输出也是非常线性的。

  第二、自研了云原生的数据库,今年双11上,没有任何问题。

  第三、计算与存储做了分离,数据都是从远端存取的,存储可以很方便的扩容。

  第四、做了RDMA网络,能够做到在远端存储,能够比本地读写磁盘更快。

  阿里巴巴淘系技术部资深技术专家洪海表示,电商业务的不断演变,千人千面的个性化推荐,直播短视频等媒体互动形式的崛起,所需要的资源的弹性需求越来越大,这些变化都让电商的研发模式升级变得非常迫切。

  今年双11之前,阿里云的技术团将电商核心业务全部迁移到公有云上,同时电商的基础设施也转变成了存储计算分离的模式,充分的利用了神龙服务器的计算能力和盘古的存储能力,摆脱了过去单台机器既要处理计算又要处理存储的情况,大幅提升了机器的利用率。

  双11期间,近200万个容器支撑着电商的核心系统,在商家侧阿里巴巴的技术团队为商家快速的扩容了5.4万核,峰值每秒帮助商家处理87万笔订单,向商家提供了410亿次的调用。

  “这些都是双十一背后的技术力量。”洪海表示。

责任编辑:阮璐阳

天猫双11 阿里巴巴

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 11-22 普元信息 688118 26.9
  • 11-22 建龙微纳 688357 43.28
  • 11-21 华辰装备 300809 18.77
  • 11-21 祥生医疗 688358 50.53
  • 11-21 中科海讯 300810 24.6
  • 股市直播

    • 图文直播间
    • 视频直播间