《人工智能半月刊》第八十期(2019.7.16)

《人工智能半月刊》第八十期(2019.7.16)
2019年07月16日 14:53 新浪财经-自媒体综合

来源:计算机司令部

重要事件点评

在无限制德州扑克六人对决的比赛中,德扑 AI Pluribus 成功战胜了五名专家级人类玩家,这是 AI 首次在玩家人数(或队伍)大于 2 的大型基准游戏中击败顶级职业玩家。Pluribus 由 Facebook 与卡耐基梅隆大学(CMU)共同开发,该研究已经登上了最新一期《科学》杂志。

几十年来,扑克一直是人工智能领域一个困难而又重要的挑战。原因在于,扑克中含有隐藏信息,也就是说,你无法知道对方的牌。要想在扑克中获胜,你需要 bluff(吓唬)或者使用其他策略,这一点使得在扑克中应用人工智能变得非常困难。然而人工智能Pluribus已经学会了 bluff,而且还可以看穿人类选手的 bluff。

据介绍,Facebook 和卡内基梅隆大学设计的比赛分为两种模式:1 个 AI+5 个人类玩家和 5 个 AI+1 个人类玩家,Pluribus 在这两种模式中都取得了胜利。如果一个筹码值 1 美元,Pluribus 平均每局能赢 5 美元,与 5 个人类玩家对战一小时就能赢 1000 美元。职业扑克玩家认为这些结果是决定性的胜利优势。

图:Pluribus在10000手实验中对职业扑克玩家的平均胜率,其中直线表示实际结果,虚线表示一个标准差。

理解 Pluribus 的蓝图策略

Pluribus 的核心策略是通过自我博弈的方式学习。在这一过程中,AI 和自己进行对战,不使用任何人类游戏数据作为输入。AI 首先随机地选择玩法,接着,随着决定每一步的行动后,逐渐提升性能,并对这些行动拟合概率分布。最终,AI 的表现比之前的策略版本会更好。Pluribus 中的自我博弈策略是一种改进版本的蒙特卡洛 CFR(MCCFR)。

研究人员训练蓝图策略用了 8 天,使用了一个 64 核的服务器,需要的内存数量小于 512G。他们没有使用 GPU。在典型的云计算中,这只需要 150 美元,和其他 AI 研究相比消耗很小。Pluribus算法上的提升,允许研究人员在低成本的计算环境实现极大的性能提升。

比赛时,Pluribus 在两个 CPU 上运行。相比而言,在 2016 年和李世石的围棋比赛中,AlphaGo 使用了 1920 块 CPU 和 280 块 GPU。同时,Pluribus 使用了不多于 128GB 的内存。在对每一个子分支进行搜索的时候,根据现场的情况,它所用的时间介于 1 秒和 33 秒之间。Pluribus 的游戏时间比人类专业玩家快两倍:在六人游戏场景,和自身对弈的时候,它平均每手只需要 20 秒。

图:Pluribus 的蓝图策略在训练过程中逐渐改进

从扑克到其它不完美信息博弈的挑战

AI 以前曾经在完美信息零和博弈(两个参与者)中取得了多次引人注目的成功。但大多数真实世界策略交互都涉及隐信息,且并非两个参与者的零和博弈。Pluribus 的成功表明,目前还有更大规模的、极其复杂的多参与者场景,仔细构建的自我博弈和搜索算法能够在这些场景下获得很好的效果,尽管当前并没有很强的理论支持来保证这个效果。

对于很多现实世界的交互,包括反欺诈、网络安全和内容审核等潜在都能通过 Pluribus 的方法建模。即建模为涉及隐藏信息的场景,并(或)通过多个智能体的有限交流来构建不同参与方间的联系。这项打德州扑克的技术甚至允许 Pluribus 帮助 AI 社区在不同领域中构建更高效的策略。

上市公司动态

东方网力:过户登记完成,川投信产直接持股7.4811%成为公司第二大股东。

东方网力公告,2019 年7月1日,公司收到中国证券登记结算有限责任公司出具的《证券过户确认登记书》,刘光、蒋宗文已分别将此次协议转让的5439万股(约占公司总股本6.3686%)、950万股(约占公司总股本1.1125%)公司股票全部过户至川投信产的名下,此次股份过户登记完成后,川投信产将直接持有公司股份6388.5175万股,占公司总股本的7.4811%,股份性质为无限售条件流通股,成为公司第二大股东。

远方信息:邹建军及其一致行动人因需履行补偿义务,持股将降至3.85%

远方信息公告,公司于2019年7月2日收到了邹建军等出具的《简式权益变动报告书》。根据报告书,邹建军及其一致行动人因浙江维尔科技有限公司2018年度业绩未达承诺并结合盈利承诺期届满时标的资产的减值额,需向上市公司履行补偿义务,将其合计所持有的743.825万股公司股份交付上市公司,由上市公司办理回购注销。此次权益变动后,邹建军及其一致行动人持有上市公司约1056.779万股股份,占上市公司变动后总股本的3.85%。

东方网力:监事、高级管理人员拟减持股份,预计减持不超总股本0.37%

东方网力7月3日发布公告称,监事会主席郭军计划减持公司股份不超过2,648,891股(含本数),不超过公司总股本的0.3102%,不超过其所持有公司股份总数的25%。副总经理冯程计划减持公司股份不超过492,851股(含本数),不超过公司总股本的0.0577%,不超过其所持有公司股份总数的25%。

神思电子:预计2019上半年盈利同比增长80-100%

神思电子7月4日发布2019年半年度业绩预告,预计2019年上半年归属于公司股东的净利润比上年同期增长80.00%~100.00%达到840.69万元~934.10万元。

神思电子:股东同晟达信创投收到监管函,因减持未提前预披露

7月10日神思电子公告称,股东同晟达信创投收到交易所监管函,因减持公司股份未提前预披露。

浙大网新:控股股东之股东解除一致行动关系,公司变更为无实控人

浙大网新7月10日公告,根据高校所属企业管理体制改革的要求,控股股东网新集团之股东网新资本、乾鹏科技、图灵计算机、融顺投资共同签署了《关于解除〈股东共同声明〉的确认函》,各方确认不再与圆正集团保持一致行动关系。一致行动关系解除后,网新集团仍为公司的控股股东。网新集团的实控人由浙江大学变更为无实际控制人,浙大网新的实控人由浙江大学变更为无实际控制人

汇纳科技:预计上半年净利增长53.72%-81.92%

汇纳科技7月11日发布业绩预告,预计2019年上半年归属于上市公司股东的净利润盈利2180万元-2580万元,同比增长53.72%-81.92%。

远方信息:2019年上半年净利7400万元,较上年同期扭亏为盈

远方信息7月11日发布2019年上半年业绩预告,预计净利最高可达7400万元,较上年同期扭亏为盈。

中科创达:发布2019年半年度业绩预告,归母净利润8000万元–9000万元,同比增长31.01%–47.39%

中科创达7月11日发布公告,发布2019年半年度业绩预告,归母净利润8000万元–9000万元,同比增长31.01%–47.39%。

科大智能:2019年上半年预盈4043万至5775万,一收购标的亏1800万

科大智能7月12日发布2019年上半年业绩预告,上半年预盈4043万至5775万,同比下滑超50%。去年同期盈利1.16亿元。

思创医惠:发布2019年半年度业绩预告,归母净利润7660.24万元–9119.33万元,同比增长5%–25%

众合科技7月12日发布公告,归母净利润7660.24万元–9119.33万元,同比增长5%–25%。

同花顺:发布2019年半年度业绩预告,归母净利润21976.06万元–27708.95万元,同比增长15%–45%

同花顺7月12日发布公告,归母净利润21976.06万元–27708.95万元,同比增长15%–45%。

东方网力:2019年上半年净利2562万–5124万,公司借款增加

东方网力7月12日发布2019年上半年业绩预告,预计净利最高可达5124万元,比上年同期下降60%。公告显示,2019年1月1日—2019年6月30日,归属于上市公司股东的净利润为2562万元–5124万元,比上年同期下降60%-80%。

GQY视讯:发布2019年半年度业绩预告,预计上半年净利润1280.00万元至1780.00万元,同比下降64.43%至50.53%

GQY视讯7月15日发布2019年上半年业绩预告,预计公司2019年1-6月净利润为1280.00万元~1780.00万元,上年同期为3598.11万元,同比下降64.43%~50.53%。

行业新闻

巨头新动向

应对自动化影响,亚马逊计划对其三分之一员工进行再培训

亚马逊7月11日宣布,正在计划对其三分之一的员工进行再培训,以帮助减轻自动化的影响。这家电子商务巨头承诺投入 7 亿美元用于提供「技能」培训,旨在将易受自动化影响的人员转移到整个公司的新工作岗位。到 2025 年,预计将有多达 100,000 名员工接受再培训。亚马逊预计机器人将至少在十年内不会完全取代人类工作者,但即使转向部分自动化也会让一些人处于寒冷状态。新的培训计划应该有助于打击这一点。

微软和普罗维登斯・圣约瑟夫医疗集团宣布战略联盟,以加快护理服务未来发展

机器之心获悉,微软公司和普罗维登斯・圣约瑟夫医疗集团今日宣布一项多年战略联盟,以加速医疗保健的数字化转型。该联盟将把微软的云,人工智能(AI),研究能力和协作工具的技术力量与美国最大卫生系统之一的普罗维登斯・圣约瑟夫医疗集团的临床专业知识和护理环境相结合,加速技术发展。该联盟将联合开发一系列综合解决方案,改善健康结果并降低总体护理成本。该联盟将加速医疗保健行业对云的采用,并通过利用 Microsoft Azure 和行业互操作性标准(如 FHIR)实现数据驱动的临床和运营决策,将孤立的数据源集成到支持安全性和合规性的云环境中。

谷歌地图:机器学习说您的公交将延迟三分钟到达

最近,谷歌地图引入了公交车实时交通延迟提示系统,这个系统可以预测全球包括亚特兰大、萨格勒布、伊斯坦布尔及马尼拉等数百个城市的公交车延迟,它让六千多万人能更准确地预估自己的通勤时间。通过这个系统,用户可以知道自己的公交是否会晚点,晚点多长时间。系统还能根据沿途的实时交通状况更准确地预测出行时间。此外,用户还可以在地图上精确地看到延误的位置。该系统上个月初开始在印度试点,它将实时交通情况预测和路线、站点数据结合起来,组成了一个机器学习模型,可以更好地预测出乘坐公交到达目的地需要多长时间。

Waymo 获得加州批准,用无人车运送乘客

谷歌的自驾车公司 Waymo 已经获得加州监管机构的批准,可以在自动驾驶中运送乘客。此次批准是公司的一个里程碑,宣告它开始向商业服务发展。加利福尼亚州公用事业委员会周二授予 Waymo 许可证,以参加该州的自动驾驶员乘客服务试点。Waymo 确认了批准。Waymo 发言人的声明提供了一些关于公司打算如何以及在何处使用此许可证的提示。

百度公布其无人驾驶汽车开源软件解决方案 Apollo 5.0

百度近日于 GitHub 公布其无人驾驶汽车开源软件解决方案 Apollo 5.0。该版本方案旨在支持地理围栏技术下的自动驾驶的批量生产。该款汽车目前配置了 360 度可视性,提升安全意识并且能够应对复杂道路情景变化的升级版本感知深度学习模型。Apollo 5.0 的功能以及性能提升包括以下几个方面:全新的数据管道服务;新的 Perception 算法;传感器校准服务;基于场景的规划,支持新的规划算法,开放空间规划和新方案;地图数据验证工具;预测评估工具以及仿真网络平台 Dreamland。

技术新突破

IBM 推出人工智能辅助电子舌头 Hypertaste,快速识别复杂液体的移动指纹

人类的品味感是数千年演变的结果。它非常善于让我们享受愉快的食物和饮料,并警告我们不要摄取有害物质。而人造传感器尚未接近我们的味蕾识别物质的容易程度。基于从人类品尝食物的过程中得到的灵感,IBM 研究团队正在致力于开发一种电子的人工智能辅助舌头,Hypertaste。Hypertaste 迎合了广泛的工业和科学需求,无需进入高端实验室就可以快速可靠地识别液体。政府机构可以利用该工具对远程湖泊或河流进行即时水质检查;食品生产商能够利用该工具别假冒葡萄酒或威士忌等等。

学习流利地说外语:多语言语音合成和跨语言语音克隆

谷歌近期一篇名为「学习流利地说外语:多语言语音合成和跨语言语音克隆」的学术正引发社群热议关注。以下为论文概述:我们提出了一个基于 Tacotron 的多名发言者以及多语言的文本到语音转换(TTS)的合成模型,其能够以多种语言生成高质量语音。此外,该模型能够跨语言传输语音,例如合成流利使用英语使用者的声音的西班牙语演讲,且前提是没有任何双语或平行示例训练。这种转化适用于相差甚远的语言,例如:英语和普通话。实现这一结果的关键在于:1。使用音素输入表示来鼓励跨语言共享模型容量,以及 2. 结合对抗性损失术语以鼓励模型分析其说话者身份的表示(这与语言完全相关)来自语音内容的训练数据)。通过对每种语言的多个发言者进行训练,并结合自动编码输入以帮助稳定注意力,进一步扩大模型训练,产生一个可以持续使用的模型能综合可理解的演讲,并训练所有语言的演讲者配以本地或外国口音。

科学家利用人工智能更好地预测恶劣天气

据悉,由美国宾夕法尼亚州立大学、阿库气象公司、西班牙阿尔梅里亚大学等机构组成的研究小组研制出一种用于识别潜在风暴的新型计算机模块。这种计算机模块可以从卫星图像中检测云的旋转运动,是一种基于机器学习线性分类器的人工智能解决方案。并且这种人工智能解决方案已经运行在匹兹堡超级计算中心的 Bridges 超级计算机上。他们发现,这个方法可以有效地检测出逗点云型,准确率高达 99%,而且每次预测平均仅需 40 秒。此外,这种方法还可以有效地预测出 64% 的恶劣天气事件,优于其他现有的恶劣天气检测方法。

登顶MS MARCO文本阅读理解挑战赛,阿里双任务破纪录

7月2日,阿里发布消息称,近日,在MS MARCO文本阅读理解挑战赛中,阿里AI模型在文档检索排序和开放域自动问答两项任务上都登顶榜首。阿里巴巴的突破在于提出了基于「融合结构化信息BERT模型」的「深度级联机器阅读模型」, 可以模仿人类阅读理解的过程,先对文档进行快速浏览、判断,然后针对相应段落进行精读,并根据「自己的理解」回答问题。其中,阿里巴巴自研的算法成果——「深度级联机器阅读模型」已被人工智能顶级学术会议AAAI 2019收录。阿里还称,这一技术已经开始大规模应用,例如去年在 Lazada 一次线上促销活动前, 阿里 AI 仅仅花了30毫秒就学会25个在印尼促销品销售中的所有规则,并成功应用到聊天机器人中,在活动中回答问题方面的准确率达到了 96%。

全球首个AI设计药物进入人体试验阶段

近日,澳大利亚弗林德斯大学的研究团队研制出一种名为「涡轮增压」的流感疫苗,这种疫苗可以刺激人体免疫系统产生比普通疫苗更多的抗流感病毒抗体。这是全球首个进入人体试验阶段的使用人工智能(AI)技术研制的流感疫苗。也是世界上第一种完全由人工智能设计的药物。团队首席专家彼得罗夫斯基认为,该疫苗有望在 3 年内获得应用。

工智能设计的抗流感滴液已经开始了人体试验。开发该药物是通过使用机器学习为人工智能系统提供 60 至 80 个「好」药物和「坏」药物后,系统生成了数万亿的理论药物,再筛选出候选名单进行实验室测试。澳大利亚生物技术公司 Vaxine Pty Ltd 的研究总监,弗林德大学的 Nikolai Petrovsky 教授表示这种药物已经被添加到典型的流感疫苗中,最终版本试验已在美国 8 个中心启动。他表示,此次改良的流感药物被认为是世界上第一个完全由人工智能设计的人类药物,这标志着人工智能发现和设计药物的新时代的开始。

自动化系统为新任务生成机器人部件

由麻省理工学院研究人员开发的自动化系统设计和 3D 打印复杂的机器人部件,并将其命名为执行器,其能根据大量规格进行优化。简而言之,该系统能自动完成人类几乎不可能手工完成的事情。在今天发表在 Science Advances 上的一篇论文中,研究人员通过制造致动器来展示该系统,这些致动器是机械控制机器人系统以响应电信号的装置,它们以不同的角度显示不同的黑白图像。例如,一个执行器在平放时描绘了 Vincent van Gogh 的肖像,在被激活后倾斜角度,并由此绘制出著名的爱德华·蒙克画作「呐喊」。研究人员还为 3D 打印浮动睡莲,花瓣配有执行器和铰链阵列,可响应磁场穿过而折叠起来导电液体。

免责声明

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

人工智能半月刊 人工智能

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 07-18 苏州银行 002966 7.86
  • 07-17 景津环保 603279 13.56
  • 07-17 科瑞技术 002957 15.1
  • 07-16 丸美股份 603983 20.54
  • 07-16 大胜达 603687 7.35
  • 股市直播

    • 图文直播间
    • 视频直播间