旷视研究院摘取NTIRE真实图像降噪比赛冠军

旷视研究院摘取NTIRE真实图像降噪比赛冠军
2019年08月26日 14:31 新浪财经-自媒体综合

  来源微信公众号:旷视MEGVII

  当地时间6月16日,一年一度的“计算机视觉与模式识别会议”(Conference on Computer Vision and Pattern Recognition 2019,CVPR 2019)在美国长滩拉开帷幕。作为计算机视觉领域的三大顶会之一,CVPR 2019 吸引全球超过9200位顶尖专家、学者以及产业界人士,共同推进计算机视觉技术的发展与落地。值得一提的是,在本次大会的 NTIRE 2019 挑战赛上,旷视研究院力压群雄,一路过关斩将,最终夺得了 NTIRE 2019 真实图像降噪比赛 “Raw-RGB” 组的世界冠军。

  NTIRE(New Trends in Image Restoration and Enhancement)挑战赛致力于恢复与增强图像质量,到目前为止,已连续举办了3年。今年,NTIRE 挑战赛下设11项比赛,就旷视研究院参赛的“真实图像降噪(Real Image Denosing Challenge)”而言,全球共有216位选手、12支队伍参加。

  图像降噪一直是计算机视觉中相当重要且研究甚多的领域,其首要的目标是去除或纠正图像上的噪声信息,这既能满足美观,同时也有助于基于这些图像开展进一步的视觉研究。一直以来,研究者在该问题上的工作主要依赖合成的噪声图像。据主办方称,此次真实图像降噪比赛的一大目的即在真实而非合成的图像上评估图像降噪器。

  NTIRE 2019 真实图像降噪比赛基于最近新提出的智能手机图像降噪数据集(Smartphone Image Denoising Dataset, SIDD),它由很多真实的噪声图像及其相应的 ground truth 组成,且每幅图像都有以原始传感器数据(raw)和标准 RBG(sRGB)格式存储的两个版本。因此,该项比赛分为了两项子赛,分别针对 raw 与 sRGB 图像进行去噪。旷视研究院参战前者,一举夺冠。

  NTIRE 主办方 Radu Timofte 与旷视研究院夺冠团队部分成员(左起)王珏、黄海斌,巫奇豪

  解密冠军算法

  图像降噪一直是旷视研究院“手机摄影超画质”的技术储备项目,自第一版原型诞生以后,就在不断迭代。其中,针对原始传感器数据(raw)的图像降噪更是整个项目的基础技术。

  就学术界来看,对图像降噪的关注点一直以 RGB 图像为主,对 raw 图(尤其是手机上)少有关注。人们不了解如何对图像进行前处理、后处理,也不了解在降噪过程中的具体注意事项,导致往往无法发挥数据百分百的力量。基于上述背景,旷视研究院希望借此机会分享在 raw 图像降噪上的心得,同时验证团队实力,进行进一步锻炼。

  这次比赛中,旷视研究院提出了针对 raw 图像的基于 U-Net 框架的“拜尔阵列归一化与保列增广”方法。尽管不同输入图像间的数据格式存在差异,但是为保持网络输入一致性,团队精心设计了一种数据预处理方法,使得相同的网络工作应用到具有不同拜耳模式的输入上,从而在保证性能的前提下用更大的图像集合训练网络。

  “拜尔阵列归一化与保列增广”方法图示

  此外,团队还提出了适用于 raw 图像的数据增广方法。这些优势可以帮助网络获得更好的泛化能力(且没有额外的运行时)。旷视研究员还发现了主办方提供的第一版数据集里验证集的错误,经分析,这很可能是由于人们对 raw 图处理的知识相对不足所造成的。

  由上述可知,学界对 raw 图展开的图像降噪研究还处于刚刚起步阶段,因此,这个小插曲从某种层面也说明了对 raw 图像降噪研究的重要意义。对于错误的指出,主办方及时进行了更正,并向旷视研究院参赛团队发来了感谢信。

  打造夜拍超画质神器

  本次冠军算法已成功落地于 OPPO Reno 10 倍变焦版。OPPO Reno 10 倍变焦版搭载了基于旷视 MEGVII 超画质技术研发的“超清夜景 2.0”功能,能够为用户提供非同凡响的夜拍体验。这也是旷视超画质技术首次运用在大规模量产机型上。

  需要强调的是,依托在本文提到的图像降噪算法,旷视超画质技术在智能降噪的同时,能够更好地保留画面质感,大幅度优化拍摄和影像处理的时间,显著提升用户在夜晚和低光照环境下的拍摄体验。

  复合多帧降噪和 HDR 技术作为旷视超画质技术的其中一项核心功能,能够提升动态范围,有效提高手机夜间拍照的成功几率,并让相机具备优秀的抗鬼影能力。

  多帧降噪是指相机连拍多张照片合成一张照片,可减少高 ISO 感光度带来的噪点,使画质更纯净。如果用传统的多帧降噪技术,在夜间或暗光环境下拍摄运动物体,如街上的行人或者车流时,成像过程中就可能会形成长长的拖影,也就是摄影爱好者俗称的“鬼影”。

  右图为旷视超画质技术拍摄的样片,可以看出“鬼影”现象较左图有大幅降低

  旷视超画质技术则把整个拍照曝光时间控制在300毫秒左右,算法处理时间则控制在1秒左右,也就意味着用户几乎能在按下快门的同时,看到自己所拍摄的超美夜景照,实现所见即所得。曝光时间越短,拍出清晰照片的几率也就越高,因此旷视超画质技术特殊的曝光策略,也让“鬼影”出现的几率大为降低。

  右图为旷视超画质技术拍摄的样片,夜拍效果的亮度和细节明显增加

  在夜景模式下,传统的多帧降噪带来的细节损失难以避免。而在同样硬件配置的情况下,旷视超画质技术则不会损失细节,甚至在有些场景下还会对细节进行增强。尤其是在夜景光源处理方面,旷视超画质技术用不同的曝光策略和曝光组合,能够有效提升动态范围,取得较好的高光压制效果。

  上方图像为旷视超画质技术拍摄的样片,高光压制效果较上图更为自然

  后记

  不以技术驱动产品,而以价值选择技术。秉承“以非凡科技,为客户和社会持续创造最大价值”的企业使命,和“构建驱动百亿台智能设备的物联网生态系统”的宏伟愿景,旷视正在围绕核心 AI 技术能力,连接更多的 IoT 设备,与生态伙伴一起服务于数字化建设,用软硬结合的解决方案为客户提供闭环的商业价值,成为行业智能物联方案专家。

  凭借强大的软硬件结合能力,旷视目前已在城市大脑、供应链大脑和个人设备大脑三个核心 AIoT 场景深度布局。作为技术源动力,旷视研究院不断从底层推动着公司前进的车轮。在与行业龙头力量的联合下,旷视正在推进尖端技术方案的垂直落地,为整个产业结构调整及商业变革激活引擎,积聚力量。

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

责任编辑:马婕

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 08-28 中科软 603927 --
  • 08-28 安博通 688168 --
  • 08-27 瑞达期货 002961 5.57
  • 08-21 南华期货 603093 4.84
  • 08-15 日辰股份 603755 15.7
  • 股市直播

    • 图文直播间
    • 视频直播间