飞象原创(魏德龄/文)“AI无处不在”已经成为一个可以预见的趋势,业界一方面在谋划AI融入千行百业的设想,另一方面也在思考如何让AI甩掉在云端上的包袱。原因在于当前无处不在的大大小小的设备,很多无法保证持续稳定的连接能力,同时还要兼具时延、续航上的要求。于是,依托于端侧算力的边缘AI应用成为“AI无处不在”的关键所在。
ABI Research发布的预测结果显示,边缘AI的市场规模将在未来十年间实现大幅增长。相关数据显示,面向边缘AI应用的微控制器单元(MCU)部署数量将会大幅增加,具体涉及农业、汽车、蜂窝网络、医疗保健、制造、个人和工作设备、零售以及机器人等多个垂直领域。预计该市场的规模将呈现指数级增长,且在2030年将达到近18亿件的规模。
不久前举办的意法半导体STM32媒体沟通会上,微控制器、数字IC与射频产品部(MDRF)、物联网/人工智能技术创新中心及数字营销副总裁朱利安在开场分享了一个中国区的创新案例,通过电源与能源技术创新中心以及人工智能技术创新中心共同合作,为中国光伏的新能源客户打造的AFCI方案中,包括了软硬件、AI算法及STM32 MCU和功率器件。作为ST提供的第一个人工智能AFCI解决方案,能够为中国区众多的新能源客户提供更加稳定、更加安全的直流拉弧检测功能,从而极大地增强了产品安全检测的精度和客户产品的业内竞争力。
同期,意法半导体还专门向媒体介绍了第一颗AI MCU。
第一颗AI MCU
“在一个万物互联的时代,我们如何把AI从云端下沉到边缘端,使边缘端具有AI能力?如何让物联网设备和汽车同时具备智能、安全和互联这三大支柱?”微控制器、数字IC与射频产品部(MDRF)微控制器产品市场经理丁晓磊表示,边缘端AI具有时效性更强、隐私保护性更好、更高效的自主计算和执行能力。
也就是说,当AI开始拓展自身融合的边界,实现无处不在的目标,推理端也自然需要慢慢从云端下沉到边缘端,在这一过程中,也需要如上文案例中涉及的不同软硬件的支持。过往,已经有SoC能够实现在端侧运行模型的能力,而当MCU的算力越来越强,通过MCU所实现的边缘AI能力,将可以进一步拉低BOM成本,降低设计复杂度。
意法半导体将STM32N6定义为首款具有AI加速能力的高性能STM32 MCU,搭载一颗800MHz ArmCortex-M55内核,CoreMark测试成绩达到3360分。并且带有嵌入式的Neural-Art Accelerator的硬件加速单元,可以与ARM Cortex-M55内核完全独立并行工作,也可以作为ARM Cortex-M55的协处理器,做AI的加速能力运算。STM32N6还集成了一个可以直接处理图像信号的ISP单元,准许应用使用简单且经济实惠的图像传感器。
据悉,STM32N6系列是意法半导体迄今为止处理性能最强的产品,机器学习处理性能是STM32 MCU现有高端产品的600倍。能够让嵌入式AI真正发挥作用,让注重成本和功耗的消费电子和工业产品能够运行计算机视觉、音频处理、声音分析等算法,提供以往小型嵌入式系统无法实现的高性能的功能。
STM32N6在边缘AI领域能够实现的种种能力,与其内置的NPU加速器Neural-Art Accelerator密不可分。
开启全新嵌入式AI应用领域
根据意法半导体发布的《推动边缘AI变革:现代微控制器中神经处理单元的强大威力》白皮书介绍,由于NPU具有专业化的架构,在边缘AI加速领域,运行效率明显高于传统的处理单元,特别适合能源受限的应用环境,例如基于微控制器的应用。NPU不仅是各种边缘AI用例的最佳解决方案,而且还能保持较低的功耗水平。
STM32N6上的Neural-Art Accelerator加速器,作为ST自研的专有神经网络单元,可以提高人工智能的处理能力。“大家可以这样理解:你在一个MCU上用MCU功耗去实现边缘AI的能力。”丁晓磊表示,STM32N6极好地实现了用相对最低的功耗实现最高性能的效果。
白皮书中专门给出了一个测试人员为人员检测和跟踪应用选择了Yolo (You Only Look Once) v8作为目标检测模型的示例,通过使用为Neural-ART加速器编译的相同模型,可以在仅使用Arm Cortex-M CPU内核的情况将Yolo性能提升100倍以上。并且帧率达到26fps,表明Yolo v8推理可以连续、实时地分析100%的视频帧。而这是在Cortex-M55上运行Yolo v8时所无法做到的。
MCU+NPU所带来的另一个优势在于具备快速启动和快速唤醒的能力,时间均在微秒或几毫秒的级别,实现了SoC无法达到的效果。同时也降低了整体系统设计的复杂度,无需在外接电源管理芯片,并内置4.2MB SRAM,能够让所有传统的MCU嵌入式的开发者快速学习上手,释放边缘AI的能力。
在生态系统的角度上,Neural-ART加速器IP与STM32Cube软件生态系统实现无缝集成,从而有效确保了该加速器的运行效率。STM32Cube.AI(桌面应用程序)和意法半导体边缘AI开发者云(在线)原生支持此种集成,且能够生成优化代码,以便轻松、充分地利用NPU的功能。开发人员可以利用STM32Cube.AI或意法半导体边缘AI开发者云轻松优化经过预训练的神经网络模型,并将其转换为可在Neural-ART加速器上高效运行的代码。
STM32N6作为一颗通用MCU,目前已经在众多领域实现了创新落地,例如个人产品、消费类、可穿戴设备、机器人、智能楼宇、白色家电、智能工业、无人机、智能家居等产品中均都有相关成功案例。
让更多应用分享STM32优势
与此同时,意法半导体还正在让更多应用分享STM32的优势。
“边缘AI技术是我们看到的一个现有工业技术应用到未来汽车行业的例子。神经加速器开发工具让开发人员能够在其应用中轻松实现AI,不受他们的数据学专业知识水平的限制,将来,神经加速器技术及其相关工具将改进汽车系统。”意法半导体微控制器、数字IC和射频产品部(MDRF)总裁Remi EL-OUAZZANE在不久前的一篇博客中表示。
随着驾驶体验在AI和软件定义车辆时代的不断演变,提升汽车功能性安全、灵活性和实时性能至关重要。意法半导体的下一代汽车微控制器也正在重塑未来汽车。Stellar系列专注于支持高集成度电动汽车控制、ADAS及关键安全子系统,采用嵌入式非易失性存储技术(eNVM)和28nm FD-SOI工艺;STM32A系列则聚焦车身控制和边缘设备管理,满足ASIL B级安全标准。
意法半导体中国区微控制器、数字IC与射频产品部(MDRF)汽车微控制器产品营销高级经理黄延球在媒体会上表示:“我们希望像其他产品领域一样,让汽车和工业平台实现融合,带来优势互补,有STM32,也有STM32A,可以整合意法半导体的汽车安全技术方案和工业物联网、互联网、人工智能解决方案等。”
面向边缘智能的场景中所不可或缺的无线需求,STM32WL3集成了最新一代Sub-GHz长距离射频收发器、Arm Cortex-M0+处理器内核和针对智能表计应用定制的外设以及改进的省电功能,大大简化了无线解决方案的设计,缩短了产品上市时间,并延长了电池续航时间。
例如将STM32WL3用于表计应用中时,可以延长智能表计应用中的电池寿命,得益于集成的意法半导体独特的模拟流量感测控制器LCSC,可以简化和优化水表设计,为水表带来安全保护,将电池续航时间延长至15年以上,同时优化水表的集成度和成本结构。
STM32C0作为非常具有性价比的32位MCU,通过有吸引力的价格和优化的BOM来帮助客户减少成本。可取代家用电器、简单工业控制器、电动工具和物联网设备等产品设备中的传统8位或16位MCU。作为32位MCU中的经济型产品,STM32C0具有更高的处理性能、更大的存储容量、更高的外设集成度,适合实现用户界面控制等功能,以及其他基本控制、定时、计算和通信功能。
意法半导体通过不断创新的STM32产品家族,助力边缘AI和物联网的全面发展。STM32的优势已分享至多个领域,推动技术革新,构建更加智能、安全和互联的未来世界。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)