近日,上海人工智能实验室发布了推理大模型InternThinker(书生思想者)。公众在电脑上登录“书生·浦语”大语言模型后,点击界面左侧的InternThinker链接,就能体验这个对标OpenAI o1的沪研推理模型的实力。奥数题目、编程赛题、填字游戏……各种“烧脑”问题,都可请它解答。拥有强大的复杂问题推理能力后,大模型可以成为人类研究自然科学、工程技术、社会科学等专业领域的得力助手,为科研人员提供解题思路。即将过去的2024年,上海在人工智能大模型、人形机器人、脑机接口等新兴技术领域成果频现。除了萨姆·奥特曼创立的OpenAI,上海科研团队还对标埃隆·马斯克创立的特斯拉和神经连接公司,打造出多款人形机器人和脑机接口产品,有望孕育出未来产业的“核爆点”。
算力有限情况下实现技术革新
经历“百模大战”后,国内的基础大模型第一梯队已基本形成:文心一言、豆包、Kimi……上海稀宇科技有限公司开发的MiniMax位列其中,成为少数几家创业成长期企业打造的基础大模型之一,目前每天的全球交互量高达30亿次左右。在GPU算力有限的情况下,如何让国产大模型生成高质量的文字、图片、视频、音乐和语音?稀宇科技创始人闫俊杰博士说,他们对大模型进行了多项技术革新。MoE(混合专家模型)是其中一项革新,它按照“术业有专攻”的理念,将各种任务进行分类,随后分给多个“专家”模块来解决。与MoE对应的概念是稠密模型,采用这种架构的属于“通才”模型。与一个“通才”相比,一群“专家”能更高效、专业地完成复杂任务,还能在不显著增加算力成本的情况下大幅增加模型容量,达到万亿参数级别。“线性注意力”机制也是稀宇科技开展的一项技术革新。它通过算法优化,将传统模型架构中输入长度和计算复杂度之间的平方增长关系转变为线性关系,迈出了“实现无限长输入和输出”的关键一步。
大模型企业的成长离不开创新生态和风险资本。今年10月,上海市“生成式人工智能创新生态先导区”在模速空间揭牌,上海国投公司与稀宇科技、阶跃星辰、无问芯穹等10家企业共同启动战略合作。目前,位于徐汇滨江的模速空间吸引了近100家初创企业入驻,其中一些企业已崭露头角,完成多轮融资。无问芯穹是一家入驻模速空间的企业,由清华大学电子工程系科研团队创办,为大模型训练提供算力解决方案。今年,公司发布了业内首个千卡规模异构芯片混训平台,其算力利用率最高达到97.6%。“感谢上海一直在培育大模型生态,在徐汇西岸打造了一个集算力支持、政策激励、优质服务于一体的创新平台。”无问芯穹首席执行官夏立雪说,“与上海国投合作后,公司将加速发展,为更多的大模型企业提供算力服务。”
人形机器人会榨果汁、搬重物
在与大模型紧密关联的具身智能领域,上海今年也有很多成果问世。具身智能的主流载体是人形机器人,特斯拉公司今年10月举行的发布会上,“擎天柱”机器人展示了跳舞、倒饮料、与人交流和猜拳等技能,相关视频在网上广为流传。上海企业研发的人形机器人也掌握了不少技能。今年8月,拥有259万B站粉丝的稚晖君(真名:彭志辉)在哔哩哔哩平台上发布了他带领智元公司团队研发的3款“远征”系列人形机器人。发布会上,“远征A2-W”表演了操作榨汁机的技能。它用与人手相仿的灵巧手把多种水果放入机器,摁下按钮将它们打成果汁,随后一手拿榨汁机,一手拿玻璃杯,将果汁倒入杯子,再拿起杯子走到彭志辉身旁,递给它的主人。
“远征A2-Max”则是大力士,双臂负载大于40公斤,身高1.75米。发布会上,它抱起一个箱子向前走动,完成了搬运任务。彭志辉介绍,这款人形机器人在工厂里能搬动40公斤重的航空箱,可以帮工人干体力活。今年9月,上海傅利叶智能科技有限公司也发布了第二代人形机器人GR-2。它高1.75米,重63公斤,全身共有53个自由度,单臂运动负载为3公斤。与第一代人形机器人GR-1相比,GR-2的电池容量大幅增加,续航时间延长至2小时,并在支持直充的基础上,增加了可拆卸换电方案。未来,我们可遥控人形机器人,让它们在一些有污染、有风险的环境中工作。GR-2已具备遥操作功能。戴上苹果头显设备Vision Pro,人们可用手抓取眼前的虚拟影像,这款机器人就会做同样的动作,抓取它面前的真实物体。
上海首例脑机接口手术顺利完成
马斯克创立的神经连接公司带火了另一条前沿科技赛道——脑机接口。近日,这家美国企业宣布,一项新的可行性研究已获得政府部门批准,将使用公司研发的N1植入物,让四肢瘫痪患者通过脑机接口控制机械臂。上个月,上海第一例半侵入式脑机接口产品植入手术在华山医院完成。接受手术的瘫痪患者恢复情况良好,术后第三天已能下床坐轮椅。博睿康医疗科技(上海)有限公司首席科学家、清华大学教授洪波介绍,这款名为NEO的脑机接口产品与马斯克团队研发的侵入式设备不同,不直接接触神经元细胞,而是植入患者颅骨和大脑皮层之间的脑膜,所以不存在损伤神经细胞的风险。而且,在华山医院完成的是一台微创手术,仅耗时1小时40分钟。利用自主研发的“在线时域空域脑功能定位系统”,医护团队在手术中无须唤醒患者,就能快速、精准地定位手部感觉和运动脑区,大幅降低了同类手术的时间与风险。
市科委介绍,NEO的研发和型式检验都在上海完成,今年8月成为我国首款进入创新医疗器械特别审查程序的脑机接口产品。近年来,上海积极推进脑机接口前沿技术创新,培育了脑虎科技、博睿康、阶梯医疗等创新型企业,它们分别在侵入式、半侵入式领域研发出产品。
明年,上海将继续聚焦侵入式、半侵入式领域,推进脑机接口产品化、建设共性技术研发服务平台、推动临床试验与应用示范、健全产品标准与检测体系、培育产业生态;同时,支持非侵入式脑机接口产品提升技术水平和应用规模。沪研脑机接口产品有望在国内率先实现临床应用,改善瘫痪、失语、神经性疾病等患者的生活质量,逐步形成这一未来产业的创新生态。
原标题:对标马斯克和奥特曼,上海大模型、人形机器人、脑机接口成果频现|科创这一年
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)