GPT-4验证大模型进阶之路 国产厂商开始迎战

GPT-4验证大模型进阶之路 国产厂商开始迎战
2023年03月18日 04:06 媒体滚动

  来源:中国经营报

  本报记者 曲忠芳 李正豪 北京报道

  火爆全球的通用对话机器人ChatGPT,在上线仅三个半月后,迎来了新的“进化”。3月15日,美国人工智能公司OpenAI推出了大型多模态模型GPT-4。相比于ChatGPT使用的GPT-3.5架构,GPT-4不仅接受文本输入——文本输入上限被提升到2.5万字,更重要的是新增了支持图像输出;在律师考试、生物竞赛等模拟测试中,GPT-4的成绩大幅提升。另外,在26种语言测试中,GPT-4的表现也优于GPT-3.5,其中英语的准确率从70.1%上升到85.5%,中文的准确率则达到了80.1%。

  OpenAI官方透露,其团队花了六个月时间来使GPT-4更加安全一致。在内部测试中,相比GPT-3.5,GPT-4减少了82%对于被禁止内容的请求响应,而产生真实响应的可能性提高了40%。与此同时,OpenAI联合创始人、总裁格雷格·布洛克曼在视频中还演示了GPT-4诸如总结文章、报税、写代码、作诗等功能。

  针对GPT-4的训练数据规模及其用于训练的硬件信息等问题,《中国经营报》记者通过电子邮件联系OpenAI官方采访询问,但截至发稿,暂未得到回复。

  ChatGPT被业界称作“大力出奇迹”——通过更大规模数据训练、更强算力支撑、基于人类反馈的强化学习等生成更具通用性、且智能水平前进一大步的模型。那么,ChatGPT、GPT-4及其所验证的大模型之路对国产AI企业有哪些启发?国产厂商该如何抓住新一轮AI机遇?针对这些问题,多家AI企业在接受本报记者采访时给出了自己的回答。

  被验证的大模型之路

  OpenAI方面表示,GPT-4是其在扩展深度学习领域的“最新里程碑”,是在微软Azure人工智能超级计算机上训练的。截至目前,GPT-4仅面向ChatGPT Plus付费订阅用户使用,开发人员可通过API接口(应用程序编程接口)构建应用程序或服务。但同时,包括语言学习软件Duolingo、跨境支付工具Stripe、视障辅助应用Be my eyes等App已内置GPT-4,此外,国际金融服务公司摩根士丹利、冰岛政府、非营利教育组织“Khan学院”等也与OpenAI在应用GPT-4方面达成合作。

  OpenAI方面也表示,“GPT-4仍存在许多已知的限制,我们正在努力解决,如社会偏见、幻觉、敌对提示等。”

  需要指出的是,OpenAI最早于2018年6月推出GPT,后于2019年2月、2020年5月分别升级推出了GPT-2、GPT-3,三代GPT的参数量分别为1.17亿、15亿、1750亿,预训练数据量分别为约5GB、40GB、45TB。从ChatGPT使用的GPT-3.5架构开始,OpenAI没有再公开参数量和预训练数据量,本次推出的GPT-4也仅提供了一份98页的相关论文。OpenAI首席执行官山姆·阿尔特曼在推特发文透露“正在开源OpenAI Evals”,这是一款用于自动评估AI模型性能的框架,目的在于收集开发者的建议与意见。

  上海人工智能研究院技术总监沈灏告诉记者,ChatGPT印证了大模型是一个比较明确的道路,国内外在行业大模型领域都已做了一些工作,通用大模型会更难一些,但这是比较明确的战略方向。

  在北京社会科学院研究员王鹏看来,大模型之所以称之为大,主要涵盖几个要素:一是大模型的运算量基础非常高,能够支撑大量数据运算;二是大模型构造复杂,本身要经过多层次的学习、深度学习;三是牵扯到的系统非常复杂,同时对算力资源的需求高。做大模型,相当于“打好地基”,从国家社会经济长远发展的层面,要想支撑起大的行业、产业,要在人工智能领域实现长足的进步、保持长效的竞争优势,必然要训练大模型。重点推进相关科研攻关方向,具有深远的影响和意义。

  “ChatGPT预训练语言模型的出色表现吸引了广泛的关注,吸引了科技大厂的加码布局。不过这里有一个误区,许多人认为只要参数足够多,模型足够大,也能够训练出与ChatGPT水平类似的AI产品,其实不然。如果算法存在差异,或者训练步骤和数据不同,结果可能也不会一样。即使做大模型,也不代表同样的高水平,创新需要差异化,不宜一哄而上。ChatGPT使用的大模型,除了参数高,还使用了微软Azure超级计算机、英伟达先进GPU芯片做算力支持,训练过程中创新性地引入了利用人类反馈强化学习机制,这是许多大模型难以超越它的原因。”深度科技研究院院长张孝荣如是说道。

  AI企业的启示与机遇

  由ChatGPT引发的新一轮AI热潮持续,包括百度、阿里巴巴、腾讯、科大讯飞等科技大厂都在加码推进自己的通用大模型。多家国产AI企业负责人均向本报记者表示,正在密切关注ChatGPT以及AI大模型的发展及趋势,并思考如何将新的技术突破整合且应用到自身的产品业务中。

  其中,3月16日百度正式推出大语言模型——文心一言。百度 CEO 李彦宏在演讲中表示文心一言“不尽完美”,“大家的期望值是要对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的”。李彦宏介绍,文心一言有五大能力,即文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。此外,李彦宏还表示,内测中文心一言并不完美,但市场有需求必须要推出来。

  成立于2016年的天壤智能创始人兼CEO薛贵荣在接受记者采访时指出,早在公司创立之初就搭建了深度强化学习框架,目标是让通用人工智能像水电一样便捷。不过发展期间在市场及业务需求下,自研并落地了包括图像处理、交通、蛋白质设计等多个行业大模型。薛贵荣表示,“ChatGPT使我们更加坚定了做大模型、多模态、强化学习的路径是通的。”

  薛贵荣认为,ChatGPT、GPT-4有望加速AI for Science的发展经验,尤其是在生物制药、材料研发、能源等众多领域,作为新的生产工具辅助科研人员进行高效生产,而且随着数据越来越多、智能程度越来越高,在提供专业研究建议的同时还可能主动探索发现新的理论。

  虚拟人厂商中科深智创始人兼CEO成维忠表示,GPT-4对虚拟人行业是“天大的好事”。这是因为,未来的人机交互必须是多模态的,尤其是视觉信号的实时输入输出,最新面市的GPT-4解决了图片输入的问题,不久可能会解决视频输入的问题。聚焦在垂直领域生成式AI训练的公司跟GPT-4的结合机会很大。除此之外,成维忠认为,GPT-4对智能客户、视觉识别等行业产生冲击,在这种情况下,“积极拥抱新技术才有出路”。

  新壹科技研发副总裁、AI项目负责人陈鹏告诉记者,ChatGPT的出现至少影响90%的NLP(自然语言处理)领域的从业者。从去年初,陈鹏带领团队开始瞄准图文生成视频这一需求,基于既往做小咖秀等视频产品的经验以及业务战略方向,研发推出“一帧秒创”App。陈鹏表示,“我们并不是跟风,而是恰好被AIGC——通过AI技术生成内容的‘大风给刮到了’。”文本视频化、超视频是一个大趋势,传统的UGC(用户生成内容)或PGC(专业生产内容)已难以满足市场需求,通过生成式AI提高视频的生产效率也就成了顺理成章的事情。

  四足机器人生产商云深处科技产品负责人向记者表示,ChatGPT、GPT-4代表的跨时代AI的出现给腿足机器人行业带来了进入人类日常工作生活的希望。机器人技术与应用受限于硬件和软件两条线,其中软件层更多地受限于AI技术,随着腿足机器人实体具备越来越强及越来越稳定的运动性能,在结构化行业环境里有了非常多的应用,但要更进一步贴近人类的日常生活及服务,就遇到了AI及交互的技术发展瓶颈。多年来,AI都只有比较固定模式的问答,相对没那么智能。随着GPT-4的出现,腿足机器人有望获得优秀的语义分析和对话能力,将使人机交流不再是机械式的“查字典式问答”。同时,新AI具有积累学习的能力,甚至具备个性,在陪伴、康护、服务领域具备非常重要的意义。值得注意的是,GPT-4增加了图像输入及分析,未来或会接入实时视频、各类传感器等更多输入源,真正意义上的AIoT(智能物联网)将使机器人能胜任更多可能场景和任务。

  就在2023年全国两会举行前,科技部高新技术司司长陈家昌公开表示,人工智能作为一个战略性新兴技术,日益成为科技创新、产业升级和生产力提升的重要驱动力量。基于自然语言理解的人机对话是人工智能发展的一个重要方向,ChatGPT最近成为了一种现象级的应用,表现出很高的人机交互水平,表现出自然语言的大模型已经具备了面向通用人工智能的一些特征,在众多行业领域有着广泛的应用潜力。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:李桐

AI

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 03-24 华海诚科 688535 --
  • 03-23 中科磁业 301141 --
  • 03-22 日联科技 688531 --
  • 03-21 花溪科技 872895 6.6
  • 03-20 一诺威 834261 10.81
  • 产品入口: 新浪财经APP-股票-免费问股
    新浪首页 语音播报 相关新闻 返回顶部