2022年11月30日,美国人工智能企业OpenAI公开发布了一款人工智能生成内容(AI-Generated Content, AIGC)的应用产品ChatGPT。在短短两个月时间里,ChatGPT全球用户便突破1亿,成为人工智能领域的现象级爆款应用。与此同时,中国科技界能否推出自己的中文大型语言模型和中文AIGC也成为国内热议的话题,甚至引发了社会各界对通用人工智能领域中美差距扩大的担忧。
令人欣慰的是,2023年2月7日,百度确认将推出自研的人工智能聊天机器人产品,并定名为“文心一言(ERNIE Bot)”。
百度“文心一言”计划的提出,对于关心中国人工智能和数字经济发展的各界人士来说,无疑是一条振奋人心的消息。尽管还无法了解这一产品更多细节,但就百度自身的业务领域和技术积累而言,由百度来推出一款中文生成式AI应用产品,也是情理之中的事情。
以大型语言模型为基础代表的AIGC,其背后的技术支撑可以归于算力、模型/算法、数据/训练样本三大因素。微软Azure提供的算力、谷歌开发的Transformer模型架构以及微软等科技企业提供的优质训练数据集是ChatGPT成功的三大基石。相比之下,百度在上述三方面也具备优势。其中,算力方面百度自主研发了昆仑芯,百度智能云还可以提供强大的智能云计算服务;模型方面,百度文心大模型源于产业、服务于产业,是产业级知识增强大模型,在语言理解、文本生成、跨模态语义理解等领域取得了多项技术突破;数据训练集方面,百度的搜索业务多年来在实践与反馈中积累了大量中文数据。因此,百度具备推出中文生成式AI的技术能力。另外,由于百度在中文搜索上的优势,未来的“文心一言”的应用范围和前景也相当值得期待。
我认为,百度的文心一言发布后,有望催生各类新产品、新业态,有助于推动各行业掀起创业热。如何应用生成式AI技术,将成为各行业面对人工智能必须思考的课题。(作者肖智系中国社会科学院数量经济与技术经济研究所研究室主任、研究员、博士生导师)
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)