AI界刚过去的“最卷一夜”,到底发生了什么不得了的事情?

AI界刚过去的“最卷一夜”,到底发生了什么不得了的事情?
2023年03月22日 14:53 上游新闻

上周三开始,一系列前沿AI技术接二连三地刷爆科技新闻版面。从OpenAI发布GPT-4,到微软发布Office的AI助手Microsoft 365 Copilot,以及Midjourney发布能“画手指”的V5版本,AI工具呈现出了遍地开花的繁荣景象。然而,更让人没想到的是,就在过去的一天时间里,多家IT巨头几乎同时发布了各自最新的AI工具,被媒体称为AI界“最卷一夜”。

从媒体报道内容看,这些工具中,有的涉及图像、视频的编辑和生成,有的与GPT类似是一种大语言模型,而有的则推出了前述这些应用场景的基础:硬件。对非业内人士和普通民众来说,相关的报道涉及大量的专业术语,上游新闻通过梳理,尝试呈现出一个较为简单明晰的面貌。

Adobe:

推出后期及创意生成AI

最早,Runway是Adobe旗下一款后期辅助工具,虽然借助了人工智能的神奇力量,但所能实现的并不复杂:擦除物体、图像插帧、删除背景、运动追踪等。而当 Runway打开人工智能的新大门后,它拥有了点石成金的能力。

Runway在去年9月公布的Gen1版本,时隔半年,Gen2来了。比起Gen1模型,Runway画面之间的联接更顺畅了,画质还更高清了。如今的Gen2版本已经算是“可看”的程度,虽称不上精致,但未来可期。

另据环球网报道,Adobe近日还推出了一款名为“萤火虫”(Firefly)的创意生成式AI,可由文字生成图像内容。

据介绍,Firefly将允许内容创作者使用自己的文字来生成图像、音频、插图、视频和3D图像。Adobe数字媒体业务总裁大卫·瓦德瓦尼在一份声明中表示:“通过Firefly,Adobe将把生成式人工智能驱动的‘创意成分’直接带入客户的工作流程,提高所有创作者的生产力和创意信心。”

Adobe方面称,目前,Firefly已经集成在Adobe的企业级创意工具Adobe Express中进行内测,未来将全面扩展到旗下的Photoshop、Illustrator以及Premiere等工具中。

Google Bard:

不断强调只是一场实验

在大家被GPT-4和Midjourney V5震撼刷屏一周后,Google宣布正式开放Bard的访问:请尝试Bard,并提供你的反馈。

根据Google的最新演示,相比ChatGPT,Bard更像是一个专注于工作学习的随身助理,你可以在它的协助下,激发想法、满足好奇心。你可以使用Bard提供一些技巧,比如如何实现一年阅读20本书,或者用简单的语言解释量子物理学。

可能是ChatGPT和Bing Chat的负面消息引起了Google的重视,后者不断强调Bard只是一场实验,Bard生成的信息并不代表Google的观点。

有了Bing Chat的前车之鉴,Bard的第一个测试版就限制了同一对话中的交流次数,从而保证内容的准确。当你第一次登录Bard时,它就会告诉你这只是一个实验,并期待你的反馈。

Bing Chat:

将人工智能整合进浏览器

微软为新Bing和Edge浏览器的预览版更新了三个新功能:Bing Image Creator、人工智能驱动的Stories以及Knowledge Cards 2.0。其中最重要的当属可以画画的Bing Image Creator。

Bing Image Creator的加入,让Edge浏览器变成了第一个集成人工智能图像生成器的浏览器。由人工智能驱动的Stories和Knowledge Cards 2.0,可以让你在搜索后获得图像、短视频以及由人工智能驱动的信息图表,可以一目了然的获取事实和关键信息。

英伟达:

为大规模部署语言模型创造硬件条件

据澎湃新闻报道,当地时间3月21日,英伟达首席执行官黄仁勋将OpenAI的ChatGPT称为人工智能的“iPhone时刻”,并在该公司的春季GTC大会上宣布了专为其设计的推理GPU(图形处理器)——带有双GPU NVLink的H100 NVL。

与用于GPT-3处理的HGX A100相比,使用了四对H100和双GPU NVLink的标准服务器的速度快了10倍,“核弹级”的H100 NVL是大规模部署像ChatGPT语言模型的理想选择。

英伟达还推出了全新云服务及代工厂NVIDIA AI Foundations,这个云服务包括语言、视觉和生物学模型制作服务。

其中,NeMo是用于构建定制的语言文本转文本生成式模型。

Picasso是视觉语言模型构建服务,具有文生图、文本转视频、文本转3D功能,可为产品设计、数字孪生、角色创建等使用自然文本提示的应用快速创建和定制视觉内容。只要向Picasso发送文本提示和元数据的API调用,Picasso就会用DGX Cloud上的模型把生成的素材发送回应用。而把这些素材导入NVIDIA Omniverse,就可以构建逼真的元宇宙应用,和数字孪生仿真。

BioNeMo是生命科学服务,提供AI模型训练和推理,加速药物研发中最耗时和成本最高的阶段,可加速新蛋白质和治疗方法的创建以及基因组学、化学、生物学和分子动力学研究。

直接在浏览器上或通过API,均可访问这些运行在NVIDIA DGX Cloud上的云服务。

英伟达还把“ChatGPT 同款”搬到了云上,向公众开放。为了降低用户部署大模型的成本,英伟达推出了DXG Cloud服务,每个月36999美元起,你就能获得一个由8张H100或A100显卡组成的云端超级计算机,轻松完成高负载的计算工作。

新闻多一点>>

近期关于AI工具的热点事件

2023年3月15日凌晨,OpenAI发布了GPT模型的GPT-4版本。它比早先大家使用的ChatGPT的GPT-3.5内核强悍了一大截。GPT-4除了文字输入,还可以接受图像输入,并且支持文字与图像的混合输入。

3月16日晚,微软也宣布其正在将人工智能(AI)技术植入到办公软件中,并将其功能命名为Microsoft 365 Copilot。根据其官网发布的演示视频,Copilot可以在微软的多个商业应用程序中使用,包括Word、PowerPoint、Excel等。据介绍,研究人员将大语言模型(LLM)的功能进行了升级和优化,它比“将ChatGPT直接嵌入到Microsoft 365”表现得更加强大。

上游新闻综合自 环球网 澎湃新闻等 图片来源 互联网

编辑:徐远哲

责编:李洋 官毅

审核:冯飞

海量资讯、精准解读,尽在新浪财经APP
AI 人工智能 图像 Adobe bing

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 03-24 南芯科技 688484 --
  • 03-24 科源制药 301281 --
  • 03-24 国泰环保 301203 --
  • 03-23 中科磁业 301141 41.2
  • 03-22 日联科技 688531 152.38
  • 产品入口: 新浪财经APP-股票-免费问股
    新浪首页 语音播报 相关新闻 返回顶部