安装新浪财经客户端第一时间接收最全面的市场资讯→【下载地址】
财联社9月26日讯(编辑 史正丞)北京时间周一晚间,人工智能领域的知名创业公司OpenAI发布题为《ChatGPT现在能看、能听、能说》的公告,宣布将在未来两周时间里向付费用户推送这项功能。
在今年3月GPT-4的发布会上,最令人感到震惊的一幕应该是,OpenAI总裁Greg Brockman拿着一张草稿纸画了个草图,随手拍了张照就让GPT-4在10秒钟时间里生成了这个网站的代码。

ChatGPT此前曾推出过能上传图片的“代码解释器“功能,具备了一些初步处理图像和文本照片的能力。但毫无疑问,今天这个“随手拍、随心问”才更贴近大多数用户的AI助手使用场景。
拍张冰箱照片 告诉你今晚吃啥
按照标题的顺序,今天更新的功能主要有两点:基于图片的对话,以及实时语音对话。
先说关注度非常高的图片聊天功能。按照OpenAI的说法,用户现在可以拍一张冰箱的照片,然后让ChatGPT来推荐菜谱;在旅行时拍摄一张地标的照片,让ChatGPT来讲述这处景点的有趣之处。当然,也能拍一张数学题的照片,让ChatGPT来解答。
在官方给出的例子中,给到ChatGPT一张自行车的照片,问它如何把座椅调低。然后ChatGPT表示看你车的型号,有的车有快拆杆,有的是用螺栓固定,然后给出了详细的步骤。

随后官方装作不懂,拍了一张螺栓的照片,并用官方画图工具圈出来以示强调,然后问ChatGPT这是不是快拆杆。ChatGPT表示你这个是螺栓,得去找一个内六角扳手。

随后官方又拍了一张工具箱的照片,问ChatGPT到底是哪一个扳手。ChatGPT也顺利地认出了扳手,并准确提示用户到底要拿哪一个尺寸。

ChatGPT会说话啦!
除此之外,OpenAI也将语音识别、转录和音频生成功能打包,推出了AI语音聊天的功能,这项功能只适用于iOS和安卓客户端。官方表示,用户可以用这项功能为家里的小孩讲睡前故事。或者家里吃着饭,突然为某个问题吵起架来,这个时候就可以把ChatGPT拍在桌面上解决争论。

OpenAI介绍称,这项功能使用了Whisper开源语音识别系统,将用户说的话转录成文本。同时还用上了一项新的文本转语音模型,并与专业配音演员合作,提供5种可供用户自行选择的声音。
更先进的AI也有新的风险和局限性
OpenAI表示,新的语音技术能够仅通过几秒钟的真实语音创造出逼真的合成声音。这种功能打开了创造力的大门,也带来了新的风险——例如不法分子可能伪造公众人物进行欺诈。所以OpenAI的决策是通过“语音聊天”这样的特定用例来推出这项功能。
同时OpenAI也在与更多的机构展开合作。例如流媒体公司Spotify就在试用这项功能来进行语音翻译,通过使用播客主持人的声音将播客音频翻译成其他语言,帮助播客主持人扩大他们的全球影响力。
图像也会带来新的挑战,例如幻觉问题,以及使用者在高风险领域却依赖模型对图像的解释。因此在上线前,OpenAI也对极端主义和科学能力等领域进行了风险测试。
另外对看到这篇文章的中文读者来说,图片对话的体验大概率值得期待,但语音对话可能要打一些折扣。OpenAI表示,该模型擅长转录英文文本,但在一些其他语言,特别是那些使用非罗马字母的语言中表现不佳,建议非英语用户不要使用ChatGPT来进行此类用途。
责任编辑:郝欣煜


APP专享直播
热门推荐
东北第一座万亿城市,有望在今年诞生 收起东北第一座万亿城市,有望在今年诞生
- 2025年02月28日
- 09:27
- APP专享
- 扒圈小记
31,495
接吻时长世界纪录保持者夫妇分手,曾连续吻了58小时35分钟
- 2025年02月27日
- 08:58
- APP专享
- 扒圈小记
29,203
余华英被执行死刑
- 2025年02月28日
- 04:21
- APP专享
- 北京时间
7,941

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
数字江恩今天 10:28:08
由于下周依旧处于宽幅震荡时间内,所以图上的蓝色轮谷线跌破之后便成为压力。下周任何反弹都难以站上蓝色轮谷线,只是依照3306来判断大盘是反复反抽震荡,还是稍微下移一些空间。 -
数字江恩今天 10:28:03
这里有必要分辨一下下周属于高位震荡结构,还是深幅回踩结构。如果是高位震荡结构,那么3306正常支撑震荡,即高点回撤70-80点水平。如果跌破3306,那么便是图上的白色震荡结构向下扩展,正常也在2倍螺旋之内。无论是哪一种结构,其实都不威胁到15分钟级别的轮峰线。 -
数字江恩今天 10:28:00
5分钟图来说,春节之后是沿着蓝色轮谷线向上运行的,3140之后则是沿着红色轮谷线向上运行。周四假突破3386之后,周五的大阴线将两条轮谷线都跌破了。【更多独家重磅股市观点请点击】 -
数字江恩今天 10:27:43
大盘窄幅波动中,假突破特别多,首先看15分钟图。3494后的下跌12345+abc反弹已经完成,目前处于宽幅震荡结构之中,而且整个下周时间都在这个宽幅震荡时间之内。从结构来看,图上的15分钟级别蓝色轮峰线突破后,震荡只要不跌回去都是正常震荡,震荡之后还可以有新的上涨。所以这条轮峰线是看震荡结构是否健康的标准。【更多独家重磅股市观点请点击】 -
数字江恩今天 10:27:34
板块上,本周前热点在高位的科技、机器人(sz300024)回撤较大,而低位的消费类、新能源类表现不错。连酿酒都能连续拉起来,可见市场的风险厌恶情绪增大,高位股短期内表现都不会好。 -
数字江恩今天 10:27:29
大盘本周放量持续温和放量,周一到周四缓慢攀升,但周五一根大阴线吃掉了所有涨幅,打到了上周周线几乎最低点。目前5周线维持金叉10周线,而周五大阴线收盘价便是正好5周线位置。 -
数字江恩今天 10:27:22
下周行情展望2025.02.28 -
股道龙门今天 08:49:36
今日大跌核心原因解析1、外部压力: 地缘政治风险升温:中越外交磋商强化区域合作,但美国对欧盟加征关税、特朗普对墨西哥关税政策落地,引发全球供应链扰动预期。 流动性预期反复:美联储降息节奏分歧(哈克称“利率或长期维持高位”),叠加英伟达单日市值蒸发近2万亿,压制全球科技股风险偏好。 隔夜外围表现:隔夜美股纳指大跌2.78%,英伟达暴跌8%,纳斯达克中国金龙指数重挫5.24%,全球科技股估值修正压力直接冲击A股相关板块2、内部调整压力: 政策真空期博弈:两会前资金兑现高估值板块(如AI算力、机器人(sz300024)),转向防御性资产(煤炭、公用事业)。 技术面超买回调:上证指数3400点附近抛压集中释放,触发量化策略止损盘,北向资金单周净流出8.73亿元。—— 不利因素已在今日大跌中彻底消化,未来市场走向该如何把握? 下周两会将细化“新质生产力”支持措施,预计出台AI算力基建(华为沙漠光伏项目)、机器人(sz300024)产业化(蚂蚁集团(sh688688)具身智能)等专项政策;《2025年能源工作指导意见》明确非化石能源占比提升至20%,光伏柔性支架(华能1GW招标)、储能(特斯拉上海工厂)等领域受益;广东“金融强省”规划、国企市值管理考核强化,低估值央企(电力、军工)或迎价值重估。—— 当前市场调整是短期的情绪释放和筹码重构,基于政策全面发力、产业技术突破、资金增配势能三大核心要素,A股中长期上涨逻辑明确。随着市场逐步稳定,两会中的重要产业或是未来投资的主要方向,大家反倒可以利用本轮调整尽快做出战略调整!- 数据来源:东方财富(sz300059)- 以上内容仅供参考,不构成投资建议,股市有风险,入市须谨慎!内容来源华源证券投顾万雷,执业编号:S1350623120005 -
宋谈股经今天 08:34:48
【VIP教室】组合个股前天空仓,短期躲过大跌,下周寻找布局机会,组合个股教学,速戳抢购查阅〉〉【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
北京红竹今天 08:26:55
3、情绪最差的一天上涨570家,下跌4773家,涨停46家,跌停47家2月份还是第一次跌停家数这么多,看来获利筹码这么多,一次性都倒出来了。人形机器人(sz300024)也跌破防守线了,指数大跌7.26%,DS也跌破防守线了,指数大跌5.07%。这是最近这几天,我反复强调了,所有关注的指数都出现防守线了,并且科创50和人形机器人(sz300024)是五分钟级别2个中枢的上涨。这次踏实了,踏踏实实待几天,下一波继续干。