AI商业洞察 | 因用户投诉,微软撤回Bing图像生成器模型

AI商业洞察 | 因用户投诉,微软撤回Bing图像生成器模型
2025年01月16日 13:22 商学院

AI+伦理

Artificial Intelligence & Ehtics

谷歌前AI研究员创办非营利组织,致力于开发AGI基准测试

谷歌工程师、著名AI研究员François Chollet正在联合创办一个非营利组织——ARC奖学金基金会(ARC Prize Foundation),旨在开发新的基准测试,以评估AI系统是否达到人类水平智能。该基金会将由前Salesforce工程总监、AI产品工作室Leverage创始人Greg Kamradt领导。

ARC奖学金基金会的筹款活动将在1月晚些时候启动。Chollet表示,基金会的目标是“成为推动通用人工智能(AGI)进步的有用指引。”基金会将基于Chollet开发的ARC-AGI测试,这是一种旨在评估AI系统是否能高效学习超出其训练数据的新技能的工具。该测试涉及一系列类似难题,比如AI必须从不同颜色的方块中生成正确的“答案”网格,挑战其适应能力。

虽然许多AI系统可以轻松解决数学奥林匹克考试题目和博士级问题,但迄今为止,最强大的AI系统仍然未能完全突破ARC-AGI的考题。“我们不是通过超人类的考试问题来衡量AI风险,而是希望通过缩小与人类能力之间的差距来推动进展,”Chollet在博客中写道。

该基金会计划推出第二代ARC-AGI基准,并启动新的竞赛,同时继续设计第三版测试。Chollet还强调,ARC-AGI尽管存在局限性,但它仍然是评估AI是否具备人类水平智能的重要工具。

更强大的AI即将到来,但它的好处能否均等分配?

近日,OpenAI的CEO Sam Altman在个人博客中表示,他相信OpenAI已经掌握了构建通用人工智能(AGI)的方法,并开始将目标转向超人工智能(superintelligence)。他认为,超人工智能将“极大加速”创新,远超人类独立能达到的成就。

一项新研究表明,AI能够帮助专家提高工作效率。来自芝加哥大学和麻省理工学院的研究人员发现,投资者使用GPT-4o总结财报后,能实现更高的回报率。另据报道,初创公司Prime Intellect发布了一款AI模型METAGENE-1,专门用于检测人类废水样本中的病原体,推动了生物监测和疫情防控的进步。

然而,随着AGI和超人工智能的快速发展,是否所有人都能受益仍然存在疑问。最近,沃顿商学院教授Ethan Mollick在X平台上分享了一项研究,显示AI对不同劳动力市场的影响。研究发现,AI在某些行业开始替代工作后,虽然一度推动了自由职业者的收入增长,但一旦AI开始取代某些岗位,收入就会下降。比如,翻译行业的收入整体下降了约30%。

Altman对AGI和超人工智能能带来普遍利益持乐观态度,但如果它们仅被少数大公司所控制,可能将导致更多的不平等,而非更好的未来。

AI+商业

Artificial Intelligence & Bussiness

Omi:通过AI和“脑机接口”提高生产力

近期,位于旧金山的初创公司Based Hardware在拉斯维加斯的消费电子展(CES)上发布了其新款AI可穿戴设备Omi,旨在通过AI和“脑接口”提高生产力。Omi可以作为项链佩戴,用户只需说“嘿,Omi”即可激活其AI助手。根据创始人Nik Shevchenko的说法,Omi还可以通过医用胶带附着在头部旁边,借助“脑机接口”技术识别用户是否在与设备互动。

Shevchenko最初将此设备命名为“Friend”,但由于另一家旧金山硬件公司也推出了同名设备并以180万美元购买了该域名,他才决定更改设备名称为Omi。与近年来发布的其他AI设备相比,Omi并不打算替代智能手机或成为AI伴侣,而是作为手机的辅助设备,旨在提升工作效率。

Omi是一款小巧的圆形设备,价格为89美元,预计2025年第二季度开始发货。用户还可以以大约70美元的价格购买开发者版本,立即交付。Omi可以回答问题、总结对话、创建待办事项列表并帮助安排会议。该设备持续监听并通过GPT-4o处理用户的对话,能够记住每个用户的背景信息,以提供个性化的建议。

Shevchenko表示,他知道设备始终在监听可能引发隐私泄露,因此Omi采用开源平台,用户可以查看数据去向或选择将其本地存储。此外,开发者还可以基于Omi的平台开发应用程序,当前已有超过250款应用可供使用。

虽然Omi的“脑机接口”功能是否真正有效仍不确定,但Shevchenko的团队计划逐步拓展其应用场景,初期目标是让设备无需唤醒词即可理解用户是否在与其互动。

Grove利用AI缩短临床试验入组时间

Tran Le曾是斯坦福大学的一名工程学生,当她试图报名参加一项临床试验时,发现注册过程繁琐冗长——她不仅需要与临床试验场所进行大量的电子邮件交流,还要填写多达20页的表格。繁琐的手续让Le看到了使用生成式AI来简化试验入组过程的机会,从而将入组时间从几周缩短到几分钟。去年,她与斯坦福医学学院的同学Sohit Gatiganti共同创立了Grove AI。

Grove AI开发的AI智能体Grace,能够在患者表达对试验的兴趣后立即与其联系,通过语音AI问询患者的预筛查问题,以确定其是否符合试验要求。如果符合,Grace会帮助安排首次访问,供临床管理人员做最终决定。

自成立以来的八个月内,Grove AI已与超过70,000名患者互动,安排了7,000次面谈,并与两家客户签署了多年合同。Grove AI声称,通过这种方式,可以有效解决临床试验入组过程中存在的瓶颈,特别是在涉及繁琐的文书工作和官僚程序时。

近日该公司宣布获得490万美元的种子资金,由风险投资公司A领投,Afore Capital、LifeX Ventures、Upfront Ventures和Pear VC也参与了投资。A的合伙人Gautam Gupta表示,虽然该市场目前并不大,但随着AI和计算生物学的发展,临床试验和药物研究将迎来爆发式增长,Grove AI将成为这一变化的受益者。

Grove AI除了加速临床试验入组外,还计划使用AI帮助整理患者数据,最终打造一个患者关系管理工具。这将解决目前许多临床试验站点仍然依赖电子表格记录患者互动的问题。

因用户投诉,微软撤回Bing图像生成器模型

微软曾宣布升级其Bing图像生成器的AI模型,该工具是集成在公司Bing搜索引擎中的图像编辑工具。微软承诺,新模型——OpenAI的DALL-E 3模型最新版本,代号PR16——能够让用户“比以前更快地生成图像,且质量更高。”

然而,升级后的模型并未达到预期效果,用户的抱怨迅速涌入X和Reddit平台。一名Reddit用户表示:“我们曾经喜爱的DALL-E永远消失了。”另一位用户则写道:“我现在使用ChatGPT,因为Bing对我来说已经没用了。”

由于强烈的反馈,微软决定暂时恢复先前版本的模型,直到解决问题为止。微软搜索部门负责人Jordi Ribas在X平台上表示:“我们已经能够重现一些用户报告的问题,计划恢复到DALL-E 3 PR13版本,直到我们能解决这些问题。”他补充说,恢复过程进展缓慢,预计需要2到3周才能完全恢复。

问题出在哪里?虽然很难通过用户反馈进行对比,特别是当提示词没有标准化时,许多用户反映PR16生成的图像看起来不如以前真实。Windows Latest的Mayank Parmar指出,PR16生成的图像缺乏细节和精致感,呈现出奇怪的卡通风格和“死气沉沉”的感觉。

微软的内部基准测试显示,PR16在平均质量上比先前的模型有所提高,但显然这一指标并未与大多数用户的偏好相符。

海量资讯、精准解读,尽在新浪财经APP
AI 微软
0条评论|0人参与网友评论
最热评论

APP专享直播

开播时间 | 3-14 14:00
聚焦中小股民维权难题 筑牢权益守护防线——新浪财经315投资者保护论坛
开播时间 | 3-14 19:30
《智客星球》大辩论:人形机器人何时走进家庭?
开播时间 | 3-14 16:00
国君资管:这个阶段,进攻还是防守?
开播时间 | 3-14 16:00
永赢基金:全市场首支,聚焦卫星通信的ETF来了!
开播时间 | 3-14 16:00
光大证券李泉:大金融板块爆发,三大因素助力沪指创新高
开播时间 | 3-14 15:20
连麦光大期货:贵金属、豆菜粕、白糖
开播时间 | 3-14 15:00
融通基金:“两会行情”来了吗?解读两会的投资看点
开播时间 | 3-14 15:00
3·15金融消费者权益保护访谈
开播时间 | 3-14 15:00
国投瑞银:“债”与你相遇 | 选“固收”还是“固收+”?
开播时间 | 3-14 13:40
天弘基金:看多港股,全球加仓中国进行时
开播时间 | 3-14 14:00
聚焦中小股民维权难题 筑牢权益守护防线——新浪财经315投资者保护论坛
开播时间 | 3-14 19:30
《智客星球》大辩论:人形机器人何时走进家庭?
开播时间 | 3-14 16:00
国君资管:这个阶段,进攻还是防守?
开播时间 | 3-14 16:00
永赢基金:全市场首支,聚焦卫星通信的ETF来了!
开播时间 | 3-14 16:00
光大证券李泉:大金融板块爆发,三大因素助力沪指创新高
开播时间 | 3-14 15:20
连麦光大期货:贵金属、豆菜粕、白糖
开播时间 | 3-14 15:00
融通基金:“两会行情”来了吗?解读两会的投资看点
开播时间 | 3-14 15:00
3·15金融消费者权益保护访谈
开播时间 | 3-14 15:00
国投瑞银:“债”与你相遇 | 选“固收”还是“固收+”?
开播时间 | 3-14 13:40
天弘基金:看多港股,全球加仓中国进行时
上一页下一页
1/10

热门推荐

《哪吒2》烂番茄开分:100%新鲜度 收起
《哪吒2》烂番茄开分:100%新鲜度

《哪吒2》烂番茄开分:100%新鲜度

  • 2025年03月13日
  • 13:36
  • APP专享
  • 扒圈小记
  • 14,954
APP专享
日本男女在长城上做不雅行为,被驱逐出境!

日本男女在长城上做不雅行为,被驱逐出境!

  • 2025年03月14日
  • 03:52
  • APP专享
  • 扒圈小记
  • 4,714
APP专享
破9!足金金饰价格刷新高

破9!足金金饰价格刷新高

  • 2025年03月13日
  • 15:59
  • APP专享
  • 北京时间
  • 4,021
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 兴福电子 688545 11.68
  • 新浪首页 语音播报 相关新闻 返回顶部
    关闭
    关闭