AI+伦理
Artificial Intelligence & Ehtics
谷歌前AI研究员创办非营利组织,致力于开发AGI基准测试
前谷歌工程师、著名AI研究员François Chollet正在联合创办一个非营利组织——ARC奖学金基金会(ARC Prize Foundation),旨在开发新的基准测试,以评估AI系统是否达到“人类水平”智能。该基金会将由前Salesforce工程总监、AI产品工作室Leverage创始人Greg Kamradt领导。
ARC奖学金基金会的筹款活动将在1月晚些时候启动。Chollet表示,基金会的目标是“成为推动通用人工智能(AGI)进步的有用指引。”基金会将基于Chollet开发的ARC-AGI测试,这是一种旨在评估AI系统是否能高效学习超出其训练数据的新技能的工具。该测试涉及一系列类似难题,比如AI必须从不同颜色的方块中生成正确的“答案”网格,挑战其适应能力。
虽然许多AI系统可以轻松解决数学奥林匹克考试题目和博士级问题,但迄今为止,最强大的AI系统仍然未能完全突破ARC-AGI的考题。“我们不是通过超人类的考试问题来衡量AI风险,而是希望通过缩小与人类能力之间的差距来推动进展,”Chollet在博客中写道。
该基金会计划推出第二代ARC-AGI基准,并启动新的竞赛,同时继续设计第三版测试。Chollet还强调,ARC-AGI尽管存在局限性,但它仍然是评估AI是否具备人类水平智能的重要工具。
更强大的AI即将到来,但它的好处能否均等分配?
近日,OpenAI的CEO Sam Altman在个人博客中表示,他相信OpenAI已经掌握了构建通用人工智能(AGI)的方法,并开始将目标转向超人工智能(superintelligence)。他认为,超人工智能将“极大加速”创新,远超人类独立能达到的成就。
一项新研究表明,AI能够帮助专家提高工作效率。来自芝加哥大学和麻省理工学院的研究人员发现,投资者使用GPT-4o总结财报后,能实现更高的回报率。另据报道,初创公司Prime Intellect发布了一款AI模型METAGENE-1,专门用于检测人类废水样本中的病原体,推动了生物监测和疫情防控的进步。
然而,随着AGI和超人工智能的快速发展,是否所有人都能受益仍然存在疑问。最近,沃顿商学院教授Ethan Mollick在X平台上分享了一项研究,显示AI对不同劳动力市场的影响。研究发现,AI在某些行业开始替代工作后,虽然一度推动了自由职业者的收入增长,但一旦AI开始取代某些岗位,收入就会下降。比如,翻译行业的收入整体下降了约30%。
Altman对AGI和超人工智能能带来普遍利益持乐观态度,但如果它们仅被少数大公司所控制,可能将导致更多的不平等,而非更好的未来。
AI+商业
Artificial Intelligence & Bussiness
Omi:通过AI和“脑机接口”提高生产力
近期,位于旧金山的初创公司Based Hardware在拉斯维加斯的消费电子展(CES)上发布了其新款AI可穿戴设备Omi,旨在通过AI和“脑接口”提高生产力。Omi可以作为项链佩戴,用户只需说“嘿,Omi”即可激活其AI助手。根据创始人Nik Shevchenko的说法,Omi还可以通过医用胶带附着在头部旁边,借助“脑机接口”技术识别用户是否在与设备互动。
Shevchenko最初将此设备命名为“Friend”,但由于另一家旧金山硬件公司也推出了同名设备并以180万美元购买了该域名,他才决定更改设备名称为Omi。与近年来发布的其他AI设备相比,Omi并不打算替代智能手机或成为AI伴侣,而是作为手机的辅助设备,旨在提升工作效率。
Omi是一款小巧的圆形设备,价格为89美元,预计2025年第二季度开始发货。用户还可以以大约70美元的价格购买开发者版本,立即交付。Omi可以回答问题、总结对话、创建待办事项列表并帮助安排会议。该设备持续监听并通过GPT-4o处理用户的对话,能够记住每个用户的背景信息,以提供个性化的建议。
Shevchenko表示,他知道设备始终在监听可能引发隐私泄露,因此Omi采用开源平台,用户可以查看数据去向或选择将其本地存储。此外,开发者还可以基于Omi的平台开发应用程序,当前已有超过250款应用可供使用。
虽然Omi的“脑机接口”功能是否真正有效仍不确定,但Shevchenko的团队计划逐步拓展其应用场景,初期目标是让设备无需唤醒词即可理解用户是否在与其互动。
Grove利用AI缩短临床试验入组时间
Tran Le曾是斯坦福大学的一名工程学生,当她试图报名参加一项临床试验时,发现注册过程繁琐冗长——她不仅需要与临床试验场所进行大量的电子邮件交流,还要填写多达20页的表格。繁琐的手续让Le看到了使用生成式AI来简化试验入组过程的机会,从而将入组时间从几周缩短到几分钟。去年,她与斯坦福医学学院的同学Sohit Gatiganti共同创立了Grove AI。
Grove AI开发的AI智能体Grace,能够在患者表达对试验的兴趣后立即与其联系,通过语音AI问询患者的预筛查问题,以确定其是否符合试验要求。如果符合,Grace会帮助安排首次访问,供临床管理人员做最终决定。
自成立以来的八个月内,Grove AI已与超过70,000名患者互动,安排了7,000次面谈,并与两家客户签署了多年合同。Grove AI声称,通过这种方式,可以有效解决临床试验入组过程中存在的瓶颈,特别是在涉及繁琐的文书工作和官僚程序时。
近日该公司宣布获得490万美元的种子资金,由风险投资公司A领投,Afore Capital、LifeX Ventures、Upfront Ventures和Pear VC也参与了投资。A的合伙人Gautam Gupta表示,虽然该市场目前并不大,但随着AI和计算生物学的发展,临床试验和药物研究将迎来爆发式增长,Grove AI将成为这一变化的受益者。
Grove AI除了加速临床试验入组外,还计划使用AI帮助整理患者数据,最终打造一个患者关系管理工具。这将解决目前许多临床试验站点仍然依赖电子表格记录患者互动的问题。
因用户投诉,微软撤回Bing图像生成器模型
微软曾宣布升级其Bing图像生成器的AI模型,该工具是集成在公司Bing搜索引擎中的图像编辑工具。微软承诺,新模型——OpenAI的DALL-E 3模型最新版本,代号PR16——能够让用户“比以前更快地生成图像,且质量更高。”
然而,升级后的模型并未达到预期效果,用户的抱怨迅速涌入X和Reddit平台。一名Reddit用户表示:“我们曾经喜爱的DALL-E永远消失了。”另一位用户则写道:“我现在使用ChatGPT,因为Bing对我来说已经没用了。”
由于强烈的反馈,微软决定暂时恢复先前版本的模型,直到解决问题为止。微软搜索部门负责人Jordi Ribas在X平台上表示:“我们已经能够重现一些用户报告的问题,计划恢复到DALL-E 3 PR13版本,直到我们能解决这些问题。”他补充说,恢复过程进展缓慢,预计需要2到3周才能完全恢复。
问题出在哪里?虽然很难通过用户反馈进行对比,特别是当提示词没有标准化时,许多用户反映PR16生成的图像看起来不如以前真实。Windows Latest的Mayank Parmar指出,PR16生成的图像缺乏细节和精致感,呈现出奇怪的卡通风格和“死气沉沉”的感觉。
微软的内部基准测试显示,PR16在平均质量上比先前的模型有所提高,但显然这一指标并未与大多数用户的偏好相符。


APP专享直播
热门推荐
《哪吒2》烂番茄开分:100%新鲜度 收起《哪吒2》烂番茄开分:100%新鲜度
- 2025年03月13日
- 13:36
- APP专享
- 扒圈小记
14,954
日本男女在长城上做不雅行为,被驱逐出境!
- 2025年03月14日
- 03:52
- APP专享
- 扒圈小记
4,714
破9!足金金饰价格刷新高
- 2025年03月13日
- 15:59
- APP专享
- 北京时间
4,021

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
数字江恩今天 09:46:25
【3月限时vip活动】3月板块轮动加快,哪些赛道机会更好?数字江恩《股知道VIP》48小时VIP课程2元(原价8元),月课限时特价979元(原价1088元)。活动截止3月31日。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:46:06
大盘虽然周四五都有异动,但本人还是坚持观点,3400不可能靠大力出奇迹的站稳,3400的站稳一定是反复上下震荡之后。目前不过第一次突破3400,依旧需要震荡,而不是直接拉升。此外,下周有小时间窗口,和3140的上涨无关,但是3297的向上走势结构,将发生变盘,配合这30分钟图上的压力,和5分钟图上的结构足矣判断。 -
数字江恩今天 09:46:01
30分钟图来看,目前大盘面临两个30分钟级别的阻力位置。其一,是前高3418所对应的白色箱体压力,这里哪怕略为突破,短线也只是震荡;其二,是图上的3509-3494蓝色轮峰线压力,这条压力线,下周暂时难以逾越。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:45:46
看5分钟图,只看3297上来的走势结构,那么在3341做第一轮的白色平行线。大盘在白色平行线之上,还可以小幅拉高,而只要衰竭到白色平行线之下,这个冲高便算告一段落了。目前大盘指数距离白色平行线距离很远,所以下周初可以有大幅震荡。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:45:31
大盘本周科技较为疲软,而周五推动大盘突破3400整数位的主要是金融和大消费板块,细分则是保险、食品饮料和酿酒板块涨幅均超过了5%,证券板块涨幅超3%。 -
数字江恩今天 09:45:27
大盘本周和上周成交量持平,属于3140反弹至3300-3386区间震荡后的缩量周K小阳线。本周大盘继续以10周线为支撑,这条线也将是未来大盘重要支撑。 -
数字江恩今天 09:45:21
下周行情展望2025.03.14 -
宋谈股经今天 08:47:07
今日共87股涨停,连板股总数13只,25股封板未遂,封板率为78%(不含ST股、退市股)。焦点股方面,信隆健康(sz002105)午后上演“地天板”走出9连板,金饰概念股明牌珠宝(sz002574)一字涨停晋级4连板,华丰股份(sh605100)、塞力医疗(sh603716)、湖北广电(sz000665)等人气股跌超8%。 -
北京红竹今天 07:59:08
3、跷跷板行情一直都处于跷跷板的模式,只有强弱的问题,月线级别向上,后期每个板块都能轮动得到,今天大涨的都是权重类的,白酒、券商、消费。但是持续性暂时先别想,没有还没有明确的持续性,继续保持多头情绪,持有的品种别乱动就行,不涨就踏实呆着。短线的话就看自己了,可以按照冰点逻辑搞短线。 -
北京红竹今天 07:59:05
2、今天涨了能买吗?这是今天大涨之后有同学问的,当然短线无所谓,只要你的个股回落到冰点,并且有资金那就可以干。但对于波段和长线来说,这里涨到哪里都没有位置,只有持有的份。任何级别的上涨都不应该谈论买的事,而是考虑如何卖的事。而任何级别的下跌都应该考虑如何买的事,而不是卖的事。这是咱们这帮人利用缠论交易体系,最起码的交易逻辑。想谈买入波段和长线的同学等待吧,有仓位的继续持有吧。