马斯克终止与甲骨文谈判,xAI将自行建立数据中心、奥特曼成立AI健康公司

马斯克终止与甲骨文谈判,xAI将自行建立数据中心、奥特曼成立AI健康公司
2024年07月10日 17:44 科技每日推送

每日行业新闻

1、马斯克 xAI 终止与 Oracle 服务器交易谈判,与 Dell 和超微半导体合作自建数据中心

据 The Information 最新报道,马斯克 xAI 和甲骨文已结束谈判,以扩大现有协议。根据协议,xAI 从 Oracle 那里租用专用的 Nvidia AI 芯片,但最新消息是 xAI 正在购买芯片,自行建立数据中心。

尽管这一谈判失败了,但 xAI 此前与 Oracle 的芯片租用合作仍将继续,马斯克在 X 上的帖子中表示,xAI 在 Oracle 的产能已从 5 月份的 16000 块增加到 24000 块芯片。

现在,xAI 将在田纳西州孟菲斯建立自己的 AI 数据中心,由 Dell 和超微(Supermicro)提供Nvidia 芯片。(来源:有新Newin)

2、OpenAI CEO 萨姆·阿尔特曼成立AI健康公司Thrive AI Health

OpenAI CEO 萨姆·阿尔特曼与AI医疗健康巨头Thrive Global的CEO阿里安娜·赫芬顿一起在《时代》杂志上发表了一篇文章,正式宣布了Thrive AI Health公司的成立。

Thrive AI Health的目标是打造一个个性化“AI健康教练”,以手机App形式呈现。

目前公司CEO是谷歌前健康和可穿戴设备负责人德卡洛斯·洛夫(DeCarlos Love),OpenAI创业基金和Thrive Global是主要投资方。

X平台投资自媒体Startups IO发文称,Thrive AI Health从OpenAI创业基金筹集了1500万美元,目前Thrive AI Health官方并未公布具体的融资金额。(来源:智东西)

3、a16z 花 5 亿美金买 2 万个英伟达 GPU 租给被投企业

The lnformation 的消息称,a16z 正在建立一个包含超过 2 万个 GPU 的储备库,以吸弓和支持人工智能 (AI) 领域的初创公司。

目前 a16z 已经获得了包括 Nvidia H100 在内的数千个 AI 芯片,并计划将其租给其投资组合中的公司,并计划将这些GPU 集群扩展到超过2万个,这与马斯克的 xAl 用于训练其 Grok 大型语言模型的数量大致相同。

通过这个新工具,a16z 希望在竞争激烈的 Al 初创公司投资领域获得更多优势。GPU 是 AI 模型训练的关键组件,因为它们能够同时处理大量数据,加速机器学习算法的运算过程。(来源:Memo AI)

4、中国工程院院士郑纬民:国产AI芯片核心问题是生态不够好,如果生态好60%的性能也有人用

信息化百人会(ChinaInfo100,信百会)2024年度研讨会上,中国工程院院士、清华大学计算机科学与技术系教授郑纬民发表演讲。

郑纬民表示,AI 大模型正在从单模态向多模态发展,同时应用也很多,这使得算力爆发性增长,算力一直供不应求。但同时,相比英伟达,国产 AI 芯片系统生态不够好。

什么是生态系统好呢?

郑纬民给出的定义是,如果原来用英伟达写了一个AI CUDA软件,现在很容易移植到国产系统上,写起来的方法跟原来差不多,就叫生态好。如果移植起来,没有一年两年移不过来,那就是不好。

“现在我们的状况就是生态不太好,所以大家不喜欢用。”郑纬民认为,这需要做好系统设计和相关软件优化,具体包括十个方面:编程框架、并行加速、通信库、算子库、AI编译器、编程语音、调度器、内存分配系统、容错系统、存储系统等。

他表示,生产AI芯片的厂家,一定要把这个十个方面做好,做好了大家就喜欢用。在郑纬民看来,在国产算力支撑大模型训练时,国产AI芯片只要达到国外芯片60%的性能,但如果把前述十个方面的软件生态新做好了,客户也会满意会用。(来源:钛媒体AGI)

5、用魔法打败魔法,电信公司已部署 AI 遏制诈骗电话

诈骗团伙已开始部署 AI 来实施诈骗,而电信公司同样部署了数百个 AI 聊天机器人,“用魔法打败魔法”,帮助用户免受诈骗电话的侵扰。

诈骗团伙目前已经使用 Lenny 的工具来实施诈骗,该 AI 工具会自动播放一系列语音信息,有效延长骗子的通话时长,并可以扩充各种内容来提高诈骗成功率。

电信公司现在已经开始使用数百个人工智能聊天机器人,其中一款名为 Ibrahim。(来源:IT之家)

6、彻底改变语言模型:全新架构TTT超越Transformer,ML模型代替RNN隐藏状态

一种全新的大语言模型(LLM)架构有望代替至今在 AI 领域如日中天的 Transformer,性能也比 Mamba 更好。

本周一,有关 Test-Time Training(TTT)的论文成为了人工智能社区热议的话题。

该研究的作者来自斯坦福大学、加州大学伯克利分校、加州大学圣迭戈分校和 Meta。他们设计了一种新架构 TTT,用机器学习模型取代了 RNN 的隐藏状态。该模型通过输入 token 的实际梯度下降来压缩上下文。(来源:机器之心)

7、Gartner:64% 受访者不希望客服系统部署 AI

市场调查机构 Gartner发布调查报告,表示 64% 的受访客户不希望客服使用 AI。该调查还指出 53% 的客户如果发现某家公司客服使用 AI,会考虑转向竞争对手。

Gartner 于 2023 年 12 月问卷调查了 5728 名客户,虽然不少客服公司都在积极部署 AI 服务,但客户对此并不买账。(来源:IT之家)

8、商汤大语言模型应用 SenseChat 向香港用户免费开放,支持广东话聊天

商汤科技宣布,旗下 Sensechat 手机 App 及网页版向香港用户免费开放。该服务此前已在中国大陆推出。

Sensechat 基于商汤今年 5 月推出的“商量多模态大模型粤语版”,依托商汤“日日新”语言和多模态能力,以及对粤语及本地文化、热点的理解,用户可以直接用最熟悉的广东话跟它聊天,直接文字或语音输入,问问题、搜东西、生成图片、写文案等。(来源:IT之家)

9、英伟达GaTech华人学者提出RankRAG框架

佐治亚理工学院和英伟达最近发表的一篇论文提出——RAG可以不止停留在用于推理的pipeline中,类似的思路完全可以移植到微调阶段,于是有了这个名为RankRAG的框架。

他们的思路可以概括为:用微调拓展模型的能力,把原来RAG需要额外模型的检索、排名任务全丢回给LLM自己。

结果发现,不仅数据效率提高了,模型性能也有显著增强,相比今年5月刚提出的ChatQA-1.5系列有显著优势。

在9个通用基准和5个生物医学的知识密集型基准上,RankRAG用Llama 3 8B/70B微调出的模型分别超过了同样基座上ChatQA-1.5的两个微调模型,Llama3-ChatQA-1.5-8B和Llama3-ChatQA-1.5-70B。(来源:新智元)

10、富国银行:2030年AI产业用电需求将激增8050%,达652TWh

富国银行(Wells Fargo)近日发布了一项预测,指出人工智能(AI)的电力需求将在未来几年内呈现爆炸性增长。

据该银行预测,今年的AI用电需求已达到8太瓦时(TWh),而到2030年,这一数字将飙升至652 TWh,实现惊人的8050%的增长。(来源:ITBEAR科技资讯)

每日投融资事件

1、AI 文档搜索公司 Hebbia 宣布完成 1.3 亿美元融资

周一,位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资,由 a16z 领投,Index Ventures、Google Ventures 以及 Peter Thiel 参投。

据悉,Hebbia 目前估值约为 7 亿美元,公司成立于 2020 年,其软件可分析数字化文档和数据源,包括监管文件、PDF 以及音频和视频剪辑,以帮助客户处理比面向消费者的聊天机器人更复杂的查询,类似 Glean。(来源:有新Newin)

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 07-15 绿联科技 301606 --
  • 07-11 科力装备 301552 30
  • 07-01 乔锋智能 301603 26.5
  • 06-26 键邦股份 603285 18.65
  • 06-24 安乃达 603350 20.56
  • 新浪首页 语音播报 相关新闻 返回顶部