AI+技术
Artificial Intelligence Technology
微软发布最新小型语言模型Phi-4,为未来AI模型发展提供新方向
微软近日推出了其Phi系列最新成员——Phi-4生成式AI模型。这是一类小型语言模型,拥有140亿个参数,将与其他小型模型如GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku竞争。这些小型模型通常运行更快且成本更低,随着近年来的技术进步,其性能得到了逐步提升。
目前,Phi-4仅通过微软新推出的Azure AI Foundry开发平台对外提供,且仅限研究人员在微软的研究许可协议下使用。微软表示,Phi-4在多个方面比前代模型有所改进,尤其在数学问题的解决能力上表现更加出色,这部分得益于更高质量的训练数据,包括高质量的合成数据集和人工生成内容数据集,以及一些未公开的后期训练改进。
Phi-4的发布引起了业内的广泛关注,特别是在合成数据和后期训练技术方面的创新,也为未来AI模型的发展提供了新的方向。值得注意的是,Phi-4是继微软AI副总裁Sébastien Bubeck离职后发布的首个Phi系列模型。Bubeck于10月离开微软加入OpenAI。
Meta发布AI生成视频水印工具,助力打击深度伪造内容
Meta近日推出了一个名为“Meta Video Seal”的新工具,旨在为AI生成的视频添加不可察觉的水印,帮助打击日益严重的深度伪造(deepfake)问题。该工具现已开源,旨在与现有软件集成,成为Meta现有水印工具(如Watermark Anything和Audio Seal)的一部分。
随着生成式AI的普及,伪造内容的数量急剧增加。据ID验证平台Sumsub统计,2024年全球深度伪造内容数量比2023年增加了四倍,占所有欺诈行为的7%。Meta表示,Video Seal旨在提供一种更有效的视频水印解决方案,尤其是用于检测AI生成的视频并保护原创内容。
与其他视频水印技术相比,Meta认为现有的一些工具在面对视频压缩、社交平台内容共享时的有效性和可扩展性上存在不足。Video Seal能够在视频中加入隐藏信息,用户可在之后揭示这些信息以追踪视频来源。此外,Video Seal在抵抗常见编辑(如模糊处理和裁剪)以及流行的压缩算法方面表现优异。
尽管如此,Video Seal仍面临一些挑战,特别是水印的可察觉度与其对编辑的抗干扰能力之间的平衡。Meta希望通过推出公开排行榜和举办学术研讨会,与AI研究人员和开发者共同推进这一领域的发展。
OpenAI:与ChatGPT相关的功能进行史
自2022年11月推出以来,OpenAI的ChatGPT已经风靡全球,成为一款广受欢迎的AI聊天工具。最初,它仅作为一种提升生产力的工具,用于通过简短的文字提示编写论文和代码,而现在,它已经发展成为一个拥有3亿每周活跃用户的巨头。
2024年对OpenAI来说是重要的一年,从与苹果合作推出生成型AI产品Apple Intelligence,到发布具备语音和视觉能力的GPT-4o,再到备受期待的文本生成视频模型Sora。OpenAI通过“12 Days of OpenAI”系列活动,持续展示新产品和功能,包括Sora模型和实时视觉功能的发布。
然而,这一年也并非只有重大功能发布和模型更新,OpenAI内部也经历了不小的动荡,包括联合创始人兼首席科学家伊利亚·苏茨科夫(Ilya Sutskever)和CTO米拉·穆拉蒂(Mira Murati)等高层高管的离职。OpenAI还遭遇了版权侵犯的诉讼,以及由埃隆·马斯克发起的关于停止OpenAI向盈利转型的禁令。
随着OpenAI的持续发展,ChatGPT的功能不断扩展,2024年带来了许多新功能,包括增强的语音模式、代码编辑工具Canvas的推广等。此外,OpenAI还计划在12月23日之前继续推出更多新功能。
AI+技术
Artificial Intelligence Technology
Gemini:Google在生成式人工智能领域的下注
Google正在通过其旗舰生成式人工智能模型套件——Gemini,掀起风潮。那么,Gemini究竟是什么?如何使用它?与OpenAI的ChatGPT、Meta的Llama以及Microsoft的Copilot等生成性AI工具相比,它的优势如何?
Gemini是Google长期承诺的下一代生成式人工智能模型系列,旨在提供多模态能力,能够处理和分析文本、音频、图像和视频等多种数据类型。Gemini的训练数据来自公开、专有和授权的音频、图像、视频以及文本数据集,与以文本为唯一训练数据的LaMDA有所不同。因此,Gemini能够理解和生成不仅限于文本的内容。
Gemini与Google的其他应用程序(如Bard)不同,后者是与模型连接的客户端,通过聊天界面与用户互动。通过这些客户端,用户可以上传图像、语音命令和文本文件,并生成相应的内容。Gemini还逐步进入Google的工作应用中,如Gmail、Google Docs和Google Sheets等,帮助用户编写、整理和分析内容。
Gemini还引入了一个“进阶版”,即Google One AI Premium Plan,用户可通过该计划享受更强大的模型功能和更长的对话记忆支持。此外,Gemini还能够在Google的硬件产品上提供增强功能,包括Pixel手机、Google TV和Nest设备。
虽然Gemini的功能多样,但也存在一些问题,如生成内容的偏见和错误信息,因此在使用时仍需谨慎。总的来说,Gemini代表了Google在生成式人工智能领域的重大进展,并预示着未来在AI应用领域的巨大潜力。
Albert Invent :初创AI平台革新化学行业 赢下头部客户
生成式AI在科学领域的应用正迅速增长,尤其是在研究与开发过程中,AI的采用能够加速实验进程,减少试错环节。Albert Invent是最新进入这一领域的初创公司,提供一个基于过去化学实验数据的AI平台,帮助化学家在制定化学品时对分子级数据进行分析。该平台已获得2250万美元的A轮融资,由Coatue领投。
Albert Invent的核心平台名为Albert Breakthrough,结合了结构化数据与公司专有的AI模型。该平台旨在帮助化学公司更快速且高效地开发新产品。公司表示,平台能生成实时的毒理学预测,并在某些方面“超越”传统的行业模型。其客户包括Chemours、Solenis、Keystone Industries、Applied Molecules、Henkel和Nouryon等。
Albert Invent的CEO兼联合创始人Nick Talken表示,该平台将为化学科学带来与数据科学家所享受的技术相似的突破。他认为,许多全球面临的重大问题,如可持续发展和个性化医疗设备,都可以通过化学来解决。Albert Invent已经基于1500万种化学分子构建了专有的基础模型,并且其平台正被世界上一些最大的化学公司所使用。

VIP课程推荐
APP专享直播
热门推荐
收起
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)