AI商业洞察 | Meta发布AI生成视频水印工具，助力打击深度伪造内容_新浪财经

AI+技术

Artificial Intelligence Technology

微软发布最新小型语言模型Phi-4，为未来AI模型发展提供新方向

微软近日推出了其Phi系列最新成员——Phi-4生成式AI模型。这是一类小型语言模型，拥有140亿个参数，将与其他小型模型如GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku竞争。这些小型模型通常运行更快且成本更低，随着近年来的技术进步，其性能得到了逐步提升。

目前，Phi-4仅通过微软新推出的Azure AI Foundry开发平台对外提供，且仅限研究人员在微软的研究许可协议下使用。微软表示，Phi-4在多个方面比前代模型有所改进，尤其在数学问题的解决能力上表现更加出色，这部分得益于更高质量的训练数据，包括高质量的合成数据集和人工生成内容数据集，以及一些未公开的后期训练改进。

Phi-4的发布引起了业内的广泛关注，特别是在合成数据和后期训练技术方面的创新，也为未来AI模型的发展提供了新的方向。值得注意的是，Phi-4是继微软AI副总裁Sébastien Bubeck离职后发布的首个Phi系列模型。Bubeck于10月离开微软加入OpenAI。

Meta发布AI生成视频水印工具，助力打击深度伪造内容

Meta近日推出了一个名为“Meta Video Seal”的新工具，旨在为AI生成的视频添加不可察觉的水印，帮助打击日益严重的深度伪造（deepfake）问题。该工具现已开源，旨在与现有软件集成，成为Meta现有水印工具（如Watermark Anything和Audio Seal）的一部分。

随着生成式AI的普及，伪造内容的数量急剧增加。据ID验证平台Sumsub统计，2024年全球深度伪造内容数量比2023年增加了四倍，占所有欺诈行为的7%。Meta表示，Video Seal旨在提供一种更有效的视频水印解决方案，尤其是用于检测AI生成的视频并保护原创内容。

与其他视频水印技术相比，Meta认为现有的一些工具在面对视频压缩、社交平台内容共享时的有效性和可扩展性上存在不足。Video Seal能够在视频中加入隐藏信息，用户可在之后揭示这些信息以追踪视频来源。此外，Video Seal在抵抗常见编辑（如模糊处理和裁剪）以及流行的压缩算法方面表现优异。

尽管如此，Video Seal仍面临一些挑战，特别是水印的可察觉度与其对编辑的抗干扰能力之间的平衡。Meta希望通过推出公开排行榜和举办学术研讨会，与AI研究人员和开发者共同推进这一领域的发展。

OpenAI：与ChatGPT相关的功能进行史

自2022年11月推出以来，OpenAI的ChatGPT已经风靡全球，成为一款广受欢迎的AI聊天工具。最初，它仅作为一种提升生产力的工具，用于通过简短的文字提示编写论文和代码，而现在，它已经发展成为一个拥有3亿每周活跃用户的巨头。

2024年对OpenAI来说是重要的一年，从与苹果合作推出生成型AI产品Apple Intelligence，到发布具备语音和视觉能力的GPT-4o，再到备受期待的文本生成视频模型Sora。OpenAI通过“12 Days of OpenAI”系列活动，持续展示新产品和功能，包括Sora模型和实时视觉功能的发布。

然而，这一年也并非只有重大功能发布和模型更新，OpenAI内部也经历了不小的动荡，包括联合创始人兼首席科学家伊利亚·苏茨科夫（Ilya Sutskever）和CTO米拉·穆拉蒂（Mira Murati）等高层高管的离职。OpenAI还遭遇了版权侵犯的诉讼，以及由埃隆·马斯克发起的关于停止OpenAI向盈利转型的禁令。

随着OpenAI的持续发展，ChatGPT的功能不断扩展，2024年带来了许多新功能，包括增强的语音模式、代码编辑工具Canvas的推广等。此外，OpenAI还计划在12月23日之前继续推出更多新功能。

AI+技术

Artificial Intelligence Technology

Gemini：Google在生成式人工智能领域的下注

Google正在通过其旗舰生成式人工智能模型套件——Gemini，掀起风潮。那么，Gemini究竟是什么？如何使用它？与OpenAI的ChatGPT、Meta的Llama以及Microsoft的Copilot等生成性AI工具相比，它的优势如何？

Gemini是Google长期承诺的下一代生成式人工智能模型系列，旨在提供多模态能力，能够处理和分析文本、音频、图像和视频等多种数据类型。Gemini的训练数据来自公开、专有和授权的音频、图像、视频以及文本数据集，与以文本为唯一训练数据的LaMDA有所不同。因此，Gemini能够理解和生成不仅限于文本的内容。

Gemini与Google的其他应用程序（如Bard）不同，后者是与模型连接的客户端，通过聊天界面与用户互动。通过这些客户端，用户可以上传图像、语音命令和文本文件，并生成相应的内容。Gemini还逐步进入Google的工作应用中，如Gmail、Google Docs和Google Sheets等，帮助用户编写、整理和分析内容。

Gemini还引入了一个“进阶版”，即Google One AI Premium Plan，用户可通过该计划享受更强大的模型功能和更长的对话记忆支持。此外，Gemini还能够在Google的硬件产品上提供增强功能，包括Pixel手机、Google TV和Nest设备。

虽然Gemini的功能多样，但也存在一些问题，如生成内容的偏见和错误信息，因此在使用时仍需谨慎。总的来说，Gemini代表了Google在生成式人工智能领域的重大进展，并预示着未来在AI应用领域的巨大潜力。

Albert Invent ：初创AI平台革新化学行业赢下头部客户

生成式AI在科学领域的应用正迅速增长，尤其是在研究与开发过程中，AI的采用能够加速实验进程，减少试错环节。Albert Invent是最新进入这一领域的初创公司，提供一个基于过去化学实验数据的AI平台，帮助化学家在制定化学品时对分子级数据进行分析。该平台已获得2250万美元的A轮融资，由Coatue领投。

Albert Invent的核心平台名为Albert Breakthrough，结合了结构化数据与公司专有的AI模型。该平台旨在帮助化学公司更快速且高效地开发新产品。公司表示，平台能生成实时的毒理学预测，并在某些方面“超越”传统的行业模型。其客户包括Chemours、Solenis、Keystone Industries、Applied Molecules、Henkel和Nouryon等。

Albert Invent的CEO兼联合创始人Nick Talken表示，该平台将为化学科学带来与数据科学家所享受的技术相似的突破。他认为，许多全球面临的重大问题，如可持续发展和个性化医疗设备，都可以通过化学来解决。Albert Invent已经基于1500万种化学分子构建了专有的基础模型，并且其平台正被世界上一些最大的化学公司所使用。