来源:MacTalk
昨天,创造 Arc 浏览器的那家硅谷创业公司,在 Youtube 上发布了一个招聘视频,透露了他们正在研发的新一代浏览器 Dia。简单来说,Dia 是一个全新理念的 AI 浏览器,它充分把 AI 的能力融入到了浏览器之中,用于提升用户的效率和使用体验。
浏览器对于 PC 的重要性无须多言。我公司几个非研发类的同事,日常他们除了打开 IM 软件之外,其他的工作几乎都可以在浏览器中完成。作为载体,浏览器非常了解我们在什么时间点做了什么事情,诸如,此刻我正在写一篇文章,浏览器可以知道我打开了哪个网站,点了哪些按钮,还做了什么操作。
那有没有可能让浏览器变得更智能呢?比如:我告诉浏览器,我想写篇文章,它就能打开对应的网站,并新建一个文档,甚至还能帮我直接起个头。再比如此刻,我想打开 Gmail,给同事写封邮件,这至少需要三步:第一,在浏览器中输入域名 gmail.com;第二,点击“写邮件”按钮;第三,输入收件人的邮箱。
或许,我们可以发出一个指令,让浏览器一键直达第三步时的状态。毕竟,浏览器完全可以根据过去的行为,推断出来我的真实意图。这就是 Dia 浏览器要做的事情。其实,这个理念他们已经在 Arc 浏览器中简单实现过了,只不过,新浏览器 Dia 将进一步开枝散叶。
这让我想起了另外一款应用 Rewind。它可以安装到 Mac 和 iPhone 上,在征得用户允许后,Rewind 会记录用户在电脑上的一切行为,实现方法大致是每隔几秒钟进行一次屏幕截图,然后从截图中提取数据,进行结构化的分析和存储。在此基础上,我们可以向 Rewind 提问:我和谁谁谁是怎么认识的?最近有哪些交互?Rewind 会把过去一段时间相关的信息都列出来。
Dia 在 Rewind 的基础上更进一步。Rewind 因为是第三方软件,所以只能通过截图或者其他方式来了解用户的行为,并且在操作层面上由于权限的限制,掣肘也比较多。但倘若这个能力嫁接到用户高频使用的浏览器中,那想象空间会更大。
你可能会说,是不是在操作系统层面做这事会更合适?是的,微软做了 Recall,但却遭到了用户抵制,大家害怕泄露隐私。虽然微软一直都强调这些数据只保留在本地,但谁敢相信呢?这也是我一直没用 Rewind 的主要原因。
视频中,浏览器公司首席执行官 Josh Miller 展示了 Dia 的三个功能。
第一,在所有需要输入的地方,都可以提供智能的输入建议,续写、扩写或者总结。这和我们见到的各个文档的 AI 能力类似。第二,在地址栏中输入命令来执行某个操作,比如要求它根据描述来查找特定文档,并通过邮件发送给某个朋友。第三,完成更复杂的任务。比如,让他帮忙把几个商品添加到购物车中,再或者,从某个网页找到数据,再填入到文档中合适的位置。
看起来,我还是觉得挺酷的。虽然很多人评论说都是些花里胡哨的功能,但我感觉 Arc 团队确实认真思考了 AI 时代的浏览器应该具备什么样的能力。在此之前,我没有听人讨论过类似的问题,这就是创新。
至少,现在我很喜欢视频中提到的几个功能。日常工作中,我们有不少时间都消耗在了重复的工作之上,在重复之中,我甚至都已经形成了肌肉记忆。把光标放到浏览器上,输入某个网站域名的前几个字母,再在右侧靠上的位置点击新建按钮.....如果有一天,浏览器可以自动执行这些操作,那我认为,它是能够提高创造效率的。
视频的最后,Josh Miller 通过一个故事,讲述了他对于这次 AI 技术浪潮的思考。他说, 1879 年爱迪生发明灯泡只是技术上的突破,并没有改变世界。真正改变世界的是爱迪生决定用一组电灯泡来照亮纽约市中心。
单个灯泡只是更好的蜡烛,更好的蜡烛固然不错,但它并没有实现革命性的突破。只有当人们围绕人造光重建世界时,一切才发生了变化。夜晚变得和白天一样有生产力,日常生活的节奏本身也被改变了。
今天,我们的 AI 也类似。我们已经发明了开创性的语言模型,但我们所能做的只是在界面上散布 AI 按钮,就像单个灯泡一样,这些孤立的 AI 特性只是更好的按钮。真正的变革将发生在我们让 AI 遍布我们的计算环境时。这就是 Dia 的使命。
Dia 将会在 2025 年推出。
---
2024 年还剩下最后一个月。又到了抬头看路的时候,每年的这会,我都会集中几周时间,出去走走,和不同的朋友们聊聊,开阔些思路。这个月中旬,火山引擎会在上海办一场大会,我看到议题涉及 AI 大模型等内容。
特别声明:以上内容仅代表作者本人的观点或立场,不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的,请于上述内容发布后的30天内进行。
400-690-0000 欢迎批评指正
All Rights Reserved 新浪公司 版权所有