财经科技创事记

算法背的锅太多了

2025-01-09 21:03:09 创事记作者：

来源：远川研究所

上世纪五十年代，普通美国家庭每天看电视的时间“高达”6小时。显像管技术迎来黄金时代，但质疑声接踵而至。1950年波士顿大学的毕业典礼上，时任校长、禁酒令坚定支持者丹尼尔·马什对电视毫不留情地开炮[1]：

“如果电视热潮继续以目前的水平发展下去，我们注定会成为一个白痴国家。”

时过境迁，晶体管、集成电路、GPS、Unix架构等一个个塑造现代世界的创新接二连三的诞生于这个白痴国家，电视机普及衍生出的电视辩论成为了美国大选的标配环节，但“白痴论”的加害者名单却越印越长。

上世纪90年代，消费电子产业爆发式增长，电脑可用内存增加、图像影音表现力增强，电子游戏开始出现，随之而来是关于“技术有害”的担忧。廉价电脑生产商Commodore 64为此想了一条广告语：

当您可以买一台能为子女准备上大学的家用电脑时，为何会买一台令子女玩物丧志的游戏机呢？

每种新事物的面世，几乎都会经历误解-争议-培养的命运轮回，最终在漫长的博弈中，探索出一套行之有效的秩序规范。

二十世纪，从电视电脑到动画游戏，从未逃过大毒草的帽子，最新一位进场选手是算法。

人们面对新技术的艰深造物，难免会产生相似的恐惧。其中，短视频或更广义的内容领域，是算法引发种种争议的核心地带。

然而算法的内涵并非一个“猜你喜欢”的推荐黑盒，其学术定义是“以数学方式或者计算机代码表达的意见”，也就是说，它是一种处理信息的新生产力工具。

人类从未有过信息如此爆炸的时代。小到打车、找餐厅，大到股票交易、自动驾驶，每个人都在与信息产生互动。据IDC报告，全球每年产生的数据在2025年会增长到175ZB。

这是什么概念？以25MB/秒的下载速度计算，下载全人类一年产生的数据需要18亿年。

算法为人类提供一种与巨量信息相处的方式。作为一种应用工具，它早已深入社会生活的脉络肌理，形塑了一个远比下滑推荐更复杂、更广阔的世界。

一门技术的胜利

在人工智能这个细分产业里，“算法”是神经网络技术流派下的产物。

2012年，人工智能学者杰夫·辛顿双持英伟达GTX580勇闯ImageNet。他们研发的AlexNet算法模型，通过模拟人脑运转的方式训练电脑，以84%的识别准确率成功夺冠，一举推高了行业准确率，证明了神经网络在图像识别等复杂任务上的能力。

杰夫·辛顿和他的两名学生，他们在2012年被谷歌收入囊中

神经网络算得上最正宗、最原教旨的“算法”。辛顿团队的开创性在于，科技公司从中看到了人工智能产业化的愈发清晰的可能性。

算法决定了计算机识别事物的方式、并为具体的数据处理需求对应解决方案。算法的需要足够大的算力来驱动；而算法的优化也需要大规模高质量的数据，因此算法、算力和数据被称为人工智能三大基石，三者相辅相成。

就像汽车取代马车一样，算法介入大大小小的移动互联网产品，是一种必然趋势。

首先，低门槛的内容供给，必然带来信息分发的效率问题。

人类一脚踏入互联网时代后，内容供给的指数级提升。从博客、视频网站到之后的自媒体、短视频，互联网让信息生产的门槛不断降低，供给则迅速增加。

YouTube曾在2017年初披露过一组数据，早在2016年，YouTube用户每天观看视频的总时长就超过了10亿小时，是2012年收看时长的10倍。为了应对视频内容近乎膨胀的规模，YouTube开始编写算法，利用用户数据进行个性化推荐，从而提高推荐效率。

现代人每天接收到的信息量是1986年的5倍，相当于175份报纸[2]，这种爆炸式的信息输入规模增长，使得“如何分发信息”成为了一门技术。

即便在互联网时代，中心化的媒介依然无法高效匹配信息的供需两端。无论是单纯的搜索，还是发布时间、视频时长等结构化的指标，都难以胜任精准推荐的诉求，算法在内容产业的应用由此而来。

在短视频普及前，今日头条已经是一个基于算法的产物，用以应对内容供给增加带来的信息分发效率问题。而这种以兴趣推荐为参照系的算法，又随着快手、抖音这类短视频平台的出现，随之得到应用。

2016年，“英国选手”AlphaGo在围棋比赛上战胜了李世石

其次，线上线下的融合趋势让算法成为了移动互联网时代的最优解。

以电商为代表，在打车、外卖、招聘等一个个场景线上化的过程中，Web时代的搜索逻辑在海量的信息面前同样捉襟见肘，以精准匹配为目标的技术方案完成了对诸多线上化场景的改造。电商平台的千人千面，OTA平台的精准推荐，几乎都离不开算法的参与。

除了在短视频中的应用，早年间关于“大数据杀熟”、“骑手困在系统里”等讨论，都可以溯源到算法在互联网产业的渗透。

也就是说，在人们熟知的AlphaGo大战李世石和GhatGPT出现前，算法就已经在各行各业落地生根，其定位类似于互联网产品的一种“通用技术接口”，在不同的场景中扮演者不同的角色。

当AGI的浪潮袭来，最先应用算法的互联网公司，也自然成为了前沿探索的桥头堡。

一个重要的前置产业

2017年，八位发量浓密的谷歌研究员经过长达数月的合作，发表了一篇名为《Attention Is All You Need》的论文。论文中提出了一种名为“Transformer”的语言处理架构，成为生成式人工智能兴起的标志性事件。

时至今日，在大模型、自动驾驶、具身智能等人工智能的热门前沿分支，几乎都能找到Transformer划时代的身影。

正如iPhone的诞生要仰仗苹果在iPod上积累的无数经验和专利，Transformer架构的诞生并非孤立的事件，而是大量AI科学家在神经网络研究的基础上，不断推陈出新的成果。

科技领域的许多创新看似自于偶然，但在更长尺度的周期里，它们的诞生大多有迹可循。其中一个鲜明的共性是：下一个时代的推动者，大多是上一个时代的成功者。

2012年，在斯坦福教书的吴恩达以顾问的身份进入谷歌，主持“谷歌猫”图像识别项目研究。吴恩达之所以选择与Google合作，很大程度上是因为只有Google拥有算法训练所需要的数据和算力，而这又建立在Google庞大的数据规模和强大的盈利能力的基础上。

换句话说，Google在移动互联网和云计算产业取得的巨大成功，让他们有足够的动力投资下一个时代的前沿技术。这种动力的具体表现，就是“谷歌猫”项目动用的16000个CPU组成的算力，这是当时产业界能提供的最复杂的计算机系统。

吴恩达在谷歌设计了“谷歌猫”项目

虽然“谷歌猫”的地位远远不及后来的辛顿团队，但如果没有搜索和云计算业务源源不断的数据与现金流，Google也无力进行深度学习领域的前沿探索。

台积电的先进工艺依靠的不是“十万青年十万肝”的口号，而是高达55%的毛利率。同理，如果中国的互联网公司没有建立在算法上的成功业务，人工智能的发展也会止步不前。

2021年末训练GPT-4时OpenAI耗尽了网上所有可靠的英文文本资源，为此不惜偷偷到YouTube扒了超过一百万小时的视频语料；拥有如今最强开源大模型Llama的Meta，本身就是全球最大的社交媒体平台，手握天文数字的训练资源。

另一方面，互联网公司基于用户体验对推荐算法的迭代过程，在无形中为人工智能做了许多技术沉淀。

针对推荐算法延伸出的内容生产需求，2020年，抖音和今日头条上就已经出现了绘画特效类的AICG功能；之后字节推出豆包大模型，“全家桶”的每一块，都能对应上字节成熟的业务线；无独有偶，阿里的通义“文生图”模型能快速上线，离不开在阿里在电商领域的长期积淀。

人工智能领域，中美之间的竞争甚嚣尘上，一个关键原因在于，只有中国和美国拥有全世界规模最大的互联网产业。

繁荣的互联网和消费电子产业带动了芯片设计、数据中心、云计算等一系列细分门类的建立，这些都是发展人工智能重要的基础设施。

大模型或许看上去比短视频更“高级”，但没有后者创造的商业模式反哺算法研发，前者其实无从谈起，两者在产业发展的路径中唇齿相依。

更重要的是，并非所有互联网公司都在参与前沿领域的探索和竞争，但他们都在为这些领域的探索者提供宝贵的人才储备。

高校可以筛选人才，但培养人才的只能是本土优势产业。

近年中国游戏产业快速发展，某种程度上得益于影视产业储备了大量特效人才；新能源车领域，传统车企也苦于留不下IT人才。如坐针毡的丰田甚至开始鼓励9000名员工“转码”，学习编程语言，转岗软件工程师。

马斯克与OpneAI的阿尔特曼，两人本身就是硅谷互联网创业者

云计算、自动驾驶、大模型等前沿技术领域开始繁荣，成长于互联网产业的工程师人才，恰好能成为前者的“预备役”。说直白一些，AI公司们拿到融资要大干一场，HR们还得从互联网公司招兵买马。

就像不能脱离电商谈直播带货一样，英伟达在AI时代大杀四方，是因为一大批游戏玩家给黄总报销过研发成本。事实上AI的进步，离不开互联网公司们优化信息分发、精准匹配的漫长积累。

罗马不是一天建成的，你不能只在开着辅助驾驶的时候才热爱算法。

一种被看见的价值

时至今日，自动驾驶仍然存在着一个暂时无法打败的敌人：Corner Case。

Corner Case指发生概率极低的事件。最典型的场景莫过于前车突然爆装备，比如纸箱、水瓶或运猪车上跌落的二师兄。如果没有提前的预案，自动驾驶状态下的汽车很有可能直接撞上去。

然而，无穷无尽的Corner Case并不代表自动驾驶是一项不值得研究的技术，它与今天处于舆论风口上狭义的“算法”其实处境类似。

2015年后，移动互联网产业的发展进入井喷期，“家人老铁”在千元智能机面前迅速集结，网红在真实的个体下沉叙事中反客为主，关于算法的种种讨论与争议由此产生。

算法是一个无比年轻的技术分支，从技术到规范，处处是亟待填补的拼图。但从更长的时间周期看，新技术如电视电脑和自动驾驶，往往是在争议之后创造了更大的价值。

推荐算法也是一样，在它出现前，一个人能看到的世界是非常狭窄的。人与人之间的最大公约数，要么是近在咫尺的学历阶层，要么是遥远的新闻站队。

于是南方小孩很难想象东北人如何猫冬；县城父母很难知道清华北大的课堂是什么样子；城市白领很难意识到千里之外，有人在过日落而息的生活；一些宝藏小店、传统手艺或者小众旅游美景，只能活在限定区域的口耳相传中。

正是因为推荐算法把信息与人高效连接在一起，才让更多人有了“被看见”、“被讨论”的机会。

今年年初，“开封王婆”频频登上各大平台热搜。“王婆”本名赵梅，是河南开封万岁山武侠城的一位演员，负责主持一档名为“王婆说媒”的表演项目，展现大宋开封市井文化。

不料她口才极佳的“说媒”，被一众无心插柳的短视频博主发到网上，在网友的口碑效应下迅速走红。不仅让万岁山武侠城客流迎来爆发，还让短视频评论区变成了全国年轻人的大型相亲现场。

类似的故事在时时刻刻发生：2023年9月，一条名为“探访‘三花’剧团开放式化妆间”的短视频在网络上流传，让这个名不见经传的剧团由此火爆全网，吸引了大批网友观戏。

短短三个月，“三花”川剧团通过网络平台卖出2.5万张票，几乎是过去两年多的总和，如今剧团演出场场爆满，老川剧团迎来了新生。

无论是开封的“王婆说媒”还是四川的三花剧团，即便口才再好、技艺再高，在推荐算法诞生前，想红遍大江南北都不容易。当推荐算法将这些鲜活的表演快速匹配全国乃至全世界的观众，他们就产生了前所未有的影响力——某种程度上看，智能推荐反而让内容展现出更加多元和多彩的一面。

当单向、中心化的媒介变成了双向、去中心化的媒介，内容生产和分发的门槛被大幅降低，由此还带来了一个巨大的改变：一个人的才智和技能，可以轻而易举的创造价值。

不管是讲物理学、欧洲古代史，还是探店、卖货、做手工，每个拥有一技之长的人都有自己独特的价值。在上一个互联网时代，他们被信息洪流埋没。但在推荐算法的帮助下，越来越多的人被真正看见，他们不再依赖土地、设备、工厂这些经典的“生产资料”，通过一部手机就可以将自己的才能快速变现。

四川95后小伙王光强曾亲历汶川地震，2017年九寨沟发生7.0级地震，农产品运输受阻，许多水果滞销，这让他决心做一些事。

毕业后，王光强顶着家人的不理解回到故乡，在抖音注册了账号“阿坝小王子”，为家乡的樱桃、杏子、李子等农产品带货找销路。返乡创业近五年后，“阿坝小王子”已经成为当地农村致富的一名带头人。

王光强（左二）与果农

2024年7月，网络主播正式进入国家职业分类，主播们有了新职业身份。正因为推荐算法让普通人“被看见”成为可能，才创造了全新的就业岗位。

作为一种技术工具，算法在不当使用时的确会产生负面作用。许多人不满当前的信息环境，但在这个线上线下无限融合的现代社会中，其实很难简单区分哪些问题是媒介造成、哪些问题是社会造成。

算法打破了过去的社交同温层，让人们意识到不止有同温层的观点，世界上还有另一群人可能有不一样的观点。如果认为不使用推荐算法，这个社会就不会产生问题，其实是一种过于简化的思路。

“有害的可能”不应该成为阻碍技术进步的理由，合理的探索、有效的干预防范是被历史无数次验证过的有效路径。

让汽车更安全的思路不是限制发动机的功率，而是提醒驾驶员，无论如何都要系紧安全带。

参考资料

[1] Criticism of 1950s Television, 20th century history song book

[2]「快速定斷」現象成大趨勢？資訊爆炸的時代下數碼網路速食文化是好是壞, BAZZAR

作者：包志远

编辑：李墨天

视觉设计：疏睿

责任编辑：李墨天

（声明：本文仅代表作者观点，不代表新浪网立场。）

分享到:

保存 | 打印 | 关闭

算法背的锅太多了

微博推荐

作者简介

作者文章

推荐阅读

新闻热榜