在一次招聘活动中,Cognition的首席执行官Scott Wu给求职者们出了道题,看他们能否比AI更快地算出平方数。他说:“如果你做得比Devin还好,那就来和Cognition团队谈谈吧,看我们有没有什么工作适合你。”
获得2亿美元融资后,28岁的Scott Wu和他极富好胜心的Cognition编程团队正努力打造一款人工智能(AI)工具,让它能像 “一支初级工程师军队”一样完全自主编程。
原文标题:《码农担心这家估值20亿美元的初创公司会让他们丢饭碗》
2023年圣诞节前夕,这家旧金山AI初创公司的一支小团队尝试为公司的编程助手Devin设置一台特别复杂的数据服务器,但进展不顺。他们花了好几个小时翻阅安装文档、尝试不同的命令,但始终无法让服务器正常工作。他们疲惫不堪,心生沮丧,决定看Devin自己会如何处理这个问题。
这个AI工具开始运作后,它的开发者们困惑不已。“它运行了一些看起来就像是巫术或黑魔法的命令。”21岁的联合创始人兼首席产品官Walden Yan回忆道。起初,Devin似乎并没有比他们做得更好。但片刻后,长时间都是红色的服务器终端指示灯变成了绿色。服务器终于成功启动了。
他们意识到,Devin删除了团队没有注意到的一个错误系统文件。“那一刻,我真切地感受到软件工程将会发生怎样的变化。”Yan说。
这是Devin完成的第一个重大任务,也证明Cognition对AI的构想是成立的——让它来代劳编程工作中枯燥乏味的苦差。
现在,时间已快过去一年,Devin已能处理一些基本的编程任务,如发现并修复漏洞、更新代码以及在不同平台间迁移代码。只要给它一个简单的指令,例如“清理这个代码库”,它就能制定出执行计划并付诸实践。大多数时候,它都能顺利完成任务。
在AI编程这个方兴未艾的领域中,也有比Devin更知名、规模更大的参与者,如GitHub(微软在2018年以75亿美元将其收购)和估值13亿美元的Codeium,两者都提供数字助手,可帮助人们根据AI的建议编写代码。
Devin则采取了一种不同的方法。它是一款完全自主的AI智能体,理论上可以独立编写代码,无需人工介入,并且能够完成通常由开发人员承担的完整项目(“Devin”这个名字源于“dev”,即“developer”的缩写)。Cognition的联合创始人兼首席执行官Scott Wu表示:“我们看到了一个真正的机会。我们可以从文本补全再进一步,转向完成整个任务。”
AI生成的代码已经开始重新塑造整个行业了。
10月,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,谷歌超过四分之一的新代码是由AI编写的。7月,微软首席执行官萨提亚·纳德拉(Satya Nadella)称,2024年GitHub年化收入突破20亿美元,其代码补全工具贡献了40%的收入增长。Pitchbook分析师布伦丹·伯克(Brendan Burke)说,AI编程已成为生成式AI领域融资最多的应用领域,专注于此的初创公司单在2024年上半年就融资超10亿美元。
“现实中的软件工程就是非常复杂混乱的。”Scott Wu,Cognition首席执行官
实际收入才刚刚显露增势:市场研究公司IDC预计,到2029年,AI编程创造的收入将超过40亿美元。多家AI编程初创公司的年收入已经超过1000万美元。Cognition未透露其具体收入,但公司总裁罗素·卡普兰(Russell Kaplan)表示,Cognition已经签约数十家客户,合同每年的金额通常在六到七位数之间。这个市场的潜力令人兴奋,Anthropic、亚马逊和IBM等巨头以及Poolside(估值30亿美元)和Anysphere(估值4亿美元)等初创公司纷纷推出了自家的编程工具。
IDC分析师里图·乔蒂(Ritu Jyoti)表示,能够编写代码已成为一般AI模型“上牌桌的基本要求”,他指出,该领域的领导者仍是OpenAI的ChatGPT。但像Cognition开发的那种可以完全自主工作的编程AI“将会为行业带来天翻地覆的变化”。
不过,这对美国500万名程序员来说可能不是什么好消息(他们的年薪中位数为13万美元),对印度和中国的1300万程序员来说更谈不上喜讯。Wu坚称,程序员大规模失业并不会很快发生,再者编程领域的就业本就已受“供给上限”制约。
程序员们可能会如坐针毡,投资者对这样的变化却喜闻乐见。彼得·蒂尔(Peter Thiel)的创始人基金(Founders Fund)和Khosla Ventures押宝Wu和他的25人团队,4月在Cognition的B轮融资为其注入1.76亿美元,将公司估值推高至20亿美元。此次注资距Cognition成立才过去六个月,距其1月完成2100万美元A轮融资才过去三个月。
Cognition的客户包括年收入3亿美元的支出管理公司Ramp,它用Devin编写测试代码并清理死代码;另一个客户是年收入17亿美元的数据平台MongoDB,其首席产品官萨希尔·阿扎姆(Sahir Azam)表示,公司用Devin更新过时的代码架构,为客户节省了数百万美元。年收入80亿美元的金融科技公司Nubank的程序员也在使用Devin来完成更新代码库等任务。
尽管Cognition才刚起步,前路还很漫长,但创始人基金的合伙人约翰·卢蒂格(John Luttig)仍决定向其投资,原因之一是他觉得Cognition先发优势明显,“其他人要在编程智能体方面赶上他们会十分困难”。微软似乎也有类似的预感。它在5月与Cognition达成合作协议,将Devin部署在Azure云平台上,供开发人员使用。微软首席技术官凯文·斯柯特(Kevin Scott)在公司年度开发者大会上盛赞Devin是一款“非凡”的工具。
然而,硅谷满是曾经领先亚马逊和谷歌,却最终折戟的公司。Cognition的支持者赌的是,如果有谁能够创造出终极的编程机器,那就是三位有重磅奖项加持的世界级“码农”。
Cognition的这三位创始人都是奥林匹克竞赛的金牌获得者,相识于编程领域的竞赛中。
Wu小时候就展露出数学天分,在程序员社交及编程比赛网站Codeforces上达到了代表最高等级的“传奇大师”级别。Cognition的天使投资人、Ramp的首席执行官埃里克·格莱曼(Eric Glyman)表示,Wu的智商在他见过的人中“能排进前五”。
“斯科特显然非常聪明,好奇心旺盛,而且雄心勃勃。”风险投资人郭睿(Sarah Guo)说。她通过自己的公司Conviction参与了Cognition的三轮融资。Wu还曾在2019年作为Lunchclub的创始人而入选《福布斯》“30 Under 30”榜单。Lunchclub利用AI协助用户安排会面、拓展人脉,一位Cognition的投资者告诉《福布斯》,Wu于2022年离开Lunchclub,因为他的兴趣转向了其他地方(Wu拒绝对此置评)。Lunchclub目前已筹资约3000万美元,仍在继续运营。
Cognition在3月推出了Devin,引发大量关注。
公司在X上发布的演示视频累计观看量已达3000万次,称Devin“成功通过了领先AI公司现实中的工程面试”,并完成了复杂的编程任务。一些工程师被Devin的技术实力震惊,其他人则担心自己会碗饭不保。Devin发布后不久,Wu小学七年级在一场数学竞赛中横扫全场的视频被翻出,网友们开玩笑说,“他不是人,而是个AI。”他们还说,“Devin其实就是Scott用消息应用回答你的问题。”
然而,得克萨斯州奥斯汀的著名独立开发者卡尔·布朗(Carl Brown)提出了质疑。他发布了一则名为《“扒皮”Devin》的视频,观看量超50万次。他指出Cognition在宣传其“AI工程师”的能力时夸大其词。他在评测中发现,Devin完成任务的时间远超过人类,过程中还出现了错误。
类似的使用体验促使一些人质疑Devin是否只是把AI泡沫吹得更大了。
数据标注公司Labelbox的工程师克里什·马奈尔(Krish Manair)曾测试过Devin的网页应用创建能力,让它设计一个让人眼前一亮的用户界面,但它给出的结果却十分乏味。
一些竞争对手公司的创始人告诉《福布斯》,他们认为Cognition对Devin的能力做出了不切实际的承诺,让人误以为工程师可以直接拿Devin来编写任何代码。他们认为,Devin目前的能力范围要狭窄得多,更侧重于清理现有代码之类的预定义任务。在一次现场演示中,《福布斯》让Devin构建一款用来给吉他调音的应用。它大约用了10分钟完成,但该应用无法正确识别用来测试的音符,Cognition的几位创始人也不清楚原因。竞争对手、编程初创公司Codeium首席执行官瓦伦·莫汉(Varun Mohan)表示:
Wu承认Devin远谈不上完美。
他在俯瞰旧金山湾区的创始人基金总部表示。“人类一直都在写有漏洞的东西。”而且,说句公道话,多位批评者也对这款工具的能力也表示认可。
Wu表示,Devin发布七个月以来已取得显著改善,一定程度上要归功于早期企业客户的反馈,他们似乎接受了这个智能体是个需要不断改进的产品。Nubank首席技术官维克多·奥利维耶(Vitor Olivier)说:“我们并不指望这个工具会有多么神奇的效果。我们对它持谨慎乐观的态度。”他说,在某些案例中,使用Devin的工程师工作效率提高了八倍。
Cognition还在继续尝试和探索。
去年早些时候,它给Devin添加了启动下属AI为自己提供辅助的功能。然而,当Cognition测试这个新的“管理者”模式时,它发现Devin确实启动了下属AI,但这些下属又启动了更多的下属,形成了一个庞大的、永无止境的AI官僚主义怪圈。“最终我们不得不取消任务,因为它们会不断地把工作委派下去。”卡普兰表示。
不过,卡普兰指出,当多个Devin像“一支初级工程师军队”那样同时进行不同项目时,效果最好。卡普兰的这个描述可能会让一些以编程为生的人不安。Wu表示,Cognition之所以引发了些许负面情绪,一定程度上是因为人们不知AI是否会抢走软件工程岗位,因而感到焦虑。他认为,Devin可以帮助公司承担更多的项目,公司也就能雇用人类员工去做更有意义的工作。
“外界确实有很多担忧,”他说。“人们有很多疑问,不知新范式下会发生什么。”
本文译自:
https://www.forbes.com/sites/rashishrivastava/2024/12/02/cognition-scott-wu-devin-ai/
文: Rashi Shrivastava、Richard Nieva
翻译:Lemin
APP专享直播
热门推荐
特朗普称“极有可能”在就职后将TikTok禁令延期90天 收起特朗普称“极有可能”在就职后将TikTok禁令延期90天
- 2025年01月18日
- 19:22
- APP专享
- 广西台新闻910
- 11,328
3.5万元买下北海道170平一户建,“免费送的也有”,中国年轻人“捡漏”日本低价中古房
- 2025年01月18日
- 08:40
- APP专享
- 我是山河君
- 8,510
警惕!手机NFC功能已成骗子的“提款机”
- 2025年01月18日
- 04:58
- APP专享
- 我是山河君
- 945
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 03:02:28
根据洛图科技最新发布的《全球显示器市场品牌整机出货月度追踪》报告数据显示,2024年全年,全球显示器市场品牌整机的出货量为1.27亿台,与2023年相比上涨1.5%。戴尔在2024年的全球出货量为23.7百万台,位居当年出货量第一,同比微幅上涨0.2%。预测2025年全球显示器出货量仍然保持稳定的增长态势,达到1.29亿台,涨幅约为2%。 -
趋势领涨今天 03:02:21
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 00:47:15
【春运第五天全社会跨区域人员流动量2.07亿人次】,昨天是春运第五天。记者从2025年综合运输春运工作专班了解到,昨天(18日),全社会跨区域人员流动量达2.07亿人次。其中,全国铁路发送旅客1355万人次,加开旅客列车821列。全国铁路今天开始发售2月2日,也就是农历大年初五的车票。此外,昨天全国公路人员流动量为1.91亿人次,民航客运量226万人次,水路客运量63万人次,环比均呈现增长态势。 -
趋势领涨今天 00:32:43
另外,昨天还有两条重磅:一是贝莱德发声:A股市场2025年有更多投资机会贝莱德集团在上海举办了一场2025年投资展望分享会,贝莱德中国区负责人表示,贝莱德看好A股市场的长期机遇,今年会推出更丰富的投资产品,满足多样化的投资需求。2025年最看好A股的投资机会。主要看好三个方向:第一,看好科技,因为科技是全球浪潮;第二,从确定性角度,看好红利类资产;第三,看好消费,看好促消费政策带来的影响。对贝莱德这三个方向,我们还是非常赞同的,科技、消费加红利股。今年将是消费刺激大年,消费板块经过了长时间调整,比如白酒、医药等,也确实该启动一下了。二是与中国股票挂钩的ETF看涨期权受到追捧周五,交易员抢购与中国股指挂钩的交易所交易基金(ETF)的看涨期权。投资者买进了使其有权在下周结束之前以31-32美元的价格购买约400万股安硕中国大盘股ETF的看涨期权,也买入了一些2月份到期的期权。总之,周五电话之后,市场看多声音一片,我们上周也多次提示,都在等待20号靴子落地再抄底,都在等待的事情,你们觉得市场会给你机会吗? -
趋势领涨今天 00:32:35
周末最引人注目的消息当然是TikTok的消息,今天是美国政府强行要求短视频社交平台TikTok出售或面临被禁的最后期限。当地时间1月17日,美国最高法院裁定支持短视频社交媒体平台TikTok在美禁令。TikTok的应用程序最早将于19日在美国下架。去年4月24日,板凳签署法案,要求TikTok母公司字节跳动在270天内将TikTok出售给非中国企业,否则这款应用程序将在美国被禁用。TikTok在美国有约1.7亿用户,这是一个非常庞大的用户群体,这些用户已经对TikTok产生了依赖。现在如果板凳不执法,如果美国的服务提供商继续支持tiktok的运营那就是违法的,虽然板凳说现在不执法,老特也可以暂时不执法,但如果相关磋商没成功,联邦政府执法罚这些服务商,将是巨额罚款。每个用户5000美元,1.7亿用户需要多少钱?昨晚最新消息,老特“极有可能”在就职后给予TikTok90天的禁令延缓执行期限。这个90天的禁令延缓期就是给他们协商的,接下来只有国会再通过法律,暂停或推翻禁令。否则,TikTok还是要被下架,字节跳动一直表示,不会卖tikTok。TikTok每次消息,当然影响最大的就是小红书,小红书就成为美国用户的首选。当然,TikTok的用户群体不会全部转化为小红书的流量,但肯定会有庞大的用户群体转移过来。前期小红书概念经过了连续大涨,龙头壹网壹创(sz300792)、引力传媒(sh603598)、来伊份(sh603777)等都是连续涨停,但周五基本都是跌停,下周一能否再次出现反包,就看老特明天的讲话了,老特是受益于TikTok的,TikTok在他的竞选当中功不可没,所以,他是不会让TikTok随意下架的,那就说明了大家炒作小红书需要谨慎,当然急涨急跌随时会出现。 -
趋势领涨今天 00:32:09
大家早上好!趋势为王,做股海的领航者,新的一天,新的战斗,欢迎你来到本直播室!新进的朋友请注意点赞,收藏本直播室,以方便你下次观看,谢谢大家的支持!【更多独家重磅股市观点请点击】 -
趋势领涨2025-01-18 14:00:39
本周末,tiktok依然牵动大家的神经。如果拜登不会执行禁令,是不是tiktok就可以继续运营?答案是否定的。首先,针对tiktok的禁令是美国国会通过的法律,所以即使拜登政府不执法,如果美国的服务提供商继续支持tiktok的运营就是违法的,虽然拜登政府说现在不执法,特朗普也可以暂时不执法,但如果相关磋商没成功,联邦政府执法罚这些服务商,将是巨额罚款。每个用户5000美元,现在tiktok在美国1.7亿用户。 所以解铃还须系铃人,接下来只有国会再通过法律,暂停或推翻禁令。 -
趋势领涨2025-01-18 08:27:19
外资巨头展望2025年中国市场: 看好宏观经济韧性 股债行情均可期。近日,全球资管巨头贝莱德、富达、瑞银等机构陆续发布2025年中国市场展望。总体来说,上述外资机构对2025年中国宏观经济和股市表现均持较为乐观的态度。其中,贝莱德和富达不约而同地认为,受到政策托底和流动性充裕等因素影响,2025年中国股市、债市行情均可期。 -
趋势领涨2025-01-18 07:30:43
中国贸促会昨天举办发布会,对外发布了第三届中国国际供应链促进博览会的筹备工作情况。第三届链博会的各项工作正在有序推进,目前已有近70家中外知名企业签约参展。第三届链博会产业链供应链国际合作的特色更加突出。同时,第三届链博会海外路演活动也即将于本月启动,首站将设在泰国。 -
趋势领涨2025-01-18 04:12:26
深信服(sz300454)(300454)在互动平台回复投资者称,公司作为有限合伙人参与设立的股权投资基金广州琥珀安云二期创业投资合伙企业于2024年投资了杭州宇树科技有限公司。截至目前,琥珀安云基金持有宇树科技0.6279%的股权。琥珀安云基金与公司相互独立,其对外投资决策由该基金的投委会决定。