来源:创业邦
作者丨刘杨楠
编辑丨海腰
图源丨midjourney
今天的AI界,从不缺造神的故事。
技术小白和技术大牛之间,往往就相差了若干Prompts的距离。
最近,17岁高中生调试80多版打造的神级Prompt(名为Thinking-Claude)引发争议,有人感叹又一位天才Prompt少年横空出世,也有人提醒广大LLM的应用开发团队,不要被情绪冲昏头脑,认为这个Prompt过于复杂且可维护性较低,堪称最糟糕的“代码屎山”。
过去一年,类似的争论屡见不鲜,LangGPT(中文名称为“结构化提示词”)创始人云中江树已经见怪不怪。他将各方观点转进社群,呼吁大家学习可取之处,同时理性看待争论。
目前,LangGPT是国内最大的Prompt社区。
2023年5月,LangGPT在GitHub正式上线后,便迅速获得开发者喜爱,并与通义千问、Kimi等模型厂商达成合作,共同推出官方Prompt模板。
直到今天,LangGPT在GitHub上的Star数仍在增长。目前,LangGPT国内飞书知识库的访问量已达20万,全网传播超100万,微信私域社群成员超4000人。
今年4月,云中江树辞去自动驾驶工程师的工作,全职投身LangGPT创业。过去一年多,借助LangGPT的平台,云中江树看到了一个AI时代“万花筒”般的切面。
“这么简单的东西,
居然能这么火?”
2021年,正在武汉大学读研究生的云中江树,在一篇论文中看到了“Prompt tuning”这个概念,顿时眼前一亮。
“当时很多AI应用都是通过微调完成的。先预训练,然后用数据集微调模型的输出层,实际微调多少层,多少参数等等都是可以变化的,甚至可以全参微调。微调有很多好处,缺点也很明显,依赖高质量标注数据,需要调试训练超参数,常常训练失败,甚至性能不如预训练模型。而Prompt tuning不需要训练模型,只需要调整提示词即可,由于模型参数不会更新,所以能充分利用预训练模型的泛化性。”
之后,云中江树便开始自学Prompt tuning,逐渐接触到了变量、模板、结构化等概念。
2022年底,ChatGPT推出后,云中江树探索了上百个AI项目,整理成ChatGPT中文指南开源后,连续数天登上GitHub全球热榜。他发现这些项目的核心都在于“如何更好调用大模型能力”。而Prompt工程,便是调用大模型能力的起点。
当时,国内外社交媒体上关于Prompt工程的热度越来越高。这让云中江树有些意外:“当时我们都很惊讶,这么简单的东西居然这么火?”
“2023年初大家觉得ChatGPT很惊艳,对一切都很感兴趣,大家都想知道别人用Prompt改变了什么,很多人在社交软件上随便发一些奇奇怪怪的Prompt技巧就有很多人来学。”他回忆道。
于是,云中江树开始有意识地梳理、提炼自己写Prompt的经验,并逐渐从专业开发者视角,转变为普通用户视角,试图找到一种Prompt方法论,让自己能用20%的实验精力,去降低技术小白们80%的使用AI的门槛。
经过几个月的迭代,2023年5月,LangGPT在GitHub正式上线,迅速获得开发者喜爱,之后与通义千问、Kimi等模型厂商达成合作,共同推出官方Prompt模板。
直到今天,LangGPT在GitHub上的Star数仍在持续增长。目前,LangGPT的飞书知识库访问量已达20万,全网传播超100万,私域社群成员超4000人。
目前,LangGPT社群成员大致有两类,一类是广大的AI使用者,一类是前沿应用的开发者。而应用开发者中,有人想提升个人工作效率,更关注有效的Prompt模板;有人想下场创业,更关注应用场景。让云中江树有些意外,但很惊喜的是,有公司组织技术或产品人员甚至组团加入社群,学习如何用Prompt工程开发AI应用。
最火热的时候,云中江树一度感受到了一股“全民学习Prompt”的浪潮,下到十几岁的青少年,上至七八十岁的老人,各有各的好奇与狂热。“有一位七十多岁的老人,是一个旅游协会的副会长,几乎没有缺席过任何一场社群线下活动。”他回忆道。
不过现在回想起来,云中江树也坦言,这种感受或许也是一种“幸存者偏差”。毕竟对于14亿中国人而言,Prompt工程还是一个太小众的话题。
进入2024年,ChatGPT激起的喧嚣褪去,社群里的人来来走走。大浪淘沙之后,留到最后的,都是真正希望用AI改变些什么的人。
AI应用开发离不开Prompt工程
Prompt工程从出现在公众视野的那一刻,就伴随着唱衰的声音。
当时,包括Sam Altman在内的一众大佬都认为,随着大模型性能提升,模型对世界的理解足够充分时,就不再需要Prompt工程。Altman曾表示:“五年后我们将不再需要Prompt 工程,或者只需在这方面做少量工作;将来的AI系统不会因为增补了某个特定词就产生截然不同的输出,而是可以较好地理解自然语言。用户只需以文本和语音形式输入指令,就可以让计算机完成图像生成、资料研究、心理咨询等复杂任务。”
云中江树从不避讳谈论Prompt的消亡。他坦言,自己最初也认为Prompt可能会像一阵风一样过去,但事实却并非如此。
毫无疑问,今天的模型已经越来越擅长理解人类意图。云中江树也发现,国外开发者似乎不太关注Prompt工程了,但国内对于Prompt工程的热情却是只增不减。
总体上,云中江树认为,模型进展仍低于预期,很多AI应用开发仍然离不开Prompt工程。OpenAI发布o1时,他便在社群内表示:“o1指出了一个有前途的方向,对学术研究而言是座金矿,能立马投入,但对于应用者来说,仍然是不实用的玩具,很慢、很卡且不能控制细节。”
这种情况下,要想快速推进应用,Prompt就是一个性价比更高的着力点。
但过去两年,虽然大模型用户对Prompt的学习热情高涨,各家大模型厂商对Prompt的实际重视程度却并不高。除了Anthropic工程师近期对外详细分享了Prompt工程心得外,国内外头部模型厂商或AI应用开发者都鲜少公开分享Prompt工程经验。
这种不重视甚至直接反映在产品设计中。Anthropic工程师David Hershey在近期的分享中也提到,跟客户合作时发现,很多人在设计模型时总是想象着用户会在对话框里输入完美的内容,但很多用户可能连大写字母都从来不用,几乎每个词都有拼写错误。
“实际上,Prompt工程在AI应用开发中的ROI很高,开发者花费20%的经历就可能让产品用户体验提升80%。”云中江树表示,“目前市面上发布的Agent,主要价值都体现在Prompt工程。在构建AI应用的过程中,所有的idea都要先通过Prompt去验证。”
好在,云中江树观察到,国内很多企业正在意识到Prompt工程的重要性。“很多去年做微调的应用企业今年都放弃微调,转而在Prompt工程上投入更多。毕竟即使是微调,也要面临昂贵的算力成本。”
值得注意的是,Prompt的门槛虽然不高,但要做好也需要投入足够的时间、精力。
模型技术仍在快速迭代,对Prompt的要求也在不断变化,要想通过Prompt让模型实现想要的功能,就难免要大量调整Prompt的细节,在大量失败中总结一些奇奇怪怪的方法和技巧,个人很难凭一己之力穷尽所有可能。
LangGPT这类开源社区真正的价值所在,就是汇集四面八方的集体智慧,尽可能释放Prompt对模型应用落地的价值。
结构化Prompt成为主流选择
随着模型快速迭代,大牛们对Prompt工程的方法论也在不断迭代。
目前,一个最新共识是,Prompt的核心在于“清晰的表达”。
“最初我认为Prompt是AI时代的编程语言,后来发现这仍然没有跳出上一代的局限性,现在我更倾向于认为,Prompt是自然语言和编程语言结合的交叉点。‘怎么写’不是最重要的,更重要的是‘写什么’。”云中江树表示。
“专业的技术人员反而不一定能写出很好的Prompt。因为技术人员有时会陷入Prompt的形式,而忽略表达的内核,写了很多冗余的规则,但没说清楚自己的具体需求。”
Anthropic负责Prompt的工程师近期也在一档播客节目中表达过相似的观点:“很多时候,需要做的只是写一个非常清晰的任务描述,而不是尝试构建抽象的东西。你得把自己脑海中所有你知道但模型不知道的东西整理清楚,然后写下来。”
但在过去一年的Prompt实践中,Prompt工程师们无形中也在表达形式上形成了一种默契——结构化Prompt正逐渐成为主流选择。
Anthropic工程师David Hershey表示,一个好的写作者不一定会成为一个好的Prompt工程师。“Prompt是一种很特别的模式,你写的是一段文本,但要像对待代码一样对待它。”
云中江树也感受到,结构化写作Prompt正在成为共识,国内尤其如此。
这个结论从现存Prompt社区的活跃程度上也能看出一二。2023年12月,创业邦在《欢迎来到Prompt的美丽新世界》一文中写道,2023年国内外出现了很多大小不一的Prompt社区,大致可分为“技术派”和“非技术派”两类。现在回看,LangGPT作为技术派的代表,已成长为国内规模最大的社区。
对此,云中江树自己也分析了背后的原因:“一方面,早期很多社区只是简单整合市面上的Prompt模板,而我们一直在系统输出自己的方法论;另一方面,从结果导向来看,结构化的Prompt实操性更高,能让应用开发的工作流更高效运转。”
简单来说,对技术系统本身来说,通过Prompt调动AI的某项能力只是第一环,更大的挑战在于后期维护和版本升级;而从AI应用的开发流程来说,往往涉及一个上下游协作的Prompt工作流。
横向来看,在协作开发的过程中,一个工作流下游的开发者需要准确知道上一个节点的开发者对Prompt做了哪些调整;纵向来看,第一个应用版本开发出来后,随着模型不断升级,还面临一系列版本升级和代码维护,同样需要以上一版Prompt为基础进行迭代。
因此,从实操效果来说,结构化Prompt,是让整个工作流高效运转的最佳方式。“退一步讲,即使是独立开发者自己调Prompt,也经常忘记自己之前具体写了什么,结构化的形式让工作流的各个节点更清晰。”云中江树坦言。
不过,随着模型性能提升,Prompt工程要解决的问题也越来越难以捉摸。
最近,让云中江树感到困扰的是,模型性能提升后,它犯的错误也越来越隐蔽,这也增加了工程师调试Prompt的难度。“要解决这个问题,只能用一些“笨办法”,例如大量试错,尽可能多的试出那些奇奇怪怪的错误,并最终由人类开发者对项目兜底。”他表示。
可见,在Prompt工程师和AI之间,Prompt工程这场关于时间和耐心的拉锯战,短期内还不会结束。
什么是Prompt社区的归宿?
现阶段,除了应对技术变化,云中江树正在面临的另一大课题,是如何让LangGPT真正可持续地运营下去。
“LangGPT能有今天的成绩,是理想主义的成果,”云中江树坦言,“但用爱发电走不远,也做不大。”
今年4月,硕士毕业近一年后,云中江树辞去滴滴自动驾驶算法工程师的工作,开始全身心投入LangGPT的运作,并着手探索商业化。
云中江树透露,LangGPT的社区运营和商业化探索将分开进行。
一方面,他希望LangGPT继续以开源社区的形式存在,作为Prompt创意的聚集地,并继续为想要学习AI的人系统性地输出有价值的内容;另一方面,“Prompt本身不适合商业化,单纯做Prompt的交易利润很薄,很难走得长远”。
这并非LangGPT独有的难题。无独有偶,国外最大的Prompt社区FlowGPT今年也开始在定位上寻求转型。
将时间拉回2023年,FlowGPT发布时,OpenAI还未发布GPTs。
2023年1月,还在伯克利大学就读的党嘉成(Jay)用3天时间做出了FlowGPT的网站原型。网站正式上线后便迅速出圈,不到一年时间,全球月活便超400万。2023年5月,FlowGPT获得DCM Ventures的种子轮投资。
今年2月,FlowGPT又完成新一轮1000万美元Pre-A轮融资,由硅谷风险投资基金Goodwater Capital领投,老股东DCM Ventures跟投。与此同时,FlowGPT的定位也从Prompt社区转型为AI Native APP/Agent平台。
对于这次转变,党嘉成曾对媒体表示,“Prompt就是AI Native的代码。用户在平台上用Prompt,和用一个软件没有区别。之所以当时以Prompt为主体,是因为大家觉得这个词最克制。3月的时候意识到可以做AI Native APP。Prompt需要迭代,当时很多人愿意去分享Prompt,是希望知道怎么能提高Prompt本身。
创作者创作出来之后就希望大家能用,用了之后能留反馈,创作者能根据反馈去做修改。这个事本身就很像产品迭代的过程。”
这种面向C端创作者开源、免费的模式让FlowGPT网站上沉淀了大量优质创意,但内容伦理的风险也随之而来。党嘉成对媒体坦言:“如果你想让大家做任何事,就会有人做任何事。我们决定在保证这个平台不被查封的情况下,给大家最大的自由度。”
鉴于国内外市场环境差异,不同于FlowGPT的to C策略,LangGPT选择从B端切入。目前,LangGPT会根据客户需求,向客户提供一整套服务,包括智能体的定制、SaaS工具、技术咨询、Prompt方法论培训等形式。同时,对于徘徊在灰色地带的内容,LangGPT均不予收录。
具体到落地场景方面,云中江树表示,LangGPT社群衍生出的应用中,内容方面的应用是效果最好的。“现在AI比我们还要懂人性,它可以将创作者的创作风格、目标受众画像以及内容平台的流量规律总结出一套公式,成为内容行业的‘效率杀器’。”
目前,除了文字Prompt,云中江树也在尝试多模态Prompt所能调动的模型能力边界。
关于未来,云中江树依然要面临巨大的不确定性,一方面来自于模型能力升级对AI应用产品的“降维打击”,另一方面则来自于商业和人性的深不可测。
现在,云中江树仍在不断推演LangGPT更优的商业路径。“我们还是希望找到真正的高价值场景,帮客户提效。”但万般变化中,不变的是云中江树投身未来的笃定:
“只干技术对人的异化太强了,我希望能真正投入这个时代,希望在有生之年见证AGI的实现。只要确定是未来,哪怕再小的机会我也要去尝试,在全新的生态里找到自己的位置,然后全力以赴。我很相信二八法则,如果我在细分领域里做到前20%,同样能产生很大的价值。”
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)