ChatGPT负责人深度复盘,爆4o复活黑幕,过快下线是失误,将迭代模子品德 ...

来自版块 问答
858
0
GPT-5上线引发全网吐槽。8月14日,ChatGPT负责人Nick Turley深度复盘了GPT-5发布「风波」,并具体总结了此次产物发布中的失误:好比过快下线GPT-4o、低估用户会对模子的情绪留恋、没有让用户创建起「可预期性」等。Nick也分享了OpenAI的产物计划哲学,要对峙「真正对用户有资助」的原则。
「还我GPT-4o!」
GPT-5发布后不到一周,在用户强盛的反对声浪中,OpenAI不得不敏捷公布GPT-4o等前代模子回归。
至此,各人才意识到:用户对4o等上一代模子,已经产生了深深的「留恋感」。
下线4o,已经不再是产物升级那么简朴了,更像是突然从用户身边带走了一位熟人或同伴。
尤其是对于深度用户来说,这一点更为显着。他们许多都是4o等前代模子的老实拥趸,反弹感情也更为猛烈。
这一点令Altman,以及不停向导ChatGPT开辟的Nick Turle都始料未及。
于是,便有了GPT-4o的敏捷回归。
究竟上,GPT-5的发布会,给了OpenAI一个很好的反思产物的时机。
一周之后,Nick Turley在《The Verge》编辑Alex Heath的采访中,深度复盘了GPT-5发布背面临的用户差评风波,以及他的一些思索。
对谈中,Nick具体总结了GPT-5发布的一些失误,好比:
过快下线GPT-4o、低估用户会对模子的情绪留恋、用一个模子实用全部用户、没有让用户创建起「可预期性」等。
Nick表现,OpenAI已经熟悉到连续迭代模子品德的紧张性,并提到通过一个Model Behavior的团队来推动这项工作。
同时,Nick也分享了OpenAI的产物计划哲学,是帮用户办理恒久题目、告竣恒久目的,而不是让用户尽大概留在产物里。
「真正对用户有资助」,才是其计划产物的焦点原则。

忽视用户情绪

让GPT-5发布后迎不测暴击

忽视用户的「留恋感」,让GPT-5在发布不到一周后,便被网友锤爆了。
Nick的话说,「许多不测都是写进常态的」。
但也没办法,ChatGPT如今有7亿周活用户:用户太多,千人千面,众口难调。
这搞得Nick着实头大,几天后他在担当《The Verge》采访时,仍在「消化」这次发布会所带来的影响。
他先是总结了GPT-5发布的两点失误:
Nick:第一,GPT-4o下线走得太快了,至少在过渡期没有继承提供GPT-4o;第二,低估了用户会对一个模子有云云强的情绪留恋。真正的挑衅,不在于产物自己的升级,而是人们对模子「品德」的猛烈感受。
这两点失误,让Nick以为应当更认真地思索,如安在云云巨大的用户底子上举行产物升级和管理。
Nick表现,OpenAI已快速修正了这两点错误。
一是将原有模子重新提供给ChatGPT付费用户;二是对GPT-5的个性举行更新,上线了「选择你本身的性格」的本领。
8月13日,Altman发布了ChatGPT的更新信息,已经将4o规复为全部付费用户的默认模子,他们可以在网页设置中切换o3、4.1、GPT-5 Thinking mini等其他模子。
Altman称在已往几天学到的一点,是真正熟悉到:要打造一个可以或许根据用户需求定制更多模子个性的天下——办理方案,就是要让更多用户可以或许自由定制ChatGPT的风格。
Nick提到了一个原则,要积极去明白4o身上的一些本来没有被充足熟悉或器重的东西,好比模子品德对用户的情绪代价。在这方面,GPT-5也要向4o看齐,变得更温温暖友爱一些。
现实上,Sam Altman已经在GPT-5发布后表现,在已往约莫一年,OpenAI就不停在密切关注用户对GPT-4o的「留恋感」,但并没有太主流的关注。
这次发布会风波,引发了OpenAI对ChatGPT产物「模子品德」的器重,这也是一个很好的优化契机。

放弃模子选择

用一个模子实用全部用户

放弃模子选择,试图用一个模子搞定全部用户,是OpenAI在GPT-5发布上的另一个失误。
这导致了OpenAI在发布GPT-5时,没有做分阶段发布。
Alex:这个决定背后的动机是什么?是本钱因素吗?
Nick:这绝对不是本钱题目,而是为了寻求简朴,这也是ChatGPT做产物一向的焦点原则。
在Nick看来,让用户本身去搞清晰「用哪个模子答复哪个题目」,认知负担非常重。
而且在用户观察中,Nick也反复从用户那边听到:他们盼望得到的是一个「产物」,不是一堆「模子」。假如OpenAI能根据题目,为他们做出符合的选择,他们会很喜好。
Nick不停以为,大多数用户必要的是像macOS如许的产物:
既能面向大部人做到简朴易用;同时,对于深度用户,他们也可以进设置、打开终端、把各种开关和参数都调起来。
同样,Nick也盼望将ChatGPT做成macOS式的产物:
Nick:对于平凡用户简朴易用,重度用户也能按本身喜欢设置统统——包罗选择本身最喜好的模子。
因此,面临重度用户,ChatGPT不停是对峙要保存全部旧模子的。
但这次的失误之处在于:他们在7亿用户底子之上,对重度用户的分布产生了误判,低估了在其他一些套餐中也存在许多重度用户——正是这些重度用户对旧模子的「留恋感」,让他们在网上掀起了反对声浪。

没有让用户创建起「可预期性」

凡是乐成的产物,都有一个乐成的「预期管理」。
符合大概逾越用户预期,必会赢得用户追捧;违反或忽视用户预期,势必令用户唾弃。
GPT-4o的过早下线,就是踩到了违反「用户预期」的红线。
随着GPT-5,以及将来GPT-6等一系列新模子的发布,旧模子何时「退休」也被提上日程。
Alex:OpenAI对此是否有已经有了明白安排?
Nick表现,这点非常须要,而且OpenAI也在动手做这件事。但必须对峙一个紧张原则:给用户肯定的「可预期性」,尤其是在现在用户基数的条件下,如许做尤其紧张。
Nick:关于用户的「可预期性」,在企业版里OpenAI已经这么做了。现在的做法,更像是将这一原则进一步拓展。
这也是此次发布会,OpenAI得到的一个非常明白的履历教导。
谈到4o的「退休时间」,Nick表现,现在并没有一个详细的时间表。
Nick:昨们想先真正搞清晰4o善于的地方。假如没有非要让它下线的庞大来由,我很乐意把它保存下来。
为了保持用户的「可预期性」,Nick称,将来4o真的要下线,肯定会提前沟通。
以是,详细怎么做,取决于昨们学到了什么。
Nick:我以为这件事必要多去谛听,这也是做 AI 非常独特的一点:你在发布之后会学到海量信息。基于这些,昨们会拿出精确的方案。

模子品德与「优化哲学」

与其推测4o何时下线,更让Nick感爱好的题目是:
到底各人是喜好4o自己,照旧喜好4o身上的某些详细特质?
好比,假设用户喜好它「品德更有温度」,OpenAI也会把这个特质带到GPT-5上。
Nick称,OpenAI已经熟悉到连续迭代模子品德的紧张性,并通过一个叫「Model Behavior」的团队来推动这项工作。
别的,还会通过Model Spec(模子举动规范文档),来资助开辟者和研究职员明白和审阅模子举动,明白某些举动是计划上的故意为之,照旧潜伏的bug。
Nick:在将来几周乃至几个月内,还将连续迭代GPT-5的「感觉」和「举动」。这次GPT-5的发布,也为继承做这件事提供了一个好机遇。
Alex Heath提到了这次4o下线后,用户在Reddit上的惊人反应:
「有人说,我一夜之间失去了朋侪。这是我唯一的朋侪;感觉像有人去世了;我不敢跟GPT-5语言,由于感觉像是在「出轨」;我感觉丢了谁人很有同理心的同事……」
Alex:用户的反应为OpenAI带来了什么影响?为什么之前没有充实意识到,各人会有这么猛烈的情绪留恋?
Nick答复说,实在OpenAI内部已经关注这类征象有一段时间了。与此同时,他们也不停在担心:出现一个人们过分依靠AI的天下。
但让Nick没想到的是,人们会对某个「特定模子」产生这么强的感情——而不是对整个产物。
Nick:现实上,GPT-5已经办理了许多各人对4o的建立性反馈,乃至在团体氛围上也做了改进。但许多网友对此并不认账。
Reddit上的批评,让Nick以为很故意思,它们表现出用户群体的非常「分化」:
Nick:有人特殊爱4o,也有人猛烈以为GPT-5更好,各人对本身选择的「热情水平」非常惊人。
用户的反馈,对Nick也有点「重新校准」的意味。
Nick提到,他在一两周前,曾写过一篇博客,在内里花了不少篇幅讲ChatGPT的「优化哲学」。
他非常想夸大的一点是:
Nick:昨们的目的,不是让用户尽大概留在产物里;相反,而是要帮用户办理恒久题目、告竣恒久目的。这在许多时间实在意味着「在产物里花更少时间」。
以是,当Nick看到人们把GPT视作本身唯一而且最好的朋侪时,这并不是他想在ChatGPT里自动营造的东西。
相反,Nick将这种「过分停顿」,视作一种副作用。
好比就在8月16日,OpenAI公布会让GPT-5由从前的过于正式,变为更加温温暖友爱时,也有网友反对让GPT-5过分品德化。
怎样权衡产物对用户的代价,这是一个值得认真对待和深入研究的题目,OpenAI也在这个题目上不停探索。

怎样让7亿用户

可以绝不暗昧地说YES

Alex Heath问了一个有关产物计划的魂魄题目:
Alex:怎样均衡「产物目的」与「用户现实利用方式」之间的张力?
Nick说,当你在7亿用户的规模上运营,就不得不面临一个实际:你可以有精确而纯粹的目的,你也可以尽最大积极按照这些目的来构建产物。
在怎样选择上,Nick提到了一个紧张原则——「真正对用户有资助」。
乃至,偶然要说出用户大概不爱听的话。
基于这一原则,OpenAI也对产物做了一系列调解:
好比,OpenAI通过与多个国家和大量生理康健专业人士交换,明白当人们过分利用产物,大概在不太康健的状态下利用产物时,该怎样处置惩罚。
并以此修改模子举动,为模子上线了「过分利用提示」,当用户以极度频率利用ChatGPT时,它会轻轻提示你。
Nick提到了特殊紧张的一点,也回应了公众对OpenAI是否会探索广告模式的推测:
Nick:昨们实在并没有任何「让你在产物里花更多时间」的特殊动机;昨们的贸易模式非常简朴:底子产物免费,假如你喜好更多功能,就订阅。没有第二层目标。
在这一原则下,Nick也提到了查验好产物的尺度,这也是他们常常给本身设的「头脑实行」:
Nick:假如你熟悉的人正履历困难,大概刚失恋,大概对人生感到渺茫——你会不会真的、绝不夷由、很有信心地保举他/她利用ChatGPT?
Nick表现,对于OpenAI来说,这就是尺度。他们会不停做到本身也有这种底气为止,在此之前他们不会停下来。
固然,Nick也坦言,偶然这也是一道艰巨的选择题。
好比,当有人向你寻求人生发起,大概陷入逆境时,你完全可以很轻松地把这些用例直接关掉,对用户说:「歉仄,这个我帮不了你。」
如许做简直是条「轻易的出路」,但Nick和OpenAI想要选择的,显然是那条「难而精确的」门路,就是为那些没有资源、没人可聊的人,提供一个好的产物,做到让用户「可以绝不暗昧地说 YES」的水平。

GPT-5发布

伤害ChatGPT了吗

Alex:GPT-5对ChatGPT的利用有没有伤害?你们内部统计的总体数字是在上涨吗?最重度用户的利用是在降落吗?
面临Alex Heath的提问,Nick对GPT-5的体现好像很满足:
Nick:利用和增长看起来都很不错,和昨们的直觉也高度同等;昨们在第2天看到API的调用量大幅增长——也就是开辟者在用GPT-5搭建东西;在ChatGPT里,昨们也看到了非常积极的增长。
用户分层差别,也会影响到对产物的评价,这也是为什么Nick提到,在为这么多差别的用户构建产物时,你会有点狐疑:
Nick:一方面,有一小撮重度用户,我以为他们对昨们怎样推出GPT-5的反馈非常有原理;另一方面,另有大批更典范的平凡用户,对他们来说,这大概是第一次真正看到、打仗「推理模子」这一概念,以及它能带来的火花。这也会表现在昨们的数据里。
正如Reddit上两级分化的用户批评,GPT-5发布时间还很短,Nick并不太想下结论,但全部指标都是偏正面的。
Nick以为,除了看数据之外,还要「待在重度用户地点的地方」,由于数据大概不敷以反映他们的感情。
Alex Heath好像不依不饶,问:
Alex:既然团体指标不错,为什么还要把4o带返来?我推测托管就模子也会有本钱。假如指标没受伤害,为什么要这么做?
Nick答复道,打造巨大产物的方式是「同时服务两头」:
Nick:一端是平凡用户,好比昨们的家人,他们大概离AI还比力远;另一端是极度的重度用户。二者之间「诡异的中心地带」通常不是好位置。
这也是Nick以macOS类比ChatGPT的缘故原由:他会参考如许的产物是怎样处置惩罚这一题目的。
Nick并不讳言,服务旧模子是有本钱的。但他更盼望能从久远投入,打造一个精彩的产物。过于盯着短期指标,通常是把一个产物带向下坡路的方式。
Alex Heath提到了「模子选择」的回归,固然他能感受到「切换模子」所造成的认知负担,但仍为此高兴。
对此,Nick回应说,会为重度用户,也就是那些可以明白模子,也乐意处置惩罚选择模子这层复杂性的用户提供「模子选择」。
但对于平凡用户,则不必为「切换什么模式」费心,他们可以直接问模子题目,大概让它帮助办事。
「昨们会为90%的人保持简便;然后为那群声音更大的重度用户提供他们想要的完备列表。这是一个分身双方的均衡方式。」Nick说。
这也是应对网友对GPT-5口碑南北极分化的好方法。
参考资料:
https://www.theverge.com/decoder-podcast-with-nilay-patel/758873/chatgpt-nick-turley-openai-ai-gpt-5-interview
本文来自微信公众号“新智元”,作者:新智元,编辑:元宇,36氪经授权发布。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

使用道具 举报

全部评论 0

热文

所属版块

您需要登录后才可以回帖 立即登录
说说你的想法......
0
0
0
返回顶部