GPT-5的推出对消费者反响平平,但该AI模型在最重要的领域正取得进展  第1张

  • OpenAI的GPT-5自推出以来,编码和智能体构建活动量增长超过两倍,推理任务量激增八倍
  • 包括Cursor、Vercel、JetBrains、Factory、Qodo和GitHub Copilot在内的平台正在将GPT-5整合到某些默认人工智能工作流或公开预览版中
  • OpenAI旨在将早期开发者势头转化为持续的企业AI采用

萨姆·奥尔特曼用ChatGPT将OpenAI打造成了一种文化现象。

三年后的今天,他正在追逐真正的金矿:企业市场。

上周OpenAI最新人工智能模型GPT-5的发布过程并不顺利。批评者抨击其不够直观的体验,最终导致公司为付费聊天机器人用户恢复了旧版GPT-4。

但GPT-5的目标并非普通消费者。这是OpenAI进军企业市场的尝试,而其竞争对手Anthropic已在此领域占据先机。

发布仅一周,Cursor、Vercel和Factory等初创公司就表示,他们已在其某些关键产品和工具中将GPT-5设为默认模型,称赞其更快的设置速度、在复杂任务上更好的表现以及更低的价格。

一些公司表示,在代码和界面设计领域——这个Anthropic曾经主导的领域,GPT-5现在已能与Claude匹敌甚至超越。

另一家企业客户Box一直在测试GPT-5处理冗长、逻辑复杂的文档。首席执行官亚伦·莱维告诉CNBC,该模型是一个"突破",其推理能力达到了之前系统无法企及的水平。

在幕后,OpenAI已建立自己的企业销售团队——由首席运营官布拉德·莱特卡普领导的500多人——独立于微软运营。微软一直是这家初创公司的主要投资者和关键云合作伙伴。客户可以通过微软Azure访问GPT模型,也可以直接使用OpenAI控制的API和产品体验。

然而,经济形势依然严峻。运行这些模型的成本很高,OpenAI和Anthropic都在大举投入以锁定客户,OpenAI今年预计将消耗80亿美元。

这也是Anthropic和OpenAI都在寻求新资金的原因之一。

OpenAI正在探索一项可能使公司估值达到约5000亿美元的二次股票发售,并表示ChatGPT每周用户数已接近7亿。

Anthropic正在寻求以潜在1700亿美元估值进行新一轮融资。

赢得企业青睐

GPT-5比Anthropic的高端产品Claude Opus 4.1便宜得多——在某些情况下便宜七倍半——但OpenAI正在基础设施上投入巨资以保持这一优势。

对OpenAI来说,这是一场争取客户、锁定客户并在此基础上建立真正业务的推动。

Cursor虽然仍是Anthropic的主要客户,但现在正将新用户导向OpenAI。该公司联合创始人兼首席执行官迈克尔·特鲁尔在OpenAI的发布直播中强调了这一变化,称GPT-5是"我们尝试过的最智能的编码模型"。

特鲁尔表示,这一变化仅适用于新注册用户,现有Cursor客户将继续使用Anthropic作为默认模型。Cursor与Anthropic签订了收入承诺合同,后者通过主导企业层建立了业务。

据一位要求匿名讨论公司数据的知情人士透露,截至6月,企业客户占其收入的约80%,年化收入同比增长17倍。该人士称,仅过去六个月公司就增加了30亿美元收入——其中仅6月就达10亿美元——今年签署的八位数和九位数交易数量已是2024年全年的三倍。

Anthropic表示其企业足迹远不止科技行业。

Claude为亚马逊Prime、Alexa和AIG提供工具支持,并被制药、零售、航空和专业服务领域的顶级企业使用。该公司已嵌入亚马逊网络服务、GCP、Snowflake、Databricks和Palantir——其交易往往迅速扩张。

该人士表示,过去一年客户平均支出增长超过五倍,超过一半的商业客户现在使用多个Claude产品。

除两个最大客户外,其余业务的收入同比增长超过11倍。

尽管覆盖面如此广泛,OpenAI仍在企业客户中取得进展。

一位要求匿名讨论公司数据的知情人士表示,GPT-5 API使用量自推出以来激增,该模型现在处理的编码和智能体构建工作是之前的两倍多,推理用例增长超过八倍。

企业需求正在急剧上升,特别是规划和多步推理任务。

GPT-5的改进

GPT-5过去一周的受欢迎程度表明,当性能和价格向OpenAI倾斜时,用户忠诚度可以迅速转变。

AI驱动的编码平台Qodo最近测试了GPT-5与Gemini 2.5、Claude Sonnet 4和Grok 4等顶级模型的对比,并在博客文章中表示其在发现编码错误方面领先。

该公司表示,该模型通常是唯一能发现关键问题(如安全漏洞或损坏代码)的模型,能提出简洁、有针对性的修复建议,并跳过不需要更改的代码。缺点包括偶尔的误报和一些冗余。

面向Web应用的云平台Vercel已在其新的开源"氛围编码"平台中将GPT-5设为默认——该系统能将简单的英文提示转换为实时运行的应用。该公司还将GPT-5整合到其仪表板Agent中,称其特别擅长处理复杂任务和思考冗长指令。

"虽然AI模型领域已有许多竞争,但Claude一直主导这一领域。它显然是最好的编码模型,无人能及,"Vercel首席技术官马尔特·乌布尔说,"OpenAI根本不在比赛中。"

GPT-5改变了这一局面。

"他们至少赶上了,"乌布尔说,"在某些方面更好,在其他方面稍逊。"

他表示GPT-5在早期原型设计和产品设计方面表现突出,称其比Claude的Sonnet更具创造性。

"传统上,你必须为新模型进行优化,但我们从一开始就看到了非常好的结果,"他谈到集成的便利性时说。

JetBrains在发现GPT-5能更快地从用户提示生成简单的单一用途工具后,已在其AI助手和新无代码网站及应用构建工具Kineto中将其设为默认。开发者平台Factory表示与OpenAI密切合作,将GPT-5设为其工具的默认模型。

"在制定实施复杂编码解决方案的优秀计划方面,GPT-5要好得多,"Factory首席执行官马坦·格林伯格说,"它在规划和保持计划长期一致性方面表现更优。"

格林伯格补充说,GPT-5与他们的多智能体平台集成良好:"它能很好地处理我们在管理低级实现细节的同时处理的许多高级细节。"

价格灵活性也是Factory选择GPT-5作为默认模型的主要因素。

"价格是我们的终端用户最关心的,"格林伯格说,并补充说更便宜的推理现在让客户更愿意尝试。他们不再纠结一个问题是否值得花费成本,而是能"更随意地尝试"并毫不犹豫地探索想法。

Lovable公司的联合创始人兼首席执行官安东·奥西卡表示,他的团队在GPT-5正式发布前进行了数周测试,对改进感到"超级满意"。该公司开发了一款AI工具,让用户无需编写一行代码就能创建真实的软件业务。

"我们发现它更强大。在许多复杂用例中更聪明,"奥西卡说,并补充新模型"更倾向于采取行动并反思其采取的行动",且"花更多时间确保真正做对"。

Box的莱维表示,对他来说最大的收获出现在与编写代码无关的企业工作流中。他的团队数周来一直在复杂的真实商业数据上测试该模型——从上百页的租赁协议到产品路线图——发现它在困扰早期AI系统的问题上表现出色。

莱维补充说,对于企业使用场景,AI智能体在后台执行任务,这些阶梯式的改进至关重要,能让GPT-5成为工作自动化的真正突破。

"GPT-5表现得出奇地好——无疑是OpenAI最好的模型——在我们的许多测试中它都是最佳选择,"他说。

观看:OpenAI发布GPT-5模型