新智元报道
编辑:Aeneas 好困
【新智元导读】GPT-5.4,已经把白领桌面一口吞下!1M上下文,原生Computer Use,Excel直接变身数据分析平台;超越麦肯锡,取代投行律所咨询公司不是梦。白领工作,要被AI彻底颠覆了吗?
昨天,OpenAI发布了GPT-5.4,震惊了整个AI圈。
100万token的上下文,「编程+智能体」的巨大飞跃,原生的computer use,所有这些, 都将彻底改变AI智能体的格局。
「GPT-5.4,将灭绝所有知识型工作!」
一位软件工程师在试用GPT-5.4后,发出这样的惊呼。
它爬取Zillow后,提取了所有旧金山的房价,在4分钟内,就把所有数据都导入到Google表格中。
几乎所有的白领工作,都能被GPT-5.4代替。
所有的浏览器工作,GPT-5.4都能胜任,而且它又准又便宜!可以确信,像编程智能体那样的白领革命,马上会再发生一遍。
而且,搭载GPT-5.4的ChatGPT插件,已经可以直接在Excel中使用了!
在最新测试中,这一插件在投资银行基准测试中的表现,从43.7%大幅提升到87.3%。用户可以直接通过自然语言完成许多原本复杂的操作。
从此,构建财务或分析模型,修正和生成复杂公式,对数据进行自然语言分析与解释,都可以靠Excel完成了,而且用嘴说就可以。
如果这个插件普及,Excel将不再是一个表格工具,而是变成一个对话式的数据分析平台。
美国、加拿大、澳大利亚的用户,都可以使用了
打工人的饭碗,是要被彻底颠覆了。
超越麦肯锡,GPT-5.4暴击华尔街!
取代咨询投行律所
MercorAI CEO表示,GPT-5.4是他们在APEX-Agents上测试过的最佳模型,而且,它也是首个平均分超过50%的模型。
一年前,前沿模型甚至无法编辑Excel表格,得分不到 5%。而现在,不到三个月,GPT 5.4就已经提升了15.7%。
当智能体的工作效率达到50%的时刻,这些系统就不再只是令人印象深刻的演示,而是开始成为真正的运营者。
可以肯定,ChatGPT将很快超越最好的咨询公司、最好的投资银行和最好的律师事务所!
最惊人的还是不是头条分数,而是进步曲线依然陡峭,任务却越来越真实。
这其中最关键的洞察就在于,当你将「推理+编码」结合在一个模型中,就可以减少大约80%的开发工具间上下文切换。这,才是真正的生产力倍增器。
仅仅一年,AI模型就从无法编辑电子表格,跃升到了能超越麦肯锡,这要比绝大多数公司更新策略方案的速度快得多!
GPT-5.4能力超强,AI圈震惊
GPT-5.4的1M上下文,意味着什么?
这就表明,整个代码库都能一次性放到模型里,得到连贯、可靠的结果了。
无需再做分块(chunking)、无需复杂的检索(retrieval),也不必频繁压缩上下文,更不会因为上下文丢失而影响理解。
光是这一点,就可能彻底改变AI Agent的工作方式!
而1M上下文和Computer use的结合,让智能体能够完成多文件任务,而不丢失上下文。
AI圈大佬Eric Hartford试完GPT-5.4,评价只有一句:「理解力和解题速度,肉眼可见地飞升了。」
他出了一道硬核测试题:从零构建一个编译器。
Claude Code直接卡住了,GPT-5.3勉强能推进但很吃力。
而GPT-5.4?用Eric的原话说——it just gets it。它就是懂。
OpenAI总裁看到这条,直接秒转。
要知道,构建编译器是一个极其严格的基准,需要满足单会话、深度逻辑、紧密的反馈循环。
这些,恰恰是GPT-5.4的强项。
另一大V实测后,给GPT-5.4的评价是——完美!
才花了大概24分钟,它就解决了Minecraft里的难题。
甚至有人发现,GPT-5.4可以对NES(任天堂红白机)的ROM进行逆向工程了!
曾经被认为牢不可破的代码壁垒正在迅速瓦解——只要把ROM扔进去,模型就能一点点拆解程序结构、还原逻辑,甚至解释当年的汇编技巧。
那些沉睡在老卡带里的代码,正在被逐层剖开。某种意义上说,在这种能力面前,已经没有什么代码是真正安全的了!
物理学家都在挠头的题,它也能做了
逆向工程搞得定,编译器写得出,那真正的硬科学呢?
别急,物理学家已经开始坐不住了。
CritPt,一个让所有大模型现原形的「地狱级」物理基准,最近放出了最新排名。
30家机构、50多位一线物理研究员联手出题,71道题全是没发表过的前沿难题,横跨11个物理学细分领域。
每道题平均审查超过40小时,答案要你输出浮点数组、符号表达式、甚至直接写Python函数,专门堵死「瞎蒙」这条路。
GPT-5.4 Pro(xhigh)拿下了30.0%的最高分,稳坐第一。GPT-5.4(xhigh)紧随其后,20.0%。第三名是Gemini 3.1 Pro Preview,17.7%。
要知道,2025年那些最牛的模型跑下来,大多也只有个位数的正确率。
能力的天花板被一次次捅破,而另一边的地板,正在同步塌陷。
5.7万岗位蒸发
科技行业迎来「AI版大萧条」
就在GPT-5.4发布的同一周,经济学家Joey Politano在X上甩出了一组让人倒吸凉气的数字——
美国科技行业上月就业人数净减1.2万,过去一年累计蒸发5.7万个岗位。
更扎心的是他的第二条补刀。
当前科技就业的萎缩程度,已经几乎追平2024年科技衰退最惨烈的时刻,而且比2008年和2020年的两次危机还要严重。
拉长时间线看更吓人。
从1990年到2026年的美国科技就业年同比变化图上,当前的下坠曲线从2023年开始一路走低,规模和持续时间上,只有一个时期能与之相比——2001年互联网泡沫破裂。
但这一次,在本质上并不相同。
互联网泡沫破裂,是因为钱烧光了、商业模式不成立,那是金融层面的出清。
公司倒了,人散了,但市场还在,需求还在,缓过来就能重新上岗。
但如今,恰恰相反。头部科技公司的利润不仅没崩,反而赚得盆满钵满。
岗位消失不是因为公司倒闭,而是因为公司发现:有了AI,它们不再需要那么多人了。
2001年的失业者可以等市场回暖再重新上桌。2026年的失业者面对的,是一张永远不会再给你摆上碗筷的桌子。
但诡异的一幕出现了:科技行业总就业在暴跌的同时,AI岗位的需求反而在飙升。
也就是说,公司并没有在收缩,而是在「换人」——准确地说,是在换掉人。
5个人的活,现在1个人加一个AI就能干完。省下来的4个人?对不起,没有plan B。
诺奖得主警告
公司最完美的员工数量,是0
如果你觉得这只是科技行业的「内部调整」,和普通白领没什么关系,那请听听约瑟夫·斯蒂格利茨(Joseph Stiglitz)怎么说。
斯蒂格利茨,83岁,诺贝尔经济学奖得主,世界银行前首席经济学家。
金融危机、全球化的空头支票、美国中产阶级的被掏空,他全程看在眼里。
如今,这位老爷子正在眼睁睁看着新的一幕上演。
在近期接受《财富》杂志的专访中,他的判断简洁而刺骨:
如果我们不对AI加以管理,它势必会带来更加严重的不平等。不平等本身已经是我们社会里一个极其恶劣、严重的问题,所以这让我非常担忧。
但斯蒂格利茨真正让人警醒的,不是他指出了问题,而是他指出了问题背后的机制。
技术战略家Daniel Miessler最近说了一句被广泛引用的话:「任何公司里最完美的人类员工数量,是零。」
刺耳吗?刺耳。
但它精准地概括了老板们的真实想法——人力从来就是成本中心。
而AI,是第一个靠谱地承诺能把人工彻底踢出局的技术。
斯蒂格利茨在2024年出版、近期再版的《通往自由之路》里,系统地拆解了这个链条:
AI让企业甩掉人工、利润集中到金字塔尖,转型的风险全甩锅给工人和普通人。
而更讽刺的是,那些最积极推动AI的科技大佬们,同时也在高呼削减恰恰可以用来缓冲AI冲击的公共机构。
你的工位还在,但倒计时已经开始了
GPT-5.4在GDPval上拿到83%,CritPt物理基准30%创纪录,OSWorld电脑操作75%超越人类基线。
这些数字叠在一起,传递出一个信号:
AI已经不是「未来可能替代白领」,而是「正在替代白领」。
然而,真正的问题,从来不是AI能不能做你的工作。而是——
当AI做了你的工作之后,多出来的利润归谁?
被省掉的你,又该去哪?
这不是技术问题,是选择问题。
而做选择的窗口,正在迅速关闭。
参考资料:
https://fortune.com/2026/03/06/nobel-prize-economist-joseph-stiglitz-ai-inequality-tech-bros/
https://x.com/JosephPolitano/status/2029916364664611242
https://artificialanalysis.ai/evaluations/critpt
https://x.com/sawyerhood/status/2030041230512476481
https://x.com/Angaisb_/status/2029635731585372598
秒追ASI