
华尔街新闻
朱利安·施里特威斯(Julian Schrittwieser)的研究人员认为,当前的“ AI泡沫理论”是无法理解技术指数增长的趋势以及在新冠冕流行的早期阶段的错误判断的一种体现。调查表明,软件工程,专业工业工业任务和其他领域的AI表现呈指数增长,AI预测能够在2016年中期完成八个小时的工作,并在年底达到多个行业的人类专家水平。
AI研究的第一线专家已牢固驳斥了当前的“ AI泡沫理论”。
人类研究员朱利安·施利特维耶斯(Julian Schlitwieser)在他的个人博客中写了一篇文章,警告说,当前对“泡沫”或人工智能的“平台时期”的普遍疑问是严重的概念,这是技术的指数增长趋势的错误。
当前关于进步的讨论AI和SO称为“泡泡”使我们想起了新的皇冠流行的头几周。指数趋势清楚地预测了全球大流行及其幅度的到来,但是政客,记者和大多数公开评论员认为这是遥远的可能性或当地现象。
他指出,尽管AI在执行编程和网站设计等任务时仍会犯错,但认为AI的编程不会或对人类的影响很小,这是一种“奇怪的现象”,因为我们认为这是几年前是“科幻小说”。
人们注意到,尽管人工智能可以编写程序,设计网站等,但仍然犯错误或错误地址,并以某种方式得出结论,AI不能在人类层面上执行这些任务,或者只有较小的效果。
Schrittwieser的解散是基于两项重要研究,即Metr和GDPVal de Openai。数据表明,AI模型中复杂任务的自主完成时间会加倍以指数级的速度,表明现代模型可以处理两个多小时以上的软件工程任务。更重要的是,在涵盖44个职业的GDPVAL资格中,AI的最高AI已开始“令人惊讶地”在人类层面上行动,并挑战了行业专家的能力。
在这篇博客文章中,题为“另一个无法理解指数性”的文章,Schlitwieser将当前对AI的怀疑主义与“自我束缚”进行了比较,认为通过关注当前的缺陷,人们低估了未来变化的规模。
软件任务功能:每7个月复制一次
为了反驳Metr独立评估机构发表的“平台时期”研究,题为“衡量AI完成长期任务的能力”。这项研究测量了可以独立执行软件工程任务的AI模型的长度,结果显示出“明确的指数趋势”。
根据这项研究,七个月前的十四行诗3.7模型可以共同成功率50%的成功率。 MTR网站上的最新图形进一步证实了这一趋势的连续性。
Schrittwieser不仅以新的模型(包括Grok 4,Opus 4.1和GPT-5)继续趋势,而且“后者的模型确实略微超过了趋势,这使他们可以执行任务超过两个小时!”
跨代码:在44场比赛中说服人类专家
为了回应“ AI仅在软件工程领域效果很好”的问题,Schrittwieser引用了Openai的另一项评估,称为GDPVAL。这项研究的目的是衡量该模型在更广泛的经济活动中的表现,该活动涵盖了九个行业的44个职业,平均提供了14年的行业专家经验。
结果再次显示出类似的趋势。 Schrittwieser写道,最后一个GPT-5“令人惊讶地接近人类的表现”。
更令人信服的是,在GPT-5之前推出的Claude Opus 4.1工作在这种资格上,表现“运营行业专家”更好。它使它与之一致。 “ Schrittwieser尤其评论说:“我们想提供一项特殊的OpenAI贷款发布评估,表明另一个实验室模型超过了自己的模型。
我们希望2026年:“关键的一年”
根据指数增长的数据涵盖了多年和多个行业,施利特威斯(Schlitwieser)认为,如果这些改进突然停止,这将是“非常令人惊讶”。它根据趋势的推断提供了明确的预测。
这听起来可能太简单了,但是预测图表中的一条线可以比大多数“专家”提供更好的未来模型。
风险警告和辞职
市场很危险,因此在投资时要小心。本文不构成个人投资建议,也不考虑特殊投资目标,财务状况或个人需求用户。用户应考虑本文中的意见,意见和结论是否符合特定情况。根据这是您自己的责任。
官方NINA Finance帐户
24-最新信息和财务视频的流离失所,以及扫描QR码以关注更多粉丝(Sinafinance)