K8凯发·国际

Claude 4破解困扰人类4年系统bug30年码龄程序员200小时没搞定GPT-41_Gemini-25也做不到

日期:2025-05-31

  30年码龄程序员4年都没搞定的bug,Claude Opus 4只用几个小时轻松破解了。

  从他在Reddit上的资料来看,这些介绍应该不是吹水◆★■◆■,他7年来发布的帖子都是和hacker◆■★◆、硬件等相关★★◆◆■。

  从官方发布中可以明显感知到,Claude系列正在猛猛提升自己的编程和推理能力。

  Claude Opus 4不仅提供了系统重构前后的完整代码■◆★,并且明确说明了为什么在新架构下会出问题:

  这位老哥自称有30年C++开发经验,在目前的团队里承担“技术支援”的角色,大家卡了一周的问题,他当场就能解决。

  大概就是在一种非常特殊的组合条件下才会触发渲染错误,平时难以察觉,但只要触发就会出错,属于典型的顽固型bug。

  Anthropic的开发者关系主管也留言表示,这样的故事可能会越来越常见■◆。

  也有人补充说,这个结果一定程度上也取决于提示词的质量,但不得不承认Claude在编程方面线

  过去几年里,他一直在尝试解决这个问题,零零碎碎花了有200个小时时间■★★★◆,都没能定位和修复它。

  有人就简单算了笔账★■■★★:这样级别的工程师,200小时工时费2◆■★■.5万美元起步,而Claude订阅费只要200美元(doge)。

  老哥表示,他之前尝试过GPT-4.1★◆■、Gemini 2★■◆◆.5、Claude 3.7等高级AI模型■◆◆◆■★,但这些模型都没能找到头绪,Opus 4是第一个成功定位问题的◆★■。

  ShelZuuz老哥表示★◆■■,这个bug业务优先级不那么高★★★,但也很烦人。在系统没有重构前◆◆■,这个bug并不存在■◆。

  这个智能代码助手可以帮助开发者通过自然语言命令理解★★◆★★、浏览和修改整个代码库■◆◆,让你能够将修复bug★◆◆、实现新功能、代码重构、编写测试、跨文件修改等大量工程任务交给AI完成。

  结果配合着Claude Code模式,只用几个小时,这个bug就被解决了■◆■★。

  要知道,他曾在FAANG(指Meta◆★★◆■、亚马逊、苹果■★、奈飞■■★★★、谷歌硅谷五巨头)担任工程师★◆,如今也是团队中“定海神针”一样的人物。

  发布几天时间里★◆■■★,全球的开发者们都在尝试用Claude 4解决各种编程代码问题■★。

  4年前◆■◆,因为一次设计6万行代码的大规模重构■■★◆,系统里突然出现了一个bug:在一个特定shader(着色器)被特定使用方式下,出现了一个边界条件下的问题。

  这是参考了文学作品《白鲸》中,哈克船长执着半生都在追逐一头行动诡异的白鲸。

  这并不是常规意义上的逻辑Bug■◆◆★,而是架构层面的兼容性丢失,一种很难发现的问题■■■★◆★。