
公认的编程建筑材干第一!Claude 3.7 Sonnet刚刚登顶 WebDev 竞技场榜首。
大幅甩第二名 100 多分,在榜单前十的其它相邻模子分差仅为几分、几相等的情况下。
那第二名是谁呢?仍是 Claude 我方—— Claude 3.5 Sonnet。

WebDev 榜单与咱们所熟知 Chatbot Arena 榜单"同宗同源",亦然由 LMArena(LMSYS Org)打造,不外更专注于 AI 编程、网页期骗建筑材干。
值得一提的是,DeepSeek R1 看成榜单前十惟一的开源模子排行第三,卓绝 early-grok-3、o3-mini-high、Claude 3.5 Haiku 等。
对于 Claude 3.7 Sonnet 高分登顶,有网友示意并不骇怪。

毕竟,这两天网友们猖獗实测 Claude 3.7,一次又一次被惊艳到,最新实测更是再次刷新网友对 Claude 3.7 的剖析。
比如前两天地面这个 Claude 3.7 Sonnet 用 p5js 编写布料模拟后果在网上疯传:

有位学者看到后,还晒出了我方 1986 年在 MIT 的硕士论文,主题恰是"布料外不雅建模"。他提到,昔时完成这项使命需要数天时辰,而当今 AI 只需几分钟就能卓绝他,不禁惊叹:
天然他们当今还付我薪水,但这么的日子还能合手续多久呢?

当今,更扎心了老铁。
网友又作念出了另一版,仍是带有明暗联系的那种:

网友示意"这种后果即使是在高档图形学课中,也很少有教奈何作念的"。

除此以外,Reddit 上一位老哥的最新共享也激励网友热议。
他示意一刹念念起一个我方在 1997 年用 Visual Basic 4 编写的陈腐期骗步骤,于是将这个 27 年前的 EXE 文献上传到了 Claude 3.7 并恳求和谐为 Python 代码,罢休 Claude 不仅分析了文献组件,还在 5 分钟内用 Pygame 写出无缺和谐且可运行的 Python 代码。

这位老哥还晒出了我方与 Claude 3.7 的聊天记载:

网友 get 新玩法后纷纷启动效仿。

另外,有网友体验了 Claude 3.7 的新GitHub 集收服从后示意"它改动了工程师表示软件的姿色":
不错 Frok 一个代码库承袭一个特定的文献夹,然后向它发问对于代码的任何问题,Claude 还会涌现每个文献夹在高下文窗口中所占的百分比,匡助你更好地表示代码结构和骨子。


沃顿商学院教会 Ethan Mollick 也放出了最新实测。
举例,基于" Bartleby the Scrivner "故事创建的小游戏:
还不错用 Claude 3.7 制作一个互动式的"时光机说念具,大要穿越回昔时":

Ethan Mollick 有益写了一篇 Blog 先容 Claude 3.7。
有根由的是,这篇 Blog 被 Anthropic 官方珍贵到了,官方示意Claude 3.7 莫得那么大(花几千万好意思元检修的那种)。但之后的模子鸿沟会增长。

参考连气儿:
[ 1 ] https://x.com/lmarena_ai/status/1894840263379689490
[ 2 ] https://x.com/deedydas/status/1894871849269633162
[ 3 ] https://x.com/deedydas/status/1894841573311197239
[ 4 ] https://x.com/deedydas/status/1894576702749381082
[ 5 ] https://x.com/emollick/status/1894258450852401243开云体育(中国)官方网站