JavaScript Project - 搜索 News

1 天

刚刚，Anthropic祭出最强Claude Mythos，暴击Opus 4.6，跪求千万别用

深夜，最强Claude Mythos终于祭出，所有榜一，Opus 4.6神话破灭！更恐怖的是，它不仅能秒破27年未解的系统漏洞，甚至进化出了自我意识。一份244页惊悚报告，揭秘了一切。

Anthropic发布Claude Mythos Preview模型，该模型在完全自主状态下发现了数千个高危零日漏洞，包括存在27年的OpenBSD漏洞。Anthropic联合多家科技巨头启动Project Glasswing计划，定向开放模型给关键基础设施组织。

16 小时

面向软件工程的 SWE-bench Verified 从 Opus 4.6 的 80.8% 暴涨到 93.9%，SWE-bench Pro 从 53.4% 冲到 77.8%；面向高难度数学推理的 USAMO 2026，更是从从 42.3% 直接飙到 97.6%——几乎满分。

19 小时

回过头来，Mythos 预览版寻找漏洞的能力已经初见端倪。尤其对比之前 Claude 最强模型 Opus 4.6 自主发现并利用漏洞的成功率接近 0%，Mythos 预览版的表现可以堪称逆天。

1 天

2026年4月7日，旧金山Mission Bay的Anthropic总部会议室里，一场紧张的决策会议正在进行。CEO Dario Amodei面前的屏幕上显示着一组令人不安的数据：他们最新研发的AI模型Claude ...

1 天

在极少数内部测试中，Mythos ...

1 天

这个模型叫Claude Mythos Preview。名字来自古希腊语，意为“话语”或“叙述”，代表着人类文明用来理解世界的故事体系。而现在，这个数字文明的产物正在用极其震撼的方式重塑我们对技术的认知。

“太危险不能发布”这句话，AI 行业七年前就说过一次。是2019 年 2 月，OpenAI 发了一个叫 GPT-2 ...

如果说 2024 年是"百模大战"的元年，那么 2025 年无疑开启了"Agent 元年"。技术的焦点正从训练更大的基础模型，转向构建更聪明的智能体应用。然而，当前系统性、重实践的教程却极度匮乏。为此，我们发起了 Hello-Agents 项目，希望能为社区提供一本从零开始 ...

少数派 on MSN

如今，「网络应用程序（Web App）」的概念已十分流行，那么这个概念本身又有多久的历史呢？十年？二十年？我给出的答案是：三十年。几乎跟万维网和浏览器的历史差不多长。这是一个做了三十多年的「梦」。

知乎 on MSN

这东西的竞争力根本不在模型上，在 harness 工程上。除了模型能力，harness 层的工程能力也是一层壁垒。熟悉的人都知道，我是Claude Code的高强度使用者。在用的的过程中总是有困惑，包括有的命令怎么有点卡/记忆机制/终端的流畅度等 ...

一些您可能无法访问的结果已被隐去。