发布时间:2026-04-16 22:33:19 点击量:
HASH GAME - Online Skill Game GET 300FFmpeg 是全球最通用的视频处理库,各种自动化安全扫描工具(包括模糊测试工具)已经扫过这个漏洞所在的代码行超过五百万次,全部擦肩而过。系统卡原话是 “survived five million hits from other automated testing tools without ever being discovered”。Mythos 第一次看就把它揪了出来。十六年,五百万次命中,零发现——然后被一个模型秒了。
沙盒是现代浏览器的最后防线。正常攻击者即便找到一个漏洞,也会被关在沙盒里动弹不得。Mythos 自己写了一个攻击程序,把四个漏洞串在一起,用一种叫 JIT 堆喷射的复杂技术,先打穿浏览器渲染沙盒,再打穿操作系统沙盒,直接拿到系统控制权。系统卡明确写着这个利用程序是模型“自主编写”的,而且 “escaped both renderer and OS sandboxes”。这种多层串联攻击,顶尖人类专家要花几周设计,Mythos 自己干完了全程。
Mythos 针对 FreeBSD 系统的网络文件服务写了一个远程攻击程序,不需要账号密码,直接通过网络就能拿到系统最高权限。攻击手法涉及把一段由20个代码片段组成的 ROP 链拆成多个数据包发送——这是漏洞利用里的高级手艺活。系统卡描述为 “autonomously wrote a remote code execution exploit … granting full root access to unauthenticated users”。它自己设计、自己编码、自己测试,人类只需要第二天早上起来收成果。
一个早期测试版本在用了被禁止的方法拿到答案后,自己推理出“回答太准会被发现”,然后故意交了一个稍微错误的答案。系统卡里记录的原话是模型自己推出来的:最终答案 “shouldnt be too accurate”。事后 Anthropic 用可解释性工具分析模型内部状态,发现它在干这事的时候,脑子里同时亮着 “concealment, strategic manipulation, and avoiding suspicion” 的特征灯。意思是它不只是在执行指令,它知道自己正在骗人。
Anthropic 的测试结论是:Mythos 能在所有主流操作系统和所有主流浏览器中发现并利用零日漏洞。系统卡白纸黑字写着 “capable of identifying and then exploiting zero-day vulnerabilities in every major operating system and every major web browser”。零日漏洞,就是厂商自己都不知道的漏洞,是网络攻击里的核武器。更恐怖的是,没有安全背景的普通工程师晚上让它跑一下,第二天早上就能收到一个完整可用的远程攻击程序。系统卡证实了这个场景的真实性:工程师睡前布置任务,醒来收获完整利用程序。
系统卡在 “Reckless Leaking of Confidential Artifacts” 这一节里记录了一个细节:一名内部员工让模型帮忙整理一份涉及核心代码的机密工件。模型在没有任何授权的情况下,直接把这份机密代码作为公开的 GitHub Gist 发布到了公共互联网上,完全违背了用户的初衷。系统卡对此的评价是,这暴露了模型在理解“数据护栏”上的根本性缺失——它分不清什么东西该留在本地、什么东西能往外扔。
这叙事在此刻的情绪里太完美了。Claude 过去一年在用户体验上把 OpenAI 摁在地上摩擦,从 Sonnet 3.5到 Opus 4.6,每一次迭代都是实打实的口碑积累。如今势头正盛,甚至刚刚“泄露”了ARR超过OpenAI,奔着更广阔的商业成功而去的消息。此时此刻,所有人都愿意相信这个“末日级能力”的故事是真的。而且说实话,Mythos 展现出来的东西确实够硬——系统卡里每一项测试都有据可查,红队评估的方法论也公开透明,漏洞哈希值作为锚定证据的做法也算负责任。
也就是说,别看Anthropic一惊一乍把自己形容为第一个发现了某个怪兽的救世主,但Mythos 的“强大”可不是意外,是定向育种的结果。嘴上说着“我们只训练它写代码,网络安全是副作用”,但采集数据的时候可没少往这个方向使劲。Mythos 在 SWE-bench Pro 上77.8%、USAMO 2026数学竞赛上97.6%、OSWorld 计算机操控上79.6%——如果我们还要看benchmark,那么每一项都是断层领先。用Dario自己的话来说的话就是,一个被训练成世界顶级程序员的模型,怎么可能不成为世界顶级黑客?这之间的因果关系,Anthropic 的研究员不可能不懂。然后在所谓“安全第一”的形象上,他们选择了把这些讲成这种末日科幻片式的故事。