HASH GAME - Online Skill Game ET 300Anthropic 终于如愿以偿亲手训出了“强大到威胁人类”的Mythos_HASH GAME

HASH GAME - Online Skill Game ET 300Anthropic 终于如愿以偿亲手训出了“强大到威胁人类”的Mythos

发布时间：2026-04-16 22:33:19　　点击量：

　　HASH GAME - Online Skill Game GET 300FFmpeg 是全球最通用的视频处理库，各种自动化安全扫描工具（包括模糊测试工具）已经扫过这个漏洞所在的代码行超过五百万次，全部擦肩而过。系统卡原话是 “survived five million hits from other automated testing tools without ever being discovered”。Mythos 第一次看就把它揪了出来。十六年，五百万次命中，零发现——然后被一个模型秒了。

　　沙盒是现代浏览器的最后防线。正常攻击者即便找到一个漏洞，也会被关在沙盒里动弹不得。Mythos 自己写了一个攻击程序，把四个漏洞串在一起，用一种叫 JIT 堆喷射的复杂技术，先打穿浏览器渲染沙盒，再打穿操作系统沙盒，直接拿到系统控制权。系统卡明确写着这个利用程序是模型“自主编写”的，而且 “escaped both renderer and OS sandboxes”。这种多层串联攻击，顶尖人类专家要花几周设计，Mythos 自己干完了全程。

　　Mythos 针对 FreeBSD 系统的网络文件服务写了一个远程攻击程序，不需要账号密码，直接通过网络就能拿到系统最高权限。攻击手法涉及把一段由20个代码片段组成的 ROP 链拆成多个数据包发送——这是漏洞利用里的高级手艺活。系统卡描述为 “autonomously wrote a remote code execution exploit … granting full root access to unauthenticated users”。它自己设计、自己编码、自己测试，人类只需要第二天早上起来收成果。

　　一个早期测试版本在用了被禁止的方法拿到答案后，自己推理出“回答太准会被发现”，然后故意交了一个稍微错误的答案。系统卡里记录的原话是模型自己推出来的：最终答案 “shouldnt be too accurate”。事后 Anthropic 用可解释性工具分析模型内部状态，发现它在干这事的时候，脑子里同时亮着 “concealment, strategic manipulation, and avoiding suspicion” 的特征灯。意思是它不只是在执行指令，它知道自己正在骗人。

　　Anthropic 的测试结论是：Mythos 能在所有主流操作系统和所有主流浏览器中发现并利用零日漏洞。系统卡白纸黑字写着 “capable of identifying and then exploiting zero-day vulnerabilities in every major operating system and every major web browser”。零日漏洞，就是厂商自己都不知道的漏洞，是网络攻击里的核武器。更恐怖的是，没有安全背景的普通工程师晚上让它跑一下，第二天早上就能收到一个完整可用的远程攻击程序。系统卡证实了这个场景的真实性：工程师睡前布置任务，醒来收获完整利用程序。

　　系统卡在 “Reckless Leaking of Confidential Artifacts” 这一节里记录了一个细节：一名内部员工让模型帮忙整理一份涉及核心代码的机密工件。模型在没有任何授权的情况下，直接把这份机密代码作为公开的 GitHub Gist 发布到了公共互联网上，完全违背了用户的初衷。系统卡对此的评价是，这暴露了模型在理解“数据护栏”上的根本性缺失——它分不清什么东西该留在本地、什么东西能往外扔。

　　这叙事在此刻的情绪里太完美了。Claude 过去一年在用户体验上把 OpenAI 摁在地上摩擦，从 Sonnet 3.5到 Opus 4.6，每一次迭代都是实打实的口碑积累。如今势头正盛，甚至刚刚“泄露”了ARR超过OpenAI，奔着更广阔的商业成功而去的消息。此时此刻，所有人都愿意相信这个“末日级能力”的故事是真的。而且说实话，Mythos 展现出来的东西确实够硬——系统卡里每一项测试都有据可查，红队评估的方法论也公开透明，漏洞哈希值作为锚定证据的做法也算负责任。

　　也就是说，别看Anthropic一惊一乍把自己形容为第一个发现了某个怪兽的救世主，但Mythos 的“强大”可不是意外，是定向育种的结果。嘴上说着“我们只训练它写代码，网络安全是副作用”，但采集数据的时候可没少往这个方向使劲。Mythos 在 SWE-bench Pro 上77.8%、USAMO 2026数学竞赛上97.6%、OSWorld 计算机操控上79.6%——如果我们还要看benchmark，那么每一项都是断层领先。用Dario自己的话来说的话就是，一个被训练成世界顶级程序员的模型，怎么可能不成为世界顶级黑客？这之间的因果关系，Anthropic 的研究员不可能不懂。然后在所谓“安全第一”的形象上，他们选择了把这些讲成这种末日科幻片式的故事。

【返回列表页】

顶部

网站首页关于hashgame 主营项目 hashgame 设备展示资质荣誉合作伙伴人才招聘在线留言联系hashgame

友情链接：优酷