LISABench 2026开年首测,七大顶尖AI模型角逐Web3漏洞检测之王

1月5日消息,随着 2026 年的到来,AI 安全领域迎来了首个重量级基准测试。LISABench 今日宣布启动 2026 第一季度评估,旨在通过实战测试,决出在 Web3 智能合约漏洞检测领域表现最强的前沿 AI 模型。此外,LISABench同步开展了社区投票预测的奖励活动。
本次评测阵容豪华,集结了KIMI K2 (Moonshot AI)、DeepSeek V3.2 (深度求索)、QWen 3 30b-a3b (阿里云)、GLM 4.6 (智谱 AI)、GPT-5.2 (OpenAI)、Gemini-3-pro-preview (Google)和Claude 4.5 Sonnet (Anthropic)全球最顶尖的 7 大前沿模型 (Frontier Models) 同台竞技。
目前,针对 Q1 季度获胜者的预测投票通道已经开启。同时,LISABench 的评测标准代码库已在 GitHub 开源,供开发者查阅和复现。

上一篇:

下一篇: