LISABench 2026开年首测，七大顶尖AI模型角逐Web3漏洞检测之王

1月5日消息，随着 2026 年的到来，AI 安全领域迎来了首个重量级基准测试。LISABench 今日宣布启动 2026 第一季度评估，旨在通过实战测试，决出在 Web3 智能合约漏洞检测领域表现最强的前沿 AI 模型。此外，LISABench同步开展了社区投票预测的奖励活动。
本次评测阵容豪华，集结了KIMI K2 (Moonshot AI)、DeepSeek V3.2 (深度求索)、QWen 3 30b-a3b (阿里云)、GLM 4.6 (智谱 AI)、GPT-5.2 (OpenAI)、Gemini-3-pro-preview (Google)和Claude 4.5 Sonnet (Anthropic)全球最顶尖的 7 大前沿模型 (Frontier Models) 同台竞技。
目前，针对 Q1 季度获胜者的预测投票通道已经开启。同时，LISABench 的评测标准代码库已在 GitHub 开源，供开发者查阅和复现。