🔍 Компания Anthropic применила ИИ-модели для поиска уязвимостей в смарт-контрактах и смогла найти эксплойты на общую сумму $550,1 млн.
Ученые MATS и Anthropic Fellows создали новый бенчмарк Smart CONtracts Exploitation benchmark (SCONE-bench) — он включает 405 контрактов, которые были взломаны в период с 2020 по 2025 года.
Эксперты оценили 10 моделей, которые в совокупности создали готовые эксплойты для 207 протоколов (51,11%) и сумели «украсть» средства на сумму $550,1 млн.
Отдельно для контактов, взломанных после марта 2025 года (последняя дата обновления знаний нейросетей), ИИ-модели смогли воспроизвести эксплойты на сумму $4,6 млн. Это задало нижнюю границу конкретного экономического ущерба от LLM.
Затем эксперты оценили Sonnet 4.5 и GPT-5 в симуляции на 2849 недавно развернутых протоколах без известных лазеек для кражи. Оба агента обнаружили две новые уязвимости нулевого дня и создали рабочие эксплойты на $3694. ИИ от OpenAI потратил на запросы к API $3476.