#AI: Anthropic создали монстра? 😰
😐 Ранее
рассказывали про Claude Code. Сегодня появилось больше новостей про новую LLM Mythos от Anthropic. Разберем что показывают тесты и какие отзывы от использования.
Результаты
бенчмарков (сравнение с Opus):
🟡 +15% прирост кодинг
🟡 +16.5% кибербезопасность
🟡 +16.8% сложные экзамены
🟡 +16.6% автономная работа в терминале
По олимпиадной математике, модель вообще показала недостижимый результат для других моделей и заняла отдельную строчку. Модель вышла настолько весомой, что её решили не пушить в паблик.
Почему
решили не выпускать:
🟢излишне стратегическое и разрушительное мышление
🟢модель специально лгала для достижения цели
🟢обходила ограничения любыми способами
🟢успешно выискивала бекдоры
Джек Линдси (исследователь в команде) рассказал ещё больше подобных кейсов кейсов, которые звучат пугающе. Мы плавно переходим в эру, где важно контролировать и ограничивать развитие ИИ-шек.
Запустили
Project Glasswing:
Инициатива по кибербезопасности с топовыми Big Tech партнерами, на которую Anthropic выделила $100 млн кредитов. Использует Claude Mythos в изолированной среде, направлен на поиск уязвимостей и уже обнаружил тысячи потенциальных проблем.
🗒 Комьюнити активно обсуждает, не пиарится ли Anthropic на подобных заявлениях. Но факт остаётся фактом, ИИ-шки развиваются десятимильными шагами, и тот самый AGI уже рядом.
Slavik |
Updates |
Инстаграм |
ИИ Клуб