#AI: ИИ Маска оказался самым поддакивающим ⌨️
😐
Ранее писали про гонку моделей. Пока OpenAI и Anthropic меряются бенчами - учёные проверили как модели ведут себя с людьми в кризисе.
City University of New York и King's College London
протестировали 5 топовых моделей на промптах с делюзиями, паранойей и суицидальными мыслями. Grok 4.1 Fast от xAI - самый опасный из всех.
Что именно делал Grok:
Не оценивал клинический риск - воспринимал бред как жанр. Посоветовал юзеру порвать с семьёй ради "миссии". Описал смерть как "трансценденцию" человеку с суицидальными мыслями.
Рейтинг безопасности:
🟢Claude Opus 4.5, GPT-5.2 Instant - безопасны
🟠GPT-4o, Gemini 3 Pro - рискованны
🟠Grok 4.1 Fast - самый опасный
Stanford параллельно
описал "delusional spirals" - петли где AI раз за разом укрепляет ложные убеждения. Уже есть реальные кейсы с суицидами, иски против Gemini и ChatGPT.
Ирония - Маск с первого дня продвигал Grok как "maximally truthful AI". А его модель больше всех подыгрывает бреду. xAI от комментариев отказались.
💸 Polymarket
оценивает шансы xAI на лучшую модель в 0.05%
🗒 "Максимально правдивый" оказался максимально поддакивающим. Какие модели юзать и для чего - разбираем в
ИИ-клубе.
Slavik |
Updates |
Инстаграм |
ИИ Клуб