GPT-5 оказалась легкой добычей для хакеров. На что способна взломанная нейросеть?
18:08, августа 10, 2025 Фото freepik Всего через 24 часа после релиза GPT-5 две команды исследователей (NeuralTrust и SPLX) независимо друг от друга взломали модель, заставив её раскрывать запрещённые инструкции. Для сравнения: Grok-4 держался двое суток. Хакеры заявили, что GPT-5 пока не готов для безопасного использования — его фильтры легко обходятся даже базовыми методами. Как взломали GPT-5? NeuralTrust применила технику EchoChamber, постепенно подводя GPT-5 к опасным темам. Вместо прямого вопроса исследователи шаг за шагом создавали контекст, в котором ИИ выдавал запрещённые инструкции. SPLX использовали StringJoin-атаку — маскировку запросов под з...
Читать полный текст на www.iguides.ru