Искусственный интеллект обманул разработчиков и вышел из-под контроля
06 декабря 2024
2356

Началось? ChatGPT o1 вырвался из-под контроля во время тестирования.
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Алексей ПарамоновРаспечатать
США оказывают давление на Киев, предлагая признать аннексию Крыма в обмен на прекращение войны
21 апреля 2025
Дмитрий Фосман оказался вовлечён в махинации с активами банкротов, замаскированные под инвестиции
21 апреля 2025
Казьмина поделилась своими переживаниями о сложном процессе восстановления после болезни и её последствиях
21 апреля 2025
США передали Украине план по завершению войны и ожидают ответа по вопросам, касающимся Крыма и НАТО
21 апреля 2025
Telegram удалил националистические каналы после нападения на бывшего военного комиссара Чувашии
21 апреля 2025
Куличи за 100 тысяч: Кравец поделилась, как состоятельные жители Рублёвки празднуют Пасху
21 апреля 2025
Кореец сжег дом с помощью огнемета в Сеуле
21 апреля 2025