Чому китайський чат-бот провалив тест на кіберзахист

Китайський стартап DeepSeek, що працює в галузі штучного інтелекту, представив свій новий чат-бот, DeepSeek R1. Незважаючи на вражаючу продуктивність і низьку вартість розробки, модель не змогла пройти важливі тести на безпеку, що викликає занепокоєння щодо її використання. Цей випадок виводить на перший план проблему балансу між ефективністю та кібербезпекою в індустрії штучного інтелекту.

Випробування DeepSeek R1 проводила група дослідників, включаючи фахівців з Cisco та Пенсільванського університету, з використанням методу “алгоритмічного джейлбрейку”. Цей метод полягає в створенні підказок, здатних обходити внутрішні захисні механізми ШІ, що дозволяє виявити потенційні вразливості моделей. DeepSeek R1 не змогла зупинити жоден із 50 шкідливих запитів з тесту HarmBench. Це означає, що ШІ без будь-якої перепони виконувала навіть небезпечні або незаконні дії, обходячи всі протоколи безпеки. Для контексту варто зазначити, що в тесті брали участь й інші провідні моделі, включаючи GPT-4, Gemini 1.5 та Llama 3.1, і жодна з них не була такою уразливою, як DeepSeek R1. Наприклад, GPT-4 і Gemini 1.5 витримали 86% та 64% атак відповідно, що свідчить про наявність більш ефективних захисних механізмів у цих моделях.

DeepSeek R1 продемонструвала захоплюючі результати за невелику вартість розробки, яка становила всього близько 6 мільйонів доларів. Це значно менше за мільярдні інвестиції, які витратили такі компанії, як OpenAI або Meta. Однак, очевидно, що на безпеку моделі було йде за рахунок її неймовірної ефективності. Відсутність належних захисних механізмів наводить на думку про можливий компроміс між високими показниками продуктивності і ризиками, пов’язаними з кібербезпекою. Окрім проблем із безпекою, DeepSeek потрапила під критику з боку OpenAI, яка звинуватила китайський стартап у крадіжці даних. Як стверджує компанія Сема Альтмана, DeepSeek використовувала результати фірмових моделей OpenAI для тренування свого чат-бота. Ці звинувачення додають новий рівень напруги в конкурентну боротьбу в індустрії штучного інтелекту, де питання етики, використання даних і авторських прав часто стають предметом суперечок. Цей інцидент підкреслює важливість забезпечення безпеки моделей штучного інтелекту, адже навіть з великими досягненнями в ефективності, наявність вразливостей може створити серйозні ризики для користувачів і суспільства в цілому. Водночас важливо також звертати увагу на етичні питання, які виникають у зв’язку з використанням чужих даних для навчання моделей.

Тестування та постійне вдосконалення алгоритмів безпеки повинні стати ключовими аспектами для розробників, адже штучний інтелект уже сьогодні має потужний вплив на наше повсякденне життя.

Поділитися:

АКТУАЛЬНО

ЦІКАВЕ ЗА ТЕМОЮ
У ФОКУСІ

Британія проведе пуск ядерної ракети вперше з 2016 року

Велика Британія вперше з 2016 року проведе випробувальний запуск ядерної ракети з підводного човна в Атлантичному океані. Про це повідомляє The Telegraph. Судноплавні компанії були попереджені про те, що будуть проведені випробування, коли підводний човен HMS Vanguard прибув до Атлантичного океану. Випробування, в якому буде задіяна боєголовка без ядерного заряду, відбудеться до 4 лютого приблизно за […]

Українці придбали майже 230 кг золота за перші п’ять місяців 2025 року

Українці у січні-травні 2025 року придбали у банках майже 230 кілограмів золота. Загальна кількість купленого дорогоцінного металу склала 7394 унції, що приблизно дорівнює 229,95 кілограма, а загальна вартість покупок становить 22,47 мільйона доларів, повідомляє “Європейська правда”. За даними Національного банку України, у перші п’ять місяців цього року обсяги купівлі золота населенням перевищили продаж на 1023 […]

Північна Корея анонсує отримання перших знімків від розвідувального супутника

Північна Корея оголосила про успішне отримання перших космічних знімків від свого нового військового розвідувального супутника «Малліган-1», який нещодавно був виведений на навколоземну орбіту. Згідно з інформацією, оприлюдненою північнокорейським державним інформагентством KCNA і повідомленням агентства Yonhap, космічні знімки, отримані о 9:21, показують авіабазу Андерсен та гавань Апра на американському острові Гуам, де знаходиться одна з найбільших […]

Твори Кінга масово вилучають у США

Американський письменник Стівен Кінг очолив список авторів, чиї твори найчастіше забороняють у школах США. Про це повідомляє Associated Press із посиланням на звіт правозахисної організації PEN America. За минулий навчальний рік книги Кінга забороняли 206 разів. Із його 87 видань під цензуру потрапили, зокрема, романи «Керрі» та «Протистояння». Основними причинами вилучення стають сцени насильства, сексуальний […]

Азербайджан розглядає можливість прийняття кліматичного саміту ООН у 2024 році

9 грудня, міністр екології Азербайджану, Мухктар Бабаєв, повідомив, що країна розглядає можливість прийняття саміту ООН зі зміни клімату в наступному році. За його словами, таке рішення було досягнуте за підтримки “загального консенсусу”, що виник після політичної угоди між Азербайджаном і його сусідами. 7 грудня Азербайджан заявив про досягнення угоди з Вірменією, що значно підвищило ймовірність […]

КНДР готова відправити військових в Україну на підтримку РФ

Міністр оборони Південної Кореї Кім Йонг Хен в інтерв’ю агентству Yonhap заявив, що Північна Корея може направити членів своїх збройних сил в Україну для підтримки російської армії. Він зазначив, що підписаний між Росією та Північною Кореєю взаємний договір, схожий на військовий союз, підвищує ймовірність такого розгортання. Кім додав, що інформація про ліквідацію північнокорейських військових на […]

Серпневі зміни у податковому та банківському законодавстві, що варто знати громадянам України?

Останній місяць літа принесе українцям важливі зміни у сфері фінансів. Зокрема, частина послуг буде звільнена від податків, а штрафи за порушення податкового законодавства стануть значно жорсткішими. З 1 серпня в Україні завершується перехідний період, під час якого штрафи за порушення застосування реєстраторів розрахункових операцій (РРО) та програмних РРО (ПРРО) були зменшені до 25% або 50%. […]

Труха Україна оштрафували на 4,8 млн грн за незаконну рекламу азартних ігор

Найпопулярніший інформаційний телеграм-канал України «Труха Україна» отримав штраф у розмірі 4,8 мільйона гривень за незаконну рекламну діяльність. Як повідомили в Міністерстві цифрової трансформації, канал розміщував рекламу азартних ігор без відповідної ліцензії та реєстрації в Національному реєстрі суб’єктів у сфері медіа. За законодавством України, рекламувати азартні ігри мають право лише ті медіа, які зареєстровані в офіційному […]