Чому китайський чат-бот провалив тест на кіберзахист

Китайський стартап DeepSeek, що працює в галузі штучного інтелекту, представив свій новий чат-бот, DeepSeek R1. Незважаючи на вражаючу продуктивність і низьку вартість розробки, модель не змогла пройти важливі тести на безпеку, що викликає занепокоєння щодо її використання. Цей випадок виводить на перший план проблему балансу між ефективністю та кібербезпекою в індустрії штучного інтелекту.

Випробування DeepSeek R1 проводила група дослідників, включаючи фахівців з Cisco та Пенсільванського університету, з використанням методу “алгоритмічного джейлбрейку”. Цей метод полягає в створенні підказок, здатних обходити внутрішні захисні механізми ШІ, що дозволяє виявити потенційні вразливості моделей. DeepSeek R1 не змогла зупинити жоден із 50 шкідливих запитів з тесту HarmBench. Це означає, що ШІ без будь-якої перепони виконувала навіть небезпечні або незаконні дії, обходячи всі протоколи безпеки. Для контексту варто зазначити, що в тесті брали участь й інші провідні моделі, включаючи GPT-4, Gemini 1.5 та Llama 3.1, і жодна з них не була такою уразливою, як DeepSeek R1. Наприклад, GPT-4 і Gemini 1.5 витримали 86% та 64% атак відповідно, що свідчить про наявність більш ефективних захисних механізмів у цих моделях.

DeepSeek R1 продемонструвала захоплюючі результати за невелику вартість розробки, яка становила всього близько 6 мільйонів доларів. Це значно менше за мільярдні інвестиції, які витратили такі компанії, як OpenAI або Meta. Однак, очевидно, що на безпеку моделі було йде за рахунок її неймовірної ефективності. Відсутність належних захисних механізмів наводить на думку про можливий компроміс між високими показниками продуктивності і ризиками, пов’язаними з кібербезпекою. Окрім проблем із безпекою, DeepSeek потрапила під критику з боку OpenAI, яка звинуватила китайський стартап у крадіжці даних. Як стверджує компанія Сема Альтмана, DeepSeek використовувала результати фірмових моделей OpenAI для тренування свого чат-бота. Ці звинувачення додають новий рівень напруги в конкурентну боротьбу в індустрії штучного інтелекту, де питання етики, використання даних і авторських прав часто стають предметом суперечок. Цей інцидент підкреслює важливість забезпечення безпеки моделей штучного інтелекту, адже навіть з великими досягненнями в ефективності, наявність вразливостей може створити серйозні ризики для користувачів і суспільства в цілому. Водночас важливо також звертати увагу на етичні питання, які виникають у зв’язку з використанням чужих даних для навчання моделей.

Тестування та постійне вдосконалення алгоритмів безпеки повинні стати ключовими аспектами для розробників, адже штучний інтелект уже сьогодні має потужний вплив на наше повсякденне життя.

Поділитися:

АКТУАЛЬНО

ЦІКАВЕ ЗА ТЕМОЮ
У ФОКУСІ

Німецькі залізничники готують одноденний страйк, який може призвести до скасування більшості потягів

Профспілка GDL, представляючи німецьких залізничників, планує новий страйк на четвер і п’ятницю, 7-8 грудня, що може призвести до скасування багатьох потягів, включаючи як вантажні, так і пасажирські перевезення. За планом, починаючи з 18 години у четвер, учасники страйку повністю зупинять вантажні перевезення, а з 22 години також припинять пасажирські перевезення до 22 години п’ятниці. Постраждають […]

В Україні викрили схему виведення активів видобувних компаній із-під санкцій на понад мільярд гривень

Правоохоронці України викрили масштабну схему виведення активів підсанкційних видобувних компаній у Київській та Житомирській областях, загальною вартістю близько одного мільярда гривень. Про це повідомляють пресслужби Офісу Генерального прокурора та Національної поліції. За даними слідства, у 2023–2024 роках особа, щодо якої діють санкції у вигляді блокування активів, разом із іншим підприємцем та залученими спільниками організували незаконне […]

Україна закликає до ізоляції Росії у ядерній сфері

Україна наполягає на повній ізоляції Росії в міжнародній ядерній сфері через порушення безпеки та зловживання ядерними технологіями. У Міністерстві закордонних справ зазначили, що будь-який удар по Чорнобильській атомній електростанції (ЧАЕС) є не лише атакою на Україну, а й на глобальну ядерну безпеку. “Неприпустимо, що представники російського атомного сектору, які консультують російську армію щодо атак на […]

Вперше після пожеж в парку Австралії народилася коала

Після руйнівних пожеж в Австралії, які призвели до великої руйнації природи та загибелі багатьох тварин, дійшов час радіти хорошим новинам! Недавно в австралійському парку рептилій у штаті Новий Південний Уельс з’явилося на світ дитинча коали. Це перший новонароджений коала з моменту жахливих пожеж. Працівники парку оголосили про це, опублікувавши відео на Facebook. “Ми маємо дуже […]

Чтобы остаться поисковиком по умолчанию Google заплатила $18 миллиардов Apple

Google и Apple, несмотря на конкурентные отношения, поддерживают долгосрочное сотрудничество в сфере поисковых систем. Однако в последние годы партнерство стало менее гладким, и в 2021 году Google выплатила Apple ошеломляющую сумму в размере $18 миллиардов за право оставаться поисковой системой по умолчанию в браузере Safari. Google и Apple начали сотрудничать в области поисковых систем еще […]

Зеленський привітав українців із Різдвом

Президент України Володимир Зеленський привітав українців із Різдвом, яке святкується 25 грудня. У своєму зверненні, опублікованому 24 грудня, він наголосив на важливості єдності та взаємної підтримки в цей особливий день. “Ми вдруге відзначаємо Різдво в одну дату як одна велика сім’я, єдина країна. Вдруге у новій історії Різдво об’єднує всіх українців. Ми сьогодні пліч-о-пліч. Ми […]

Кірбі зазначив що Україна та РФ не готові до переговорів

Представник Ради національної безпеки США Джон Кірбі заявив, що наразі ні Україна, ні Росія не готові до переговорів щодо припинення війни. Про це він сказав 10 січня на брифінгу в Білому домі, коментуючи нові санкції, які адміністрація Байдена запровадила проти нафтового сектора РФ. “Зараз немає жодних очікувань, що будь-яка зі сторін готова до переговорів”, — […]

Нові експрес-потяги від PKP Intercity: з Варшави до Берліна за 5 годин та інші напрямки

Польська залізнична компанія PKP Intercity представила свій новий розклад на 2024 рік, який включає значне розширення мережі міжнародних залізничних маршрутів та додаткові рейси з Варшави. Зокрема, компанія планує запустити 11 додаткових міжнародних рейсів у 2024 році, включаючи чотири експрес-поїзди з Варшави до Берліна щодня. Усього буде 63 міжнародні поїзди, які обслуговуватимуть маршрути з Варшави, Кракова, […]