Meta потрапила у скандал через маніпуляції з результатами тестів нових моделей штучного інтелекту

Нові моделі штучного інтелекту Llama 4 від Meta, включаючи легку Scout та середньоформатну Maverick, які за заявами компанії перевершують GPT-4o та Gemini 2.0 Flash у популярних тестах, стали об’єктом скандалу через маніпуляції з результатами тестування. Як з’ясувалося, для реклами публічної версії моделі була використана статистика експериментальної версії, недоступної для широкої аудиторії, що викликало обурення серед користувачів та аналітиків.

У пресрелізі Meta було зазначено, що модель Maverick посіла друге місце за рейтингом ELO (1417 балів), перевершуючи GPT-4o від OpenAI і наближаючись до Gemini 2.5 Pro. Ці результати спочатку виглядали вражаючими та сприяли позитивному іміджу нових моделей. Однак користувачі платформи LMArena, де порівнюють різні моделі штучного інтелекту, швидко помітили, що в документації Meta була вказівка на те, що тестувалась не публічна версія моделі, а спеціально налаштована експериментальна версія, створена для оптимізації результатів у чатах.

Meta не відразу розкрила, що для тестування було використано кастомізовану версію Llama-4-Maverick-03-26-Experimental. Після того, як ця інформація стала відома, компанія підтвердила, що статистика, використана для реклами, не відображає реальних характеристик публічної версії моделей, доступної для користувачів. Це викликало критику з боку спільноти, яка вважає такі маніпуляції недопустимими.

Керівництво LMArena в свою чергу звинуватило Meta в тому, що компанія не дотрималась стандартів чесного тестування, що підірвало довіру до їхньої платформи як індикатора реальної продуктивності моделей ШІ. У відповідь на скандал, LMArena вже оголосила про намір змінити свої правила, щоб уникнути подібних ситуацій у майбутньому. Вони зазначили, що постачальники, які можуть надати спеціально оптимізовані версії своїх моделей для тестування, а потім випускати інші публічні версії, порушують прозорість і об’єктивність тестування.

Поділитися:

АКТУАЛЬНО

ЦІКАВЕ ЗА ТЕМОЮ
У ФОКУСІ

Після смерті Ібрахіма Раїсі розпочалися президентські перегони в Ірані

П’ятиденний період реєстрації кандидатів на посаду президента в Ірані розпочався у четвер, інформує агентство ISNA за словами глави МВС Ірану, Ахмада Вахіді. Закінчення прийому заявок заплановано на 3 червня. Губернатори провінцій вже отримали вказівки щодо утворення виборчих комісій для надання відповідної підтримки майбутнім виборам. Кандидати на посаду президента повинні відповідати певним критеріям, таким як вік […]

Допомога Україні під загрозою. Знову

У планах бюджету США виникла серйозна суперечка через пропозицію спікера палати представників Майка Джонсона щодо виключення допомоги Україні, Ізраїлю та Тайваню з майбутнього бюджету. Ця ініціатива, запропонована з метою уникнення можливого федерального шатдауну, викликала гучні реакції, зокрема від Білого дому. Відповідно до Reuters, Майк Джонсон вважає, що розгляд питань фінансування України, Ізраїлю та Тайваню має […]

Саміт ШОС показав розбіжності між Китаєм, Росією та Індією

Лідери Китаю, Росії та Індії зустрілися в Пекіні на саміті Шанхайської організації співробітництва з наміром продемонструвати єдність та запропонувати альтернативу західній моделі глобального впливу. Зустріч покликана стати символом зародження нового світового порядку, що базується не на гегемонії США, повідомляє Sky News. На тлі дедалі більшого впливу Дональда Трампа на світову політику та його спроб переглянути […]

П’ять магічних фільмів для захоплюючих вихідних: що подивитись на екрані

Якщо ви шукаєте способи поринути у загадковий світ магії та ілюзій, наша добірка фільмів точно вас зацікавить. Ось п’ять захоплюючих стрічок, які подарують вам незабутні враження. Неймовірний світ магії та ілюзій, загадкові фокусні трюки, веселе і пригодницьке життя головних героїв, все це і багато іншого для поціновувачів захоплюючих та різноманітних історій. Ілюзія обману (Now You See […]

Блінкен закликає Ізраїль створити безпечні зони для цивільного населення в Газі

Держсекретар США Ентоні Блінкен закликав Ізраїль створити безпечні зони для мирних палестинських мешканців у Газі перед відновленням військових дій. Він висловив необхідність впровадження гуманітарних заходів для захисту цивільного населення та мінімізації жертв серед невинних палестинців. Згідно з його заявою, це передбачає визначення безпечних районів у південній і центральній частині Гази, де люди зможуть уникнути небезпеки […]

OnlyFans оштрафовано на мільйон фунтів у Великій Британії за порушення вікових обмежень

Платформа контенту для дорослих OnlyFans отримала штраф у розмірі одного мільйона фунтів стерлінгів від регулятора Великої Британії за ненадання точної інформації про заходи щодо обмеження віку своїх користувачів. Це рішення стало наслідком виявленої помилки у системі, що використовувалась для перевірки віку користувачів платформи. У 2023 році OnlyFans повідомила регулятора Великої Британії і Північної Ірландії, що […]

Роберт Фіцо критикує збір коштів на закупівлю боєприпасів для України

Екс-прем’єр-міністр Словаччини Роберт Фіцо висловив свою негативну думку стосовно збору коштів на закупівлю боєприпасів для України, порівнявши цю ініціативу з “пуканням у дерево”. Про це повідомляє видання Noviny Plus. “Це немов пукнути в дерево”: так оцінив Роберт Фіцо збір 4 млн євро словаками на закупівлю боєприпасів для України. За словами прем’єр-міністра Словаччини, ці гроші все […]

Кому надається право на безкоштовний проїзд у метрополітені

Метрополітен — це один із найшвидших і зручних способів пересування по місту для тисяч українців. Але не всі користувачі можуть дозволити собі платний проїзд. Для підтримки соціально незахищених груп населення та ветеранів, зокрема тих, хто постраждав від наслідків Чорнобильської катастрофи, у столичному метрополітені передбачені пільги на проїзд. Безкоштовно користуватися підземним транспортом можуть представники ряду вразливих […]