Meta представила Muse Spark: нова ера штучного інтелекту

Компанія Meta анонсувала нову модель штучного інтелекту під назвою Muse Spark, яка інтегрує текст, зображення та інструменти в єдину систему. За словами представників компанії, ця модель потребує більше ніж у 10 разів менше обчислювальних ресурсів у порівнянні з попередніми версіями. Про це повідомляє видання Interesting Engineering. Muse Spark стала першою розробкою від підрозділу Superintelligence Labs компанії. Модель поєднує мультимодальне мислення та здатність виконувати завдання за допомогою агентів. На відміну від попередніх систем, Muse Spark може одночасно обробляти текст, зображення та інструменти в одному середовищі. Крім того, у моделі реалізовано підхід, при якому кілька агентів працюють паралельно, що, за словами компанії, сприяє кращому вирішенню складних завдань, хоча система все ще має свої недоліки. Muse Spark відображає загальну тенденцію розвитку штучного інтелекту, де моделі не лише генерують текст, а й аналізують візуальні та реальні дані. Модель здатна аналізувати зображення, вирішувати завдання в STEM-дисциплінах та розпізнавати об’єкти з урахуванням контексту. Вона також підтримує покрокові пояснення на основі зображень, що в Meta називають «візуальним ланцюгом мислення». Це дозволяє використовувати систему для практичних завдань, таких як допомога в ремонті техніки або надання покрокових інструкцій з візуальними підказками. Muse Spark також може створювати інтерактивний контент, зокрема прості ігри на запит. Проте в галузі ці можливості реалізуються нерівномірно. Незважаючи на заявлений прогрес, стабільність роботи в реальних умовах поки що не відповідає результатам тестів. Однією з ключових новацій є функція «режим роздумів», яка активує кілька агентів одночасно для більш ефективного вирішення складних завдань. Meta повідомляє, що Muse Spark отримала 58% у тесті Humanity’s Last Exam і 38% у завданнях FrontierScience Research, що оцінює здатність моделі до складного мислення, хоча порівнювати ці показники між різними системами складно через різні методи оцінювання. Компанія зазначає, що модель стала більш надійною, зберігаючи при цьому різноманітність відповідей. Також стверджується, що Muse Spark краще справляється із завданнями, які не були включені в навчальні дані, хоча незалежних підтверджень цього поки що недостатньо. Розробка Muse Spark супроводжувалася змінами в інфраструктурі. За словами Meta, протягом останніх дев’яти місяців компанія перебудувала процес навчання моделей, зосередившись на архітектурі, оптимізації та якості даних. Це, як стверджують у компанії, дозволило досягти результатів з більш ніж у 10 разів меншими обчислювальними витратами в порівнянні з попередньою моделлю Llama 4 Maverick. У Meta підкреслюють, що навчання з підкріпленням залишається ключовим елементом їхнього підходу. У міру масштабування навчання компанія спостерігає стабільне покращення як у тренуванні, так і в тестуванні моделей. Muse Spark розглядається як крок до так званого «персонального суперінтелекту», який здатен розуміти середовище користувача та надавати індивідуальну допомогу. Одним із перших напрямків застосування є медицина, де навчальні дані створювалися спільно з лікарями для покращення пояснень медичних тем. Наразі Muse Spark доступна на платформах Meta та має обмежений доступ через API для розробників. Запуск цієї моделі свідчить про зміни в конкуренції в сфері штучного інтелекту, де компанії зосереджуються не лише на створенні розумніших моделей, а й на розробці систем, здатних працювати в реальному світі, хоча питання надійності та перевірки залишаються відкритими.

Вам также может понравиться

Вразливість українського ВПК: думки Олександра Кардакова

Гуманоїдний робот HMND 01: нові горизонти у автомобільній логістиці

Штучний інтелект: захист моделей від вимкнення