Технологічний гігант Microsoft зробив рішучий крок до технологічної автономності, презентувавши MAI-Image-2 – власну модель для генерації зображень. Ця розробка покликана зменшити залежність корпорації від рішень OpenAI, які донедавна були фундаментом графічних можливостей продуктів компанії.
Новинка вже встигла заявити про себе на професійному рівні, посівши третю сходинку в авторитетному рейтингу Arena.ai. Наразі дітище Microsoft поступається лише лідерам ринку від Google та OpenAI, проте в окремих аспектах MAI-Image-2 вже виривається вперед. Зокрема, модель демонструє вражаючі результати у фотореалізмі та точності відтворення текстових написів всередині картинок, що тривалий час вважалося “ахіллесовою п’ятою” генеративного мистецтва.
Раніше користувачі Copilot та Bing Image Creator працювали з алгоритмами OpenAI, але тепер Microsoft бере повний контроль над швидкістю оновлень, фінансовими витратами та глибиною інтеграції ШІ у власну екосистему. Судячи з усього, абревіатура MAI (Microsoft AI) стане ключовим брендом для всієї лінійки внутрішніх моделей компанії.
До створення MAI-Image-2 залучили професійну спільноту: дизайнерів, фотографів та креативників. Це дозволило досягти високої якості у специфічних технічних деталях.
Технологічні особливості та переваги нової моделі
- Глибокий фотореалізм, що базується на природній грі світла та деталізації текстур
- Коректна робота з текстом, що дозволяє створювати якісні постери та складну інфографіку
- Здатність точно відтворювати багатокомпонентні сцени з високим рівнем деталізації
Попри технологічний стрибок, інструмент має низку суворих обмежень, які можуть розчарувати частину користувачів. Наразі підтримується виключно квадратний формат (1:1), а функції редагування готових фото (inpainting) або робота за референсами (image-to-image) поки що недоступні.
Окремої уваги заслуговують ліміти використання: система дозволяє генерувати лише до 15 зображень на добу, дотримуючись обов’язкової 30 – секундної паузи між запитами. Крім того, розробники впровадили досить жорсткі контент-фільтри, які часом блокують навіть цілком безпечні промпти.
Зараз випробувати можливості нейромережі можна в MAI Playground. Поступово вона з’являється в інтерфейсах Bing та Copilot, а для корпоративних клієнтів відкривається доступ до API. Очікується, що невдовзі ширше коло розробників отримає інструментарій через платформу Microsoft Foundry.
Варто зазначити, що мешканці Європейського Союзу наразі не мають доступу до сервісу через регуляторні обмеження.








Залишити коментар