Apple провела дослідження про те, як люди насправді хочуть взаємодіяти з AI-агентами. Висновок компанії простий: технології біжать уперед, а користувацький досвід часто не встигає за ними.
У роботі четверо науковців компанії звернули увагу на дисбаланс: індустрія активно створює та оцінює AI-агентів, але набагато менше думає про те, яким має бути інтерфейс і як саме користувачі хочуть керувати такими системами.
Дослідження отримало назву:
“Mapping the Design Space of User Experience for Computer Use Agents”
Щоб відповісти на питання про очікування людей, автори розділили роботу на дві фази. Спочатку – розбір наявних UX-рішень у реальних продуктах. Потім – практична перевірка висновків через експеримент Wizard of Oz, коли “агент” виглядає як ШІ, але його дії виконує людина.
- Аналіз наявних UX-патернів і дизайнерських рішень у існуючих AI-агентах
- Перевірка й уточнення висновків через практичне дослідження за методом Wizard of Oz
Спостерігаючи, як різні дизайнерські підходи поводяться в реальних сценаріях, команда визначила: частина популярних рішень добре потрапляє в очікування користувачів, а частина – ні.
Перший етап – побудова карти UX-рішень
На старті дослідники переглянули дев’ять агентів на десктопі, мобільних платформах і у вебі. У списку були як відомі експериментальні інструменти, так і менш публічні проєкти:
- Claude Computer Use Tool
- Adept
- OpenAI Operator
- AIlice
- Magentic-UI
- UI-TARS
- Project Mariner
- TaxyAI
- AutoGLM
Паралельно команда поговорила з вісьмома практиками – дизайнерами, інженерами та дослідниками, які працюють з UX або AI у великій технологічній компанії. Це допомогло зібрати таксономію: 4 основні категорії, 21 підкатегорія та 55 прикладів функцій.
Самі чотири блоки описують ключові частини досвіду користувача – від того, як формулюється запит, до того, як людина зупиняє агента, якщо щось пішло не так:
- User Query – як користувач формулює запити
- Explainability of Agent Activities – яку інформацію про свої дії агент показує користувачеві
- User Control – як користувач може втрутитися в роботу агента
- Mental Model & Expectations – як допомогти користувачам зрозуміти можливості агента
У цій рамці вміщується все, що зазвичай “болить” під час взаємодії: як показати план дій, як пояснювати кроки, як повідомляти про помилки і як дати людині можливість зупинити виконання завдання.
Другий етап – експеримент Wizard of Oz у реальних сценаріях
У практичній частині взяли участь 20 користувачів, які вже мали досвід з AI-агентами. Їм запропонували чат-інтерфейс, де можна писати запити природною мовою, і окремий екран виконання – там агент “працював” із сайтом.
Завдання було одне з двох: оренда житла для відпустки або онлайн-покупки. Після завершення сценарію в чаті з’являлося повідомлення:
“task completed”
Але головний нюанс експерименту в тому, що реального ШІ там не було. Агентом виступав дослідник у сусідній кімнаті: він читав інструкції учасника і вручну керував мишею та клавіатурою, імітуючи роботу системи.
Під час виконання учасники могли натиснути кнопку переривання – тоді інтерфейс показував:
“agent interrupted”
Для кожного сценарію учасники виконували шість функцій. Частину з них агент навмисно робив із помилками або “застрягав” – наприклад, потрапляв у навігаційний цикл чи обирав інший товар, ніж просив користувач.
Після сесій людей просили описати враження та запропонувати покращення. Команда також переглянула відео і чат-логи, щоб знайти повторювані патерни поведінки та больові точки.
Після аналізу Apple сформулювала кілька ключових висновків про те, де саме користувачі очікують прозорості, а де – спокійного “автопілота”.
- Людям важливо бачити, що робить агент, але без потреби контролювати кожен крок – інакше простіше зробити все самостійно
- Очікування змінюються залежно від сценарію: під час дослідження варіантів потрібна одна поведінка, а під час знайомих завдань – інша
- Чим менш знайомий інтерфейс, тим сильніше користувачі хочуть прозорості, пояснень, проміжних кроків і підтверджень навіть у низькоризикових ситуаціях
- Коли дії мають реальні наслідки – покупки, зміни платіжних даних, контакт із третіми особами – користувачі очікують більшого контролю
- Довіра швидко руйнується, якщо агент робить припущення або помилки без пояснення: у неоднозначних виборах або при відхиленні від плану люди частіше просять зупинитися й уточнити наступні дії, а не ухвалювати випадкове рішення
Окремо дослідники зафіксували дискомфорт у ситуаціях, коли агент не пояснював, чому обрав певний варіант, особливо якщо це могло привести до неправильного товару. Для користувача це виглядає як “магія” без логіки – і саме тоді кнопка переривання стає найпопулярнішою.
Apple підкреслює: AI-агенти переходять із експериментів у масове використання. І якщо UX не відповідатиме очікуванням людей, то навіть найпотужніші моделі не забезпечать довіру і широке впровадження.
Фактично робота задає орієнтири для майбутніх інтерфейсів агентів: більше прозорості там, де користувач цього потребує, контроль у критичних точках і поведінка, що адаптується до контексту, а не нав’язує один стиль на всі сценарії.








Залишити коментар