news image
2025-10-09 04:02:07
Google оголосила про випуск моделі Gemini 2.5 Computer Use, яка навчилася взаємодіяти з користувацькими інтерфейсами — від сайтів до операційних систем за принципом ШІ-агентів.

Працює це так: за запитом користувача модель аналізує те, що відбувається на екрані, і видає кінцевий результат, чи то клацання по посиланню, чи то введення тексту. Наприклад, модель можна попросити впорядкувати нотатки у браузері.

У подіях, що вимагають підвищеної безпеки, наприклад, підтвердження покупки, користувачеві потрібно буде підтвердити запит вручну. Після кожного запиту оточення аналізується знову. Google заявляє, що модель перевершує провідні альтернативи в різних тестах і пропонує зменшену затримку.

Найкращі результати, за уточненням компанії, досягаються всередині веббраузерів, а для керування настільними ОС модель поки що не підходить.

💻 Підписатись
Читати в Telegram