Браузерный агент Browser Act: возможности и практическое применение
Ключевые тезисы:
- Browser Act — это инструмент, который может работать как скрапер для сбора данных и как браузерный агент для взаимодействия с интерфейсами.
- Он обходит капчи и защиту от ботов, работает с сайтами, требующими авторизации.
- Инструмент доступен как бесплатный скилл для использования в различных средах (Claude Code, Cursor, Cline и др.).
- Основная ценность — автоматизация сложных пользовательских сценариев в браузере.
Настройка и авторизация
- Установка скилла: Скилл Browser Act устанавливается в выбранную среду разработки (например, Claude Code) через вставку соответствующего кода.
- Авторизация: После установки необходимо выполнить команду
авторизируйся браузер act, перейти по полученной ссылке и подтвердить вход (нажать "Hello").
Практический кейс: автоматизация заказа в пиццерии
Был создан тестовый проект — веб-сайт пиццерии. Задача для Browser Act состояла из нескольких шагов:
- Просмотр меню: Агент открыл страницу, изучил товары и прислал их список в чат.
- Авторизация: Вошёл в аккаунт с предоставленными логином и паролем.
- Добавление в корзину: По команде добавил в корзину три позиции: ролл "Микаса", "Тархун" и торт "Медовик".
- Оформление заказа: Заполнил форму заказа (имя, телефон, адрес) и завершил оформление.
Результат:
Заказ был успешно создан в системе за 1 минуту 57 секунд. Агент корректно выполнил навигацию по нескольким страницам, клики, заполнение форм и авторизацию.
Возможности и варианты использования
Browser Act открывает широкие возможности для автоматизации, ограниченные только фантазией пользователя:
- Тестирование интерфейсов: Автоматический клик по элементам и сбор ошибок для отладки.
- Автоматизация рутинных действий:
- Отклики на вакансии на сайтах по поиску работы.
- Сбор данных с различных ресурсов.
- Ответы на комментарии или письма.
- Взаимодействие с веб-приложениями: Заполнение форм, отправка данных, навигация по сложным интерфейсам.
Выводы
- Browser Act — это мощный инструмент, который выходит за рамки простого парсинга данных, превращаясь в полноценного браузерного агента.
- Он способен выполнять комплексные задачи, имитируя действия реального пользователя, включая работу с авторизацией.
- Инструмент бесплатен для использования (тратятся только токены выбранной AI-среды).
- Ключевое преимущество — способность не только собирать информацию, но и активно взаимодействовать с веб-страницами: кликать, заполнять формы и отправлять данные.