adblock check

Мощную и бесплатную LLM-нейросеть от Google можно встроить локально в браузер — Gemma Gem

Пока что у данного расширения не такой уж большой набор навыков, но разработчики, вероятно, расширят спектр возможностей системы в будущих апдейтах

Несколько дней назад, 2 апреля, компания Google представила миру своё новое семейство открытых моделей Gemma 4. Данная разработка распространяется под коммерческой лицензией Apache 2.0, предоставляя пользователям возможность совершенно свободно создавать и развёртывать ИИ-приложения буквально в любой среде, включая локальную. Этой возможностью решили воспользоваться разработчики под никами kessler и Ash — они представили расширение для Chrome под названием gemma-gem, которое позволяет встроить младшие версии модели Gemma 4 непосредственно в браузер для работы в локальном режиме.

Изображения: kessler, Ash, GitHub

Для того, чтобы воспользоваться этим расширением, необходимо иметь браузер Chrome с поддержкой WebGPU (современный стандарт, открывающий браузеру доступ к вычислительным мощностям графической подсистемы компьютера).

«Gemma Gem использует модель Google Gemma 4, работающую на устройстве посредством WebGPU — без ключей API, без облака, без передачи данных с вашего компьютера куда-либо», — написали разработчики на официальной странице расширения на GitHub.

Также стоит учитывать, что для использования модели Effective 2B (E2B) необходимо около 500 МБ свободного пространства на диске, а для чуть более крупной Effective 4B (E4B) требуется около 1,5 ГБ памяти ( данные кэшируются после первого запуска). При этом стоит сказать, что старшие версии Gemma 4, 6B Mixture of Experts и 31B Dense, данное расширение не поддерживает. Вероятно, это напрямую связано с тем, что для столь крупных моделей нужно очень много памяти — большинство систем с такой нагрузкой просто не справятся. Впрочем, базовых версий модели достаточно для выполнения множества различных задач, которые будут весьма полезны энтузиастам и не только.

Например, встроенная в браузер модель способна читать текстовый и HTML-контент страницы, либо же определять селекторы CSS. Также модель умеет сохранять скриншот видимой страницы в формате PNG, кликать по элементу на странице по CSS-селектору, вводить необходимый текст в поле ввода посредством CSS-селектора, прокручивать страницу вверх и вниз, а также выполнять задачи с JavaScript в контексте страницы с полным доступом к DOM. Взаимодействие с моделью происходит в отдельном окне браузера в диалоговом режиме, при этом есть полноценный журнал событий, где можно посмотреть загрузку модели, количество потраченных токенов и многое другое.

Источник

ИИ ИИ
16K участников
Вступить
Комментариев пока нет
Оставьте комментарий...
Оставьте комментарий...