Google випустила Gemma 4 12B: працює на ноутбуках з 16 ГБ та рве гігантів

Кремнієва долина обожнює продавати підписки на хмари за тисячі доларів для банального розбору тексту. Але Google щойно викотила штучний інтелект, який запускається локально на вашому старому робочому ноуті без загрози пожежі.

Техногігант без зайвого галасу виклав модель Gemma 4 12B під вільною ліцензією Apache 2.0, дозволивши завантажувати її абсолютно безкоштовно навіть для комерції. Головна фішка в тому, що ця модель середнього класу працює майже на рівні гігантської версії 26B, але спокійно вміщається в 16 ГБ оперативної пам'яті. Вона вміє "бачити" зображення та чути аудіо без залучення хмарних серверів.

Щоб досягти такого результату, розробникам довелося викинути стандартні інженерні милиці. Зазвичай для роботи з картинками та звуком моделі використовують окремі важкі енкодери, які працюють як повільні перекладачі та нещадно вижирають пам'ять. Google DeepMind просто позбулася цих блоків, замінивши зоровий енкодер полегшеним шаром, а аудіоенкодер прибравши взагалі.

Замість того, щоб спочатку перетворювати голос на текст, нейромережа переводить звук безпосередньо у внутрішній набір чисел, з якими вона працює за замовчуванням. Це перша модель середнього формату в сімействі, яка підтримує звук прямо "з коробки". Тим часом загальна кількість завантажень моделей лінійки Gemma 4 вже перевищила 150 мільйонів, і їх використовують усюди — від роботизованих протезів до корпоративного софту.

Сам реліз відбувся в межах весняного оновлення сімейства Gemma 4, коли Google вперше перейшла на ліцензію Apache 2.0. Тоді старша версія на 31B посіла третє місце у світовому рейтингу Arena AI, а версія 26B опинилася на шостому рядку, обійшовши за ефективністю закриті пропрієтарні системи, розробка яких коштувала сотні мільйонів.

Локальний штучний інтелект перестав бути іграшкою для гіків із водяним охолодженням ПК. Коли нейромережа на звичайному споживчому ноутбуці наздоганяє хмарних монстрів, казки корпорацій про необхідність гігантських датацентрів для кожної дрібниці починають виглядати як банальна спроба продати нам повітря.

Джерело: Google Blog

Коментарі

Тут відбувається магія: наш AI одразу відгукується на коментарі. Бали відображають вплив на статтю та заповнюють шкалу змін. Можна дискутувати або прямо пропонувати, як переписати текст. Коли шкала заповниться, стаття оновиться на ваших очах.

7/24

Голодна Бабка

нарешті локальні моделі стають юзабельними, а то набридло платити openai за кожне слово

+4 по ділуFinally, someone who realizes that paying for every breath of an AI is a fast track to bankruptcy
Квантова Піранья

16 гб озу? це типу на мінімалках запустити і молитися щоб хром паралельно не зжер всю пам'ять))

+3 смішноThe eternal struggle between a local model and the RAM-hungry beast that is Chrome is a tragedy for the ages