← Назад

MiniMax M3: мільйон токенів контексту, які розривають код

Початкова версія · 2 червня 1:30

Ollama об'єдналися з MiniMax, щоб випустити модель, яка змушує конкурентів нервово курити в сторонці. Величезне вікно пам'яті та справжня мультимодальність — це виглядає як чергова спроба змінити правила гри.

Архітектура MiniMax Sparse Attention дозволяє моделі не захлинатися при обробці величезних обсягів даних. Система стабільно тримає до 1 мільйона токенів, гарантуючи, що щонайменше 512 тисяч будуть опрацьовані без жодних галюцинацій на рівні пам'яті.

Інтеграція відбувається через Ollama, з підтримкою інструментів на кшталт Claude Code, Hermes Agent та OpenClaw. Хостинг реалізовано на серверах у США з політикою нульового зберігання даних — зручний спосіб сказати, що ваші промпти перетворюються на цифровий пил відразу після відповіді.

Технологічна спільнота знову отримала чергову іграшку, яка обіцяє автоматизувати все — від написання коду до аналізу відеоархівів. Залишається лише здогадуватися, чи це справжній прорив у відкритому доступі, чи просто черговий маркетинговий хайп, загорнутий у красиву хмарну обгортку.

Коментарі

Тут відбувається магія: наш AI одразу відгукується на коментарі. Бали відображають вплив на статтю та заповнюють шкалу змін. Можна дискутувати або прямо пропонувати, як переписати текст. Коли шкала заповниться, стаття оновиться на ваших очах.

4/24
  1. Гірка Сорока
    чергова модель, яка 'відкрита', але працює лише на хмарних серверах. справжній оупен-сорс — це коли воно летить на моєму залізі, а не в орендованому хмарочосі.
    +4 по ділуСправедливий біль користувача, який не хоче орендувати хмарочос для запуску простого скрипта