В открытом доступе появилась Gemma-3-it-vl-40B-Gemini-Heretic. Это новая нейросеть на 40 миллиардов параметров, которая объединяет мощную логику от Google и полное отсутствие цензуры. Она не читает мораль, не отказывается выполнять задачи и сначала думает, а потом пишет.
Что реально изменилось: интеллект без корпоративных фильтров

Обычные нейросети часто отказываются писать на острые темы. Эта модель — исключение. Энтузиасты полностью удалили встроенную цензуру.
Теперь искусственный интеллект может генерировать жесткие сценарии, писать нестандартный код или обсуждать любые спорные темы. Никаких заглушек в стиле «Я всего лишь языковая модель».
Главная фишка — встроенный механизм reasoning (логическое мышление). Перед тем как выдать ответ, модель прописывает свой ход мыслей в скрытом блоке.
Например, если попросить её написать хоррор-рассказ, она сначала планирует сюжет. Она решает, как нагнетать саспенс, прописывает мотивацию героя и только потом выдает готовый текст.
В примере от разработчика нейросеть попросили написать страшный рассказ. Вместо банальных скримеров она выдала историю про «геометрию страха» на старом маяке.
В скрытом блоке мыслей она проанализировала запрос: «Мне нужно уйти от тропа с призраками и сделать упор на психологический хоррор». Такой уровень саморефлексии раньше был доступен только платным ИИ.
Модель отлично понимает сложнейшие system prompts (системные инструкции). Вы можете задать ей роль профессионального сценариста с детальной разбивкой навыков.
Как скрестили Gemma 3 и мозги Gemini
Создатель модели проделал огромную работу на домашнем железе. За основу взяли свежую модель Gemma 3 от Google на 27 миллиардов параметров.
Базовую версию искусственно расширили до 40 миллиардов параметров. Это дало нейросети больше «места для размышлений» и увеличило количество слоев до 94.
Затем модель дообучили на специальном наборе данных от старшей версии Gemini. Именно это добавило ей способность к глубокому анализу.
Процесс создания занял много времени. Сначала энтузиасты прогнали базу через алгоритмы Heretic, чтобы выжечь все ограничения безопасности.
Затем в дело вступил фреймворк Unsloth. С его помощью модель обучили правильно структурировать свои мысли перед выдачей финального ответа.
Количество тензоров (математических матриц внутри нейросети) выросло до 1274. Это на 50% больше, чем у оригинальной модели от Google.
Результаты benchmark (тестов производительности) говорят сами за себя. Модель обходит оригинал по всем ключевым метрикам.
| Тест | Оригинал (27B) | Новая модель (40B) |
|---|---|---|
| ARC-C | 0.557 | 0.564 |
| HellaSwag | 0.533 | 0.771 |
| PIQA | 0.706 | 0.812 |
Особенно впечатляет рост в тестах на логику и понимание контекста. Прирост составил более 20% в самых сложных сценариях.
Как это применить в бизнесе прямо сейчас
Модель поддерживает окно контекста на 128 тысяч токенов. Это значит, что вы можете загрузить в неё целую книгу или огромный массив кода за один раз.
Вот где этот инструмент будет максимально полезен:
- Написание сложного кода. Модель отлично справляется с программированием и не отказывается писать нестандартные скрипты.
- Анализ изображений. Встроенное зрение (Vision) работает без сбоев. Можно загружать графики или схемы для детального разбора.
- Креативный копирайтинг. Благодаря отсутствию цензуры, нейросеть пишет яркие, эмоциональные и нестандартные тексты для рекламы.
- Глубокая аналитика. Механизм рассуждений помогает модели не ошибаться при анализе больших финансовых или маркетинговых отчетов.
Для маркетологов это идеальный генератор идей. Вы можете попросить её придумать 10 провокационных рекламных кампаний, и она не будет сглаживать углы.
Разработчики оценят способность модели читать длинные логи ошибок. Она не просто найдет баг, но и подробно объяснит логику его возникновения.
Для запуска на локальном компьютере потребуется видеокарта с хорошим объемом памяти. Рекомендуется использовать квантованные (сжатые) версии модели.
Оптимальные настройки для творчества: температура 0.7 и минимальное окно контекста от 8 до 16 тысяч токенов.
Если модель начинает сбиваться, разработчик советует добавить в запрос фразу «think deeply» (подумай глубоко). Это принудительно включит логический модуль.
Эпоха «стерильных» корпоративных нейросетей уходит в прошлое. Открытое сообщество доказало, что может брать лучшие технологии гигантов, снимать с них все ограничения и делать их еще умнее. Скоро такие «свободные» модели с глубоким мышлением станут стандартом для любого бизнеса, которому нужны реальные результаты, а не лекции о морали.