DeepSeek готовит новую ИИ-модель V4 с контекстом до 1 млн токенов

Компания DeepSeek готовит к выпуску новую мультимодальную модель искусственного интеллекта DeepSeek-V4. По данным источников, релиз ожидается в апреле 2026 года.

Разработка велась последние полгода под руководством сооснователя компании Лян Вэньфэна. Команда сосредоточилась на улучшении работы модели с визуальным контентом, развитии ИИ-поиска и повышении качества генерации программного кода. Для решения этих задач DeepSeek также сотрудничала с Baidu.

Ожидается, что DeepSeek-V4 получит контекстное окно до 1 млн токенов и сможет работать с мультимодальными данными — текстом, изображениями и видео. По предварительным данным, модель может включать десятки триллионов параметров.

Интерес к будущей модели усилился после появления на платформе OpenRouter двух алгоритмов — Healer Alpha и Hunter Alpha. Первая модель ориентирована на мультимодальные задачи и обработку визуальной информации, а вторая предназначена для агентных систем и долгосрочного планирования. Однако их характеристики не полностью совпадают с параметрами, которые ожидаются у DeepSeek-V4.

Одним из ключевых направлений развития новой модели станет улучшение долгосрочной памяти. Исследования команды DeepSeek показывают, что новые архитектурные решения, включая так называемую «условную память», могут повысить эффективность работы моделей при обработке больших объёмов данных.

Также сообщается, что DeepSeek-V4 будет оптимизирована для китайских ИИ-ускорителей и может стать одной из первых крупных моделей, полностью работающих в национальной вычислительной инфраструктуре Китая.

Апрель может стать насыщенным месяцем для китайского рынка искусственного интеллекта. Помимо DeepSeek-V4 ожидается запуск новой модели Tencent с примерно 30 млрд параметров.