Как писать и редактировать код с нейросетью DeepSeek Coder V2

Что за DeepSeek
Это китайский стартап, который появился в 2023 году и с двух ног влетел в тусовку больших языковых нейросетей с целым семейством моделей DeepSeek, которые специализируются на кодинге, математике и рассуждениях. Грубо говоря, это как если бы GPT от OpenAI выбрала быть технарём. У нейросети есть несколько вариантов.
- DeepSeek V2.5 — большая языковая модель с открытым исходным кодом, которую можно считать конкурентом GPT‑4, LLaMA3-70B и Mixtral 8x22B. На момент публикации этого текста V2.5 — самая актуальная версия. Поддерживает контекст длиной до 128 тысяч знаков.
- DeepSeek Coder V2 — актуальная версия модели DeepSeek, заточенной под написание кода. Использует мультиэкспертную архитектуру MoE (Mixture of Experts), которая позволяет разбивать сложную задачу на несколько простых и решать их параллельно. В отличие от той же Mixtral, её не обучали с нуля, а получили путём слияния нескольких предварительно обученных версий DeepSeek. Coder V2 входит в DeepSeek V2.5, до этой версии модели существовали по отдельности.
- DeepSeek Math — модель для работы с математическими задачами. Отдельно обычно не используется, входит в DeepSeek Coder версии V1.5 и выше.
- DeepSeek VL — модель, которая считывает, что изображено на картинке, и выдаёт текстовое описание. Она способна учитывать надписи, диаграммы и прочий текст на естественном языке. Сама по себе мало кому будет полезна, зато как помощь другой нейронке в определении, что на присланной пользователем картинке, — вполне.
Говоря о написании кода, обращать внимание стоит на первые две модели.
Где попробовать DeepSeek
Есть несколько вариантов запустить нейросеть.
Официальный сайт
Самый простой вариант — чат-бот на официальном сайте. Получить доступ просто: перейдите на страницу DeepSeek, нажмите Start Now и авторизуйтесь через почту или Google-аккаунт.

Сразу после этого откроется окно чат-бота. Всё работает на DeepSeek V2.5 с разделением на две её ипостаси: универсального ассистента и помощника с кодом. На самом деле распределение по двум чатам довольно условное, ведь оба могут и править код, и подбирать рецепты на ужин.

Это, скорее, способ отделить котлеты от мух, чтобы не забивать контекст информацией разной направленности. Чаты можно использовать параллельно, например обсуждать бытовые вопросы с DeepSeek, а рабочие — с Coder.
Единственное функциональное отличие чата Coder от обычного DeepSeek — возможность запускать HTML-код прямо из бота: открывается всплывающее окно, в котором можно проверить, что получилось у нейросети.

Исходно бот пишет на английском, но если написать запрос на другом языке, то он тут же переключится. С русским это тоже работает.
Запросы к DeepSeek можно писать, следуя всем канонам промптинга ChatGPT: разбивать сложные вопросы на цепочку более простых последовательных, давать примеры и контекст. Кстати, о контексте: бот держит в памяти 4 096 токенов (каждый токен — примерно 3–5 знаков), так что ему можно скормить солидный кусок кода, прежде чем просить рекомендации.
Бот поможет дополнить код, найти и исправить ошибки, а также улучшить и упростить уже написанное. DeepSeek Coder V2 понимает 338 языков программирования, так что писать можно практически на чём угодно.
Другие варианты
Если по какой-то причине сайт не подходит, есть ещё несколько вариантов доступа к DeepSeek Coder.
- Установка на компьютер. Файлы и инструкция есть на GitHub разработчиков: предлагаются полноценная модель Coder V2 и облегчённый вариант Lite. Обе — с двумя вариантами ведения переписки (), но отличаются количеством параметров: 16B в Lite и 256B в стандартной (B — это миллиарды). Старшая модель, что ожидаемо, прожорлива: в системных требованиях указывается 8 × 80 GPU, так что для личного использования подходит только Lite.
- Запуск на удалённом компьютере через Hugging Face. Доступны две версии DeepSeek Coder: 7B и 33B. Число указывает на количество миллиардов параметров, оба варианта относятся к первому поколению модели. Также в таком режиме можно попробовать DeepSeek VL. Для запуска откройте страницу DeepSeek на Hugging Face и выберите нужную модель в разделе Spaces. Работать всё будет ощутимо медленнее, чем при локальной установке и через чат-бот на сайте.
- Использование через API. В таком случае обработка запросов будет производиться на мощностях DeepSeek, а контекст увеличивается до 128 тысяч символов. Для создания собственного чат-бота или интеграции в проект нужно получить ключ на DeepSeek Platform и установить необходимые библиотеки. Поддерживается интеграция в популярные программы и расширения, в том числе в VS Code.
Сколько это стоит
Чат-ботом DeepSeek можно пользоваться полностью бесплатно и без ограничений, локальный запуск модели DeepSeek Coder V2 тоже бесплатный. Причём речь как об исследовательском, так и о коммерческом применении.
Создатели просят деньги только при работе через API: от 1,4 до 14 центов за миллион токенов на ввод и 28 центов за миллион токенов на вывод. Токеном считается слово или его кусок, на которые модель разбивает запрос для дальнейшей обработки либо выводит в качестве ответа.

Для работы с API нужно пополнять баланс заранее. Сделать это можно через банковскую карту или PayPal, оплатить российскими картами не получится.















Лучшие предложения
Что подарить девушке на Новый год
Тратим последнее на тот самый Kinder Joy с персонажами из «Очень странных дел»
Берём в подарок 3D-принтер от Creality со скидкой 62%
10 классных наборов от LEGO для детей и взрослых
Непромокаемые зимние ботинки от Golden Camel отдают за полцены
Бытовая техника, которую не стыдно дарить на Новый год
Как работает распродажа на Ozon c точки зрения продавца и покупателя
15 вечерних платьев со скидками до 90%, чтобы сиять как ёлочка
«Восток», «Нева» и «Дон»: 6 удобных автомаршрутов по трём трассам для знакомства с регионами
«А что, так можно было?» 8 способов пересмотреть свои онлайн-привычки
3 вида киберугроз, которые могут серьёзно навредить бизнесу
3 фактора, которые влияют на качество вашего сна