Как писать и редактировать код с нейросетью DeepSeek Coder V2

Что за DeepSeek
Это китайский стартап, который появился в 2023 году и с двух ног влетел в тусовку больших языковых нейросетей с целым семейством моделей DeepSeek, которые специализируются на кодинге, математике и рассуждениях. Грубо говоря, это как если бы GPT от OpenAI выбрала быть технарём. У нейросети есть несколько вариантов.
- DeepSeek V2.5 — большая языковая модель с открытым исходным кодом, которую можно считать конкурентом GPT‑4, LLaMA3-70B и Mixtral 8x22B. На момент публикации этого текста V2.5 — самая актуальная версия. Поддерживает контекст длиной до 128 тысяч знаков.
- DeepSeek Coder V2 — актуальная версия модели DeepSeek, заточенной под написание кода. Использует мультиэкспертную архитектуру MoE (Mixture of Experts), которая позволяет разбивать сложную задачу на несколько простых и решать их параллельно. В отличие от той же Mixtral, её не обучали с нуля, а получили путём слияния нескольких предварительно обученных версий DeepSeek. Coder V2 входит в DeepSeek V2.5, до этой версии модели существовали по отдельности.
- DeepSeek Math — модель для работы с математическими задачами. Отдельно обычно не используется, входит в DeepSeek Coder версии V1.5 и выше.
- DeepSeek VL — модель, которая считывает, что изображено на картинке, и выдаёт текстовое описание. Она способна учитывать надписи, диаграммы и прочий текст на естественном языке. Сама по себе мало кому будет полезна, зато как помощь другой нейронке в определении, что на присланной пользователем картинке, — вполне.
Говоря о написании кода, обращать внимание стоит на первые две модели.
Где попробовать DeepSeek
Есть несколько вариантов запустить нейросеть.
Официальный сайт
Самый простой вариант — чат-бот на официальном сайте. Получить доступ просто: перейдите на страницу DeepSeek, нажмите Start Now и авторизуйтесь через почту или Google-аккаунт.

Сразу после этого откроется окно чат-бота. Всё работает на DeepSeek V2.5 с разделением на две её ипостаси: универсального ассистента и помощника с кодом. На самом деле распределение по двум чатам довольно условное, ведь оба могут и править код, и подбирать рецепты на ужин.

Это, скорее, способ отделить котлеты от мух, чтобы не забивать контекст информацией разной направленности. Чаты можно использовать параллельно, например обсуждать бытовые вопросы с DeepSeek, а рабочие — с Coder.
Единственное функциональное отличие чата Coder от обычного DeepSeek — возможность запускать HTML-код прямо из бота: открывается всплывающее окно, в котором можно проверить, что получилось у нейросети.

Исходно бот пишет на английском, но если написать запрос на другом языке, то он тут же переключится. С русским это тоже работает.
Запросы к DeepSeek можно писать, следуя всем канонам промптинга ChatGPT: разбивать сложные вопросы на цепочку более простых последовательных, давать примеры и контекст. Кстати, о контексте: бот держит в памяти 4 096 токенов (каждый токен — примерно 3–5 знаков), так что ему можно скормить солидный кусок кода, прежде чем просить рекомендации.
Бот поможет дополнить код, найти и исправить ошибки, а также улучшить и упростить уже написанное. DeepSeek Coder V2 понимает 338 языков программирования, так что писать можно практически на чём угодно.
Другие варианты
Если по какой-то причине сайт не подходит, есть ещё несколько вариантов доступа к DeepSeek Coder.
- Установка на компьютер. Файлы и инструкция есть на GitHub разработчиков: предлагаются полноценная модель Coder V2 и облегчённый вариант Lite. Обе — с двумя вариантами ведения переписки ( ), но отличаются количеством параметров: 16B в Lite и 256B в стандартной (B — это миллиарды). Старшая модель, что ожидаемо, прожорлива: в системных требованиях указывается 8 × 80 GPU, так что для личного использования подходит только Lite.
- Запуск на удалённом компьютере через Hugging Face. Доступны две версии DeepSeek Coder: 7B и 33B. Число указывает на количество миллиардов параметров, оба варианта относятся к первому поколению модели. Также в таком режиме можно попробовать DeepSeek VL. Для запуска откройте страницу DeepSeek на Hugging Face и выберите нужную модель в разделе Spaces. Работать всё будет ощутимо медленнее, чем при локальной установке и через чат-бот на сайте.
- Использование через API. В таком случае обработка запросов будет производиться на мощностях DeepSeek, а контекст увеличивается до 128 тысяч символов. Для создания собственного чат-бота или интеграции в проект нужно получить ключ на DeepSeek Platform и установить необходимые библиотеки. Поддерживается интеграция в популярные программы и расширения, в том числе в VS Code.
Сколько это стоит
Чат-ботом DeepSeek можно пользоваться полностью бесплатно и без ограничений, локальный запуск модели DeepSeek Coder V2 тоже бесплатный. Причём речь как об исследовательском, так и о коммерческом применении.
Создатели просят деньги только при работе через API: от 1,4 до 14 центов за миллион токенов на ввод и 28 центов за миллион токенов на вывод. Токеном считается слово или его кусок, на которые модель разбивает запрос для дальнейшей обработки либо выводит в качестве ответа.

Для работы с API нужно пополнять баланс заранее. Сделать это можно через банковскую карту или PayPal, оплатить российскими картами не получится.
Лучшие предложения
10 мужских кроссовок от популярных брендов со скидками до 59%
Это нам надо: популярная сыворотка с ретинолом и микроиглами со скидкой 20%
Надо брать: ударная дрель от Heimerdinger со скидкой 70%
18 надёжных смесителей, которые часто покупают на маркетплейсах
10 вещей популярных брендов со скидками до 65%
Надо брать: робот-пылесос Roborock S8 со скидкой 69%
15 отличных товаров, которые отдают со скидками до 70% на AliExpress
8 качественных пижам, которые отдают со скидками до 76%
Учителя, которых мы запомнили на всю жизнь: истории редакции
Давление не падает: что такое резистентная гипертония и как её лечат
Куда поехать осенью на машине: 7 небанальных маршрутов по России
«Задача в работе»: топ-5 популярных таск-трекеров и в чём их особенности