DeepSeek ускорил модели на 85% — без новых чипов

DeepSeek выпустила DSpark — MIT-фреймворк для ускорения ИИ: скорость ответа растёт на 60–85%, пропускная способность в тестах — до 661%. Стратегический ответ на американские ограничения экспорта чипов.

2 min readEAEvgenii ArsentevEvgenii Arsentev · PhD

DeepSeek выпустила DSpark — открытый фреймворк под лицензией MIT для ускорения вывода (inference) ИИ-моделей. Принцип работы: маленькая вспомогательная модель предлагает варианты ответа пачками, большая — проверяет их все разом вместо обработки слов по одному. Дополнительно система генерирует небольшие группы токенов и корректирует нагрузку в зависимости от уверенности в ответах.

Результаты тестов: скорость ответа для конечного пользователя растёт на 60–85%, а суммарная пропускная способность (количество запросов в единицу времени) в тестах на моделях Gemma от Google и Qwen от Alibaba прибавила до 661%. DSpark уже доступен на GitHub и Hugging Face.

США ужесточают экспортный контроль над передовыми чипами, пытаясь ограничить вычислительные мощности Китая в ИИ. DSpark меняет уравнение: каждый процент эффективности сокращает зависимость от американского оборудования. Технологический разрыв сужается не за счёт новых чипов, а за счёт умного кода — и это доступно любой стране с ограниченным доступом к топовым GPU.

#ai#deepseek#inference#china

Related guides

EAEvgenii Arsentev

Author

Evgenii Arsentev

PhD · Chief Product Officer at a tech company

Want to actually build this?

Guides explain. The free course transforms — personalized, gamified, and built to get you shipping fast.

◉ Start the free course

Source: the-decoder.com