Китайский стартап DeepSeek утверждает, что его онлайн-сервисы принесли теоретическую прибыль в 545% за сутки работы благодаря техническим оптимизациям. Компания сообщила о высокой загрузке вычислительных узлов и значительных объемах обработанных данных, но уточнила, что фактические доходы, вероятно, ниже из-за скидок и бесплатных сервисов. Впрочем, DeepSeek делает ставку на технологическое развитие, а не на монетизацию.
Компания сообщила о средней загрузке узлов в 226,75 для своих моделей V3 и R1 в период с полудня 27 февраля. Один узел состоит из восьми графических процессоров Nvidia H800, каждый по цене $2 за час аренды. Таким образом, общие эксплуатационные расходы составили $87 072. За этот период модели обработали 608 млрд входных и 168 млрд выходных токенов. Исходя из ценовой политики R1, потенциальный доход составил бы $562 027, что соответствует теоретическому показателю прибыли в 545%.
Узлы — это вычислительные единицы, выполняющие задачи, а их загрузка показывает, насколько эффективно они используются при обработке запросов. Токен — это базовая единица данных, которую обрабатывает алгоритм. DeepSeek рассчитывает стоимость использования моделей по количеству входных и выходных токенов.
В компании пояснили, что это теоретические цифры, а фактические доходы ниже из-за скидок и бесплатных сервисов. API-сервисы компании значительно дешевле конкурентов. Модель V3 стоит от $0,07 до $1,10 за миллион токенов, модель R1 — вдвое дороже. С 27 февраля действуют ночные скидки до 75%.
Впечатляющая рентабельность обусловлена техническими улучшениями. Компания заявила, что их системный дизайн нацелен на повышение пропускной способности и снижение задержки. Сохраняя сдержанность в общении со СМИ, DeepSeek активно взаимодействует с разработчиками, предоставляя открытый доступ к своим проектам на GitHub. Компания делится подробной информацией о методах оптимизации, охватывающих вычисления, коммуникации и хранение данных. Китайский стартап отдает приоритет техническому развитию и не спешит монетизировать свои инновации.
DeepSeek признаёт, что её фактический доход значительно ниже по ряду причин, включая ночные скидки, более низкие цены на V3 и частичную монетизацию, поскольку доступ к сайту и приложению остаётся бесплатным. Однако взимание денег за эти услуги, вероятно, привело бы снижению популярности сервисов. Также в отчёте DeepSeek не учтены расходы на электроэнергию, аренду центров обработки данных, исследования и разработки.
Компания объяснила высокую эффективность своих сервисов оптимизацией задач. Трафик распределяется между несколькими дата-центрами максимально равномерно, время обработки запроса пользователя гибко регулируется, данные группируются партиями для оптимальной нагрузки на инфраструктуру. Расчёты DeepSeek кажутся весьма спекулятивными, отмечают в TechCrunch. По мнению автора издания, публикация данных о доходности представляет собой прогноз потенциальной будущей прибыли, чем реальной картиной реальных доходов DeepSeek сегодня.
Китайская компания оказалась в центре внимания после релиза модели R1 в январе этого года. DeepSeek серьёзно повлияла на американские технологические компании, которые потеряли более $1 трлн за сутки. Поводом для этого стало то, что компания потратила на обучение своих моделей менее $6 млн, когда американские разработчики расходовали на это значительно больше средств.
