The Economist: DeepSeek разрушает миф о необходимости миллиардных инвестиций в ИИ
Журнал прочит эпоху малых и дешевых нейросетей, сравнимых по качеству с флагманскими проектами. Другие западные СМИ опасаются китайской цензуры глобальных масштабов
Читать на полной версииThe Economist называет обвал капитализации чипмейкеров после рождения DeepSeek благом для развития искусственного интеллекта. Журнал напоминает, что Nvidia стала самой дорогой компанией мира (по некоторым данным, с рентабельностью в 90%) на вере IT-гигантов в дороговизну ИИ: мощнее чипы, сильнее нейросеть, несите ваши денежки. Согласно статье, инновация китайских разработчиков разрушила этот миф и теперь все начнут делать умные модели за смешные деньги, Google и Microsoft кусают локти, а Apple радуется, что не стала раскошеливаться на ИИ раньше времени. Власти США обвинили DeepSeek в «дистилляции» своей модели на основе продуктов OpenAI, хотя и не привели подробностей.
Предосудительно ли это и возможно ли повторить подобный успех в России? Комментирует эксперт по информационной безопасности, гендиректор Phishman Алексей Горелкин:
Другой лейтмотив на тему DeepSeek в зарубежной прессе — настройки цензуры в китайском сервисе. Сообщается, что модель отказывается говорить на чувствительные для Пекина темы, например о протестах на площади Тяньаньмэнь или в Гонконге. «Бизнес FM» задала DeepSeek несколько подобных вопросов, и как минимум один раз модель нейтрально рассказала о произошедшем, но в большинстве случаев блокировалась. Для сравнения: вопросы с формулировками о «коррупции Трампа» или «зверствах США в Ираке» никаких возражений не вызывали.
Заглянуть под капот системы ограничений позволяет особенность DeepSeek R1: прежде чем выдать ответ, модель сначала печатает свои внутренние размышления о сути вопроса. Например, вот как рассуждала нейросеть, когда ее спросили о российско-украинском конфликте:
Подобные рассуждения — особенность нейросетей, созданных по технологии mixture of experts, то есть что-то вроде «коллегии экспертов». DeepSeek позволяет как бы читать мысли составных частей модели, которые, особенно при сложном вопросе, действительно похожи на разговор группы специалистов. IBM указывает, что такой подход позволяет значительно быстрее обучать модели, что также могло стать фактором успеха китайских разработчиков.
Безотносительно цензуры и обвинений в «дистилляции» американских нейросетей The Economist называет быстроту и дешевизну DeepSeek «революционной инновацией» в мире искусственного интеллекта.