Авторский блог Елена Ларина Владимир Овчинский 00:04 2 февраля 2025

Мировой переворот в развитии ИИ?

появление DeepSeek как военно – технологическая атака Китая?

Появление бюджетного китайского чат-бота DeepSeek, который составил конкуренцию ChatGPT, является тревожным сигналом для США. Это тревожный сигнал для американских технологических гигантов. Это тревожный сигнал для Уолл-стрит. Это тревожный сигнал для любой развитой страны, стремящейся вступить в гонку ИИ.

Эксперты журнала «Экономист» в статье «Истинный смысл драмы DeepSeek» (29.01.2025) пишут:

27 января, когда инвесторы поняли, насколько хороши модели DeepSeek «v3» и « R 1», они уничтожили около триллиона долларов рыночной капитализации американских технологических компаний, котирующихся на бирже.

Стоимость Nvidia, производителя микросхем и главного продавца лопат в золотой лихорадке искусственного интеллекта (ИИ), упала на 600 миллиардов долларов.

Модели DeepSeek практически так же хороши, как и модели Google и Open AI, и были произведены за малую часть стоимости. Из-за запрета американского экспортного контроля использовать передовые чипы китайская фирма предприняла попытку повышения эффективности, даже перепрограммировав чипы, которые она использовала для обучения модели, чтобы выжать из них максимум энергии. Стоимость создания модели ИИ, которая может конкурировать с лучшими, резко упала. В течение нескольких дней чат-бот DeepSeek стал самым скачиваемым приложением на iPhone.

Контраст с подходом Америки не может быть более разительным. Сэм Альтман, глава Open AI, потратил годы, говоря инвесторам — и новому президенту Америки — что для того, чтобы оставаться на передовой ИИ, нужны огромные суммы денег и вычислительная мощность. Соответственно, инвесторы делали ставку на то, что горстка фирм будет получать огромную монопольную ренту. Однако если быстрые последователи, такие как DeepSeek, смогут поглотить это лидерство за малую часть стоимости, то эти прибыли окажутся под угрозой.

Nvidia стала самой дорогой листингуемой компанией в мире благодаря широко распространенному мнению, что создание лучшего ИИ требует огромных денег за лучшие чипы (по которым, как сообщается, ее рентабельность превышает 90%). Неудивительно, что успех DeepSeek привел к разгрому на фондовом рынке для производителя чипов 27 января.

Другие компании в сфере центров обработки данных также зализывают свои раны, от Siemens Energy (которая должна была построить турбины для питания надстройки) до Cameco (которая должна была предоставить уран для реакторов, вращающих турбины). Если бы Open AI была листингована, ее акции наверняка бы тоже упали.

Китайский DeepSeek как советский Спутник

«Гардиан» в статье «Запад уже проигрывает гонку вооружений в сфере ИИ» (30.01.2025) сравнивают ситуацию с моментом «Спутника»:

«В 1957 году США были ошеломлены, когда Советский Союз стал первой страной, запустившей искусственный спутник. Они были в равной степени ошеломлены появлением DeepSeek.

Все это правда, даже если окажется, что DeepSeek не такой уж и крутой. Если это правда, то китайцы создали высококачественный продукт ИИ, который доступен бесплатно и по крошечной цене.

Конечно, есть те, кто сомневается, что китайский стартап сможет достичь скромными средствами того, на что американские технологические компании были вынуждены потратить миллиарды долларов. Их сомнения могут оказаться верными, но это не влияет на общую картину: угроза Китая западному технологическому доминированию реальна.

Погоня за победой в гонке ИИ будет столь же конкурентной — а может быть, даже более — чем в космической гонке 1950-х и 60-х годов».

В первые дни своего быстрого экономического развития Китай рассматривался как место, где американские и европейские компании могли бы передавать производство на аутсорсинг. Рабочая сила была дешевой, а перемещение производства за границу обещало более высокую прибыль. Идея заключалась в том, что все действительно передовые вещи — проектирование продукции, исследования и разработки — будут делаться на Западе. Только сборочные работы будут проводиться в Гуандуне. А творчество, необходимое для создания новых идей и новых продуктов, будет подавлено марксистско-ленинской системой Китая.

Это оказалось слишком самоуспокоенным взглядом. В 2023 году Китай подал больше патентов, чем весь остальной мир вместе взятый. Китайские университеты выпускают в среднем более 6000 докторов наук в области естественных наук, технологий, инженерии и математики в месяц — более чем вдвое больше, чем в США. Как показывает DeepSeek, в Китае растет число очень ярких людей, вполне способных мыслить нестандартно, когда им это позволяют, как это, безусловно, было в случае с разработкой ИИ, литий-ионных аккумуляторов и электромобилей.

США осознают угрозу своей гегемонии, и решимость обуздать экономическую мощь Китая является двухпартийным вопросом в Вашингтоне. Тарифы на китайский импорт в США, введенные Трампом в его первый срок, были сохранены и увеличены Джо Байденом, когда он стал президентом. За неделю до ухода с должности Байден ввел новые ограничения на экспорт компьютерных чипов, разработанных в США, чтобы помешать таким странам, как Китай, получить доступ к передовым технологиям.

В некоторых секторах это может быть слишком поздно. Китай уже является крупнейшим экспортером электромобилей, что вызвало введение защитных пошлин со стороны США и ЕС. Литий-ионные аккумуляторы, производимые китайскими заводами, стоят одну седьмую за кВт·ч от того, что они стоили 10 лет назад. Для США и других западных стран не должно было стать сюрпризом то, что глобальное разделение труда, при котором они выполняли всю низкозатратную черновую работу, будет иметь лишь ограниченную привлекательность для китайцев. Вместо этого Китай предпринял согласованную попытку продолжить производство обуви, игрушек и телевизоров, одновременно перемещаясь в более высокотехнологичные секторы.

Стратегия может иметь свои ограничения. «Существует аргумент, - пишет «Гардиан», - что экономическая модель Китая в конечном итоге станет несовместимой с его политической моделью, и что требования демократии заставят Коммунистическую партию стать менее репрессивной. Китай также не полностью свободен от экономических проблем.

Тем не менее, очевидно, что битва за превосходство ИИ накаляется. Трамп считает, что некоторая конкуренция со стороны Китая не является чем-то плохим для технологического сектора США, и он прав. Стоимость акций технологических компаний на Уолл-стрит резко упала после новостей о DeepSeek, поскольку они поставили под сомнение целесообразность масштабных инвестиций в американские компании».

Пентагон пытается «делать хорошую мину при плохой игре»

Пентагоновский сайт «Дефенс Ван» в статье «Как DeepSeek изменил будущее ИИ и что это значит для национальной безопасности» (29.01.2025) старается ситуацию проигрыша представить как в виде крупного выигрыша:

«Прорыв Китая — это возможность для американских компаний создавать более эффективные инструменты. Это также поможет американским военным».

При этом в статье отмечается, что «объявление DeepSeek вызвало коллективный вопль Белого дома, Уолл-стрит и Кремниевой долины. В Вашингтоне президент Трамп назвал это «пробуждением для наших отраслей, что нам нужно быть максимально сосредоточенными на конкуренции» с Китаем. Пресс-секретарь Белого дома Каролин Ливитт заявила, что Совет национальной безопасности в настоящее время рассматривает приложение. ВМС уже запретили его. На Уолл-стрит акции производителя чипов Nvidia упали. OpenAI, ближайший конкурент DeepSeek в США, кричит о нечестной игре и утверждает, что приложение по сути является их собственной моделью».

«Почему DeepSeek так важен? Во-первых, он гораздо более открыт, чем другие модели. Но определяющая техническая инновация заключается в способности модели извлекать расширенные возможности рассуждений из массивных моделей в меньшие, более эффективные аналоги. Одна модель DeepSeek часто превосходит более крупные альтернативы с открытым исходным кодом, устанавливая новый стандарт (или, по крайней мере, очень публичный) для производительности компактного ИИ.

DeepSeek в значительной степени опирается на обучение с подкреплением для развития навыков рассуждения, обходя контролируемую тонкую настройку, обычно используемую на начальных этапах конкурентами, такими как OpenAI. Этот подход является преднамеренным отклонением от гибридных стратегий обучения, используемых американскими гигантами ИИ».

Оценки экспертов показывают, что модели DeepSeek весьма конкурентоспособны в задачах с интенсивным рассуждением, постоянно достигая высочайшей производительности в таких областях, как математика и кодирование. Однако исследование также выявляет некоторые уязвимости, особенно в задачах без рассуждений и точности фактических запросов, где они не дотягивают до самых передовых предложений OpenAI.

Никто не проводил независимых проверок того, что DeepSeek не использует большие вычислительные ресурсы для достижения своих результатов в тестах (или что он по сути не копирует OpenAI), но контроль США над высокотехнологичными микрочипами ограничит ресурсы, доступные Китаю.

Алекс Ванг, генеральный директор Scale AI, чья компания также оценивает модели ИИ, в интервью Си-эн-би-си описал DeepSeek как сопоставимый с OpenAI. Он также сказал, что Китай получил около 50 000 чипов Nvidia H100, несмотря на экспортный контроль.

Представитель Nvidia не стал напрямую комментировать это заявление. Он сказал «Дефенс Ван»: «DeepSeek — это превосходное достижение ИИ и прекрасный пример масштабирования времени тестирования», метода, который увеличивает вычислительную мощность, когда модель принимает данные для получения нового результата. Дополнительная вычислительная мощность позволяет модели исследовать различные варианты и улучшать свои ответы, тем самым достигая лучших ответов с меньшим обучением (меньше вычислений). Затем модель может более эффективно сосредоточить свою вычислительную энергию. Это своего рода упражнение: сначала тренировка истощает энергию, но в долгосрочной перспективе она помогает организму наращивать способность хранить и более эффективно использовать энергию».

«Работа DeepSeek иллюстрирует, как можно создавать новые модели с помощью этой техники, используя широкодоступные модели и вычисления, которые полностью соответствуют экспортному контролю. Для вывода требуется значительное количество графических процессоров NVIDIA и высокопроизводительные сети. Теперь у нас есть три закона масштабирования: предварительное обучение и последующее обучение, которые продолжаются, и новое масштабирование во время тестирования», — сказал представитель Nvidia.

Развитие представляет собой фундаментальный сдвиг в обсуждении того, как построить доминирование ИИ. В то время как такие компании, как OpenAI, достигли своих результатов на основе огромных наборов данных, очень больших моделей и постоянно растущих компьютерных ресурсов, следующая фаза ИИ, вероятно, приведет к появлению меньших моделей, которым потребуется меньше вычислительных ресурсов».

«Это может сулить плохие новости для крупных корпоративных поставщиков облачных услуг, включая многих технологических гигантов, лидеры которых присутствовали на инаугурации Трампа. Многие компании рассчитывали на огромный спрос на ресурсоемкие продукты генеративного ИИ и выдавливали альтернативные подходы.

Но изменение в обсуждении того, как создавать ИИ, может быть хорошей новостью для войск, которые хотят задействовать самые надежные инструменты в местах, где мощность и подключение к крупным облачным ресурсам неоднородны. И это также может быть полезно для Министерства обороны США, которому поручено захватить лучшие возможности ИИ, одновременно контролируя расходы».

Новое, меньшее будущее искусственного интеллекта

Исследователи в области искусственного интеллекта, пытавшиеся проложить совершенно иной путь, нежели OpenAI и крупные поставщики корпоративных облачных услуг, не были удивлены прорывом DeepSeek.

Специалист по данным Дрю Бреуниг сказал «Дефенс Ван»: «Если и есть урок из триумфа DeepSeek, то он таков: будьте осторожны, когда путь к прогрессу — это просто тратить больше денег. Этот путь не способствует инновациям, и ваши более слабые конкуренты будут вынуждены проявлять креативность, работать в рамках своих ограничений, и в конечном итоге... они победят. Расходы — это не инновации».

В недавнем сообщении в блоге он описал, как синтетические данные могут сократить объем необработанных данных — и вычислительной мощности — необходимых для создания высокопроизводительных моделей. «Эта тактика приносит пользу небольшим моделям с той же скоростью, что и большим», — сказал он.

Пит Уорден, генеральный директор стартапа ИИ Useful Sensors, сказал: «DeepSeek демонстрирует, что трата все больших и больших денег на все более крупные модели — это не единственный подход к улучшению ИИ. TinyML основан на идее, что, используя меньшие модели, которые дешевле обучать, мы можем создавать приложения, которые оказывают большое влияние, несмотря на их размер».

Однако исследователь ИИ из Стэнфорда Ритвик Гупта, который вместе с несколькими коллегами написал одну из основополагающих статей о создании небольших моделей ИИ, дающих большие результаты, предостерегает, что большая часть шумихи вокруг DeepSeek свидетельствует о неправильном понимании того, что это такое, а именно, что он описал как «все еще большую модель» с 671 миллиардом параметров.

«Однако весьма примечательно, что команда DeepSeek-R1 предлагает собственные «дистиллированные» версии своих моделей», — сказал Гупта. «DeepSeek взяла уменьшенные версии Llama и Qwen с параметрами от 1,5 до 70 миллиардов и обучила их на выходах DeepSeek-R1. Это позволяет модели, похожей на R1, работать на меньших устройствах, таких как ноутбуки или телефоны».

Результаты работы DeepSeek — в той мере, в какой они показывают, что это возможно — предоставят Министерству обороны США больше рычагов воздействия в его переговорах с промышленностью и позволят министерству найти больше конкурентов.

«Я не удивлюсь, если Министерство обороны примет американские копии DeepSeek и Qwen с открытым исходным кодом», — сказал Гупта. «У Министерства обороны всегда была тяга просить специальные локальные версии облачных сервисов. Я не удивлюсь, если они попросят то же самое у OpenAI и Claude».

Хайди Кхлааф, главный научный сотрудник по ИИ в AI Now Institute, сосредоточила свои исследования на безопасности ИИ в системах вооружения и национальной безопасности. Она сказала «Дефенс Ван», что прорыв, если он реален, может открыть использование генеративного ИИ для более мелких игроков, включая потенциально небольших производителей. Но такие модели никогда не будут пригодны для боя, сказала она, несмотря на стремление использовать их в таких контекстах.

«В целом, LLM или фундаментальные модели не подходят для задач, критически важных для безопасности, учитывая, насколько они подвержены ошибкам в приложениях, требующих надежности и точности. Однако размер и возможности DeepSeek открывают возможность использования фундаментальных моделей для более мелких субъектов, которые ранее могли не иметь доступа, и это может включать производителей автомобилей, которые могут быть заинтересованы в использовании фундаментальных моделей некритическим для безопасности образом», — сказал Кхлааф.

Эндрю Реддинг, возглавляющий направления технологий и кибербезопасности в Центре безопасности в политике при Университете Беркли, рассказал «Дефенс Ван»: «Результаты работы DeepSeek совершенно неудивительны для тех из нас, кто следит за тем, как исследователи ИИ разрабатывают модели с уменьшающимся объемом вычислений».

По его словам, американские компании должны рассматривать этот прорыв как возможность для внедрения инноваций в другом направлении. «Интересно, что вычислительные проблемы, с которыми сталкиваются китайские исследователи (в свете экспортного контроля США на графические процессоры NVIDIA), не отличаются от тех, с которыми сталкиваются американские ученые, учитывая, что мы все больше ограничены в вычислительных ресурсах по сравнению с игроками в частной промышленности».

Вооруженные силы США уже тратят значительные средства на периферийные возможности, чтобы приблизить вычислительную мощность к возможностям бойцов. Прорыв в производительности меньшей модели предполагает, что эти инвестиции в периферийные вычисления выросли в цене, сказал Реддинг.

«Также есть действительно интересный вопрос относительно использования открытых моделей в противовес закрытым в военном контексте», — сказал он. «Преимущество первых в том, что их легко перемещать внутри правительственных сетей для использования правительственных/военных данных, но есть очевидные риски того, что государства-противники получат в свои руки данные обучения, веса моделей и т.д.».

Но, возможно, самый важный вывод из заявления DeepSeek заключается не в том, что оно означает для конкуренции между США и Китаем, а для отдельных лиц, государственных учреждений и всех, кто скептически относится к растущему влиянию все меньшей группы технологических игроков. Это хорошие новости, если вы хотите создать свой собственный инструмент генеративного ИИ с данными, которые вы контролируете, а не полагаться на инструмент от большой компании, которая может или не может заботиться о ваших интересах.

«Интернет исторически процветал как децентрализованный набор услуг», — сказал Гупта. Если цель состоит в том, чтобы каждый имел свой собственный «персональный ИИ», то необходимо, чтобы небольшие модели работали на персональных устройствах людей. Я ожидаю, что такие компании, как Apple, у которых есть модель, ориентированная на конфиденциальность, продолжат настаивать на офлайновых, отключенных алгоритмах».

Однако Кхлааф предупреждает, что замена обобщенных моделей на крупные несет в себе риски для конфиденциальности отдельных лиц, которые применимы и к военнослужащим, поскольку раскрытие персональных данных влияет на них так же, как и на гражданских лиц, делая их уязвимыми для враждебных нападок, принуждения и т. д.

А широкое раскрытие персональных данных американцев само по себе является национальной уязвимостью, которую противники могут использовать в случае конфликта, как указали военные лидеры. Без всеобъемлющей реформы, которая поможет людям лучше защищать свои собственные данные, распространение надежных небольших моделей, таких как DeepSeek, может ухудшить плохую тенденцию.

«DeepSeek бросает вызов идее о том, что модели большего масштаба всегда более перформативны, что имеет важные последствия, учитывая уязвимости безопасности и конфиденциальности, возникающие при создании моделей ИИ в больших масштабах», — сказал Кхлааф.

Для личной конфиденциальности «методы дистилляции позволяют сжимать более крупные модели в более мелкие, сохраняя при этом многие свойства более крупной модели. Для граждан, у которых были базовые модели, обученные на их данных, все те же проблемы конфиденциальности будут увековечены в дистиллированных моделях DeepSeek — только теперь не под юрисдикцией США. Вот почему мы предупредили, что обучение моделей ИИ на конфиденциальных данных представляет угрозу национальной безопасности».

***

Важен момент появления DeepSeek.

Он взлетел на небосводе технологий как раз тогда, когда Трамп серий ошеломительных указов начал реформировать Америку во второй свой приход на вершину власти.

Назвать случайностью такое совпадение нельзя – слишком выверенная и продуманная акция.

Думается, что лидер Китая этим дал понять своему американскому коллеге, что США просто так, «налегке» обойти Поднебесную не удастся.

И это касается любых вопросов – от ИИ – до космоса и инноваций в сфере вооружений.

1.0x