Зміст
Що таке DeepSeek? Хто його створив і як працює нова модель?
DeepSeek – це стартап із китайського міста Ханчжоу, заснований 2023 року командою колишніх інженерів Tencent і вчених із Чжецзянського університету. Їхня флагманська модель ШІ, R1, вразила експертів своєю видатною продуктивністю, незважаючи на те, що її розробили з використанням значно менших ресурсів, порівнюючи з провідними західними моделями, як-от GPT-4 від OpenAI або LLaMA від Meta.
Модель DeepSeek-R1 було створено всього за два місяці при витратах менше 6 мільйонів доларів. На відміну від західних аналогів, які вимагають десятки тисяч високопродуктивних чипів для навчання, R1 навчалася приблизно на 2000 застарілих чипах Nvidia.
Архітектура моделі, за твердженням компанії, використовує більш ефективний підхід до обробки даних і їх оптимізації, що знижує обчислювальні витрати без шкоди для якості.
За словами співзасновника і генерального директора DeepSeek Лі Цзяня, команда зробила ставку на спрощений процес розробки. “ШІ не повинен залежати тільки від того, у кого більше грошей”, – заявив Лі на нещодавній конференції в Шанхаї.
Чому DeepSeek змінює правила гри на ринку ШІ?
Поява DeepSeek кидає виклик усталеній думці, що для розробки високоякісних ШІ потрібно інвестувати мільярди доларів і використовувати величезні обчислювальні потужності.
Домігшись порівнянних результатів за мінімальних витрат, DeepSeek перевертає економіку ШІ, створюючи загрозу для великих гравців і надаючи більше можливостей невеликим компаніям. Цей успіх має значні наслідки як для технологічних компаній, так і для урядів.
Аналітики зазначають, що досягнення DeepSeek можуть змусити гігантів Кремнієвої долини переглянути свої стратегії витрат. У звіті Morgan Stanley йдеться про те, що глобальний ринок інфраструктури для ШІ, оцінюваний у 250 мільярдів доларів цього року, може кардинально змінитися, якщо методи DeepSeek виявляться масштабованими.
Модель DeepSeek також порушує питання доступності. Якщо аналогічні ШІ можна буде розробляти з меншими витратами, це дасть змогу малим компаніям і менш багатим країнам активніше брати участь у революції ШІ, скорочуючи розрив між технологічно розвиненими країнами і країнами, що відстають.
Чому поява DeepSeek стривожила США і гігантів Кремнієвої долини?
Поява DeepSeek викликала занепокоєння в США, особливо серед лідерів технологічної галузі та політиків. Протягом кількох годин після анонсу моделі R1 акції таких компаній, як Nvidia, Microsoft і Alphabet, значно впали.
Nvidia, ключовий гравець у виробництві обладнання для ШІ, втратила 17 відсотків вартості акцій через побоювання, що успіх DeepSeek може знизити попит на їхні високопродуктивні чіпи.
Президент Дональд Трамп оголосив про запуск ініціативи на суму 500 мільярдів доларів під назвою “Ініціатива Stargate”, спрямованої на зміцнення лідерства США в галузі ШІ та протидію іноземній конкуренції.
Хоча мета ініціативи – стимулювати американські інновації, вона також оголила розкол всередині технологічного сектора.
Ілон Маск, засновник xAI і радник Трампа, закликав посилити регулювання китайських моделей ШІ, стверджуючи, що вони можуть “дестабілізувати глобальний ринок”. Тим часом генеральний директор OpenAI Сем Альтман похвалив DeepSeek за їхній економічний підхід, заявивши: “Це змушує нас усіх переглянути методи інновацій”.
Однак деякі експерти вважають реакцію ринку надмірною. Мел Морріс, голова британської компанії Corpora.ai, зазначив, що, хоча досягнення DeepSeek вражають, немає точних даних про реальні витрати на створення моделі. Він наголосив на необхідності більш детального аналізу перед висновками про вплив DeepSeek-R1 на глобальне лідерство в галузі ШІ.
Таким чином, хоча DeepSeek-R1 є значним досягненням у сфері штучного інтелекту, говорити про зміщення лідерства США в цій сфері передчасно. Необхідні подальші дослідження і спостереження за розвитком ситуації.
Стратегічні наслідки цього виходу на ринок виходять за рамки економіки. За повідомленнями, Пентагон стурбований потенційними військовими додатками китайських технологій ШІ. Швидка розробка і розгортання моделей, таких як R1, можуть змінити баланс сил у таких галузях, як автономні системи, спостереження і кібербезпека.
DeepSeek і Україна: плюси і мінуси
Для України DeepSeek пропонує як можливості, так і виклики. З одного боку, доступність і ефективність моделі R1 можуть прискорити цифрову трансформацію країни і підвищити її можливості у сфері ШІ, включно з охороною здоров’я, освітою та обороною. З обмеженими бюджетами доступ до високопродуктивних, але недорогих ШІ-рішень може стати справжнім проривом для стартапів і державних проєктів.
З іншого боку, геополітична напруженість і побоювання з приводу залежності від китайських технологій можуть ускладнити ухвалення таких рішень. Критики стверджують, що інтеграція ШІ від DeepSeek може наразити Україну на ризики, пов’язані зі спостереженням або технологічною залежністю.
Чи є у DeepSeek майбутнє?
Незважаючи на вражаючий дебют, DeepSeek стикається з низкою труднощів. Скептицизм щодо заяв компанії про вартість розробки R1 і обсяг використаних обчислювальних ресурсів зберігається.
Деякі аналітики сумніваються, чи можна повторити їхній успіх у масштабніших проєктах, чи під час навчання використовувалися нерозкриті додаткові ресурси.
Крім того, як новий гравець на ринку, DeepSeek не має тієї репутації та екосистеми, якими володіють компанії, такі як OpenAI або Google. Для довгострокового успіху компанії буде важливо налагодити партнерства, залучити найкращі таланти і завоювати довіру.
Регуляторний тиск також може стати серйозним викликом. Такі країни, як США, розглядають можливість посилення контролю за експортом китайських технологій, що може обмежити доступ DeepSeek до передового обладнання або міжнародних ринків.
Загалом, поява DeepSeek привнесла нову динаміку в індустрію ШІ, кинувши виклик усталеним нормам і спричинивши як захоплення, так і занепокоєння серед конкурентів і політиків.
У міру того, як компанія продовжує розвивати й удосконалювати свої технології, глобальне співтовариство ШІ пильно стежитиме за її прогресом і ширшими наслідками для ринку.