На рынке ИИ побеждает не тот, у кого больше чипов, а тот, у кого лучше алгоритмы
Запущенный в конце декабря китайский ИИ-сервис DeepSeek стал самым популярным ИИ-инструментом в России, обогнав отечественный «Шедеврум» от «Яндекса». Такие данные 12 февраля обнародовали аналитики компании Yota.
О том, как будет развиваться искусственный интеллект и на что способны разработчики ИИ в России, Mashnews побеседовал с Олегом Бартуновым, сооснователем и генеральным директором компании Postgres Professional, российского разработчика систем управления базами данных (СУБД), и Максимом Бузиновым, руководителем R&D-лаборатории Центра технологий кибербезопасности ГК «Солар».

Не путайте ИИ и нейросети!
— Искусственный интеллект и нейросети — это разные понятия. Чем они отличаются?
Олег Бартунов: Понятия «нейросеть» и «искусственный интеллект» взаимосвязаны и их легко спутать, но при этом имеют отличия. Нейросеть — это алгоритм, который хорошо определяет паттерны (шаблоны) в данных, за счет чего можно решать сложные задачи. Сейчас нейросети стали самым успешным подходом к построению систем искусственного интеллекта — брендом, под которым создаются последние модели.
Понятие «искусственный интеллект» более широкое и включает в себя логические модели, генетические алгоритмы, экспертные системы и не только — фактически все, что может имитировать человеческий интеллект.
— Чем китайские разработки в области искусственного интеллекта (DeepSeek) отличаются от американских (ChatGPT)? Есть ли вообще какая-то разница или они созданы на одних и тех же принципах и архитектуре?
Олег Бартунов: Из-за ограниченного доступа к мощным графическим процессорам (GPU) в Китае развивается полезное направление оптимизации архитектурных решений и алгоритмов обучения. Это дает возможность достигать высоких результатов на значительно меньших вычислительных ресурсах. Такой подход качественно продвигает индустрию по сравнению с масштабированием мощностей, которым OpenAI занималась долгое время.
Отсутствие серьезных этических ограничений на выдачу моделей тоже играет свою роль и ведет к повышению качества ответов. Выделяется и то, что в DeepSeek можно наблюдать процесс «размышления» — анализа данных и подбора ответа. При этом, как и в российских LLM, данные для обучения моделей учитывают региональные особенности. Смещение акцентов в некоторых темах и вкладывание определенной морали в ответ моделей — это один из примеров региональных особенностей LLM. Другой случай: в результатах генерации китайских моделей иногда можно встретить иероглифы даже там, где используются русский или английский языки. Пример этого — на скриншоте.
— Что такое LLM?
Олег Бартунов: LLM (Large Language Model) — это большая языковая модель, особая нейросетевая архитектура, которая обучается на огромных объемах текстовых данных. В процессе обучения модель выявляет сложные закономерности человеческого языка, включая синтаксис, семантику и контекстуальные зависимости.
За счет этого LLM может самые разные задачи — генерация текста, классификация, перевод, суммаризация, в том числе преобразование естественного языка в SQL-запросы, над чем активно работает команда Postgres Pro.
Генеральный директор Postgres Professional Олег Бартунов
СПРАВКА MASHNEWS
- DeepSeek — китайская компания, основанная в 2023 году. В конце декабря 2024 года официально представила языковую модель DeepSeek, в которую, по заявлениям разработчиков, вложили всего $6 млн. DeepSeek способна анализировать колоссальные массивы данных и выдавать высокоточные ответы в разных областях: от научных исследований до письменных переводов.
- ChatGPT — чат-бот с генеративным искусственным интеллектом, разработанный компанией OpenAI— некоммерческой лабораторией, основанной в Сан-Франциско в декабре 2015 года. Инвесторы, среди которых был Илон Маск, обещали выделить $1 млрд на разработку систем искусственного интеллекта, который должен «приносить пользу всему человечеству». Сейчас Илон Маск, давно вышедший из участников OpenAI, считает, что ИИ может быть опаснее ядерных бомб.
- SQL — язык запросов для управления реляционными базами данных. «Реляционные» означает, что все данные хранятся в виде взаимосвязанных таблиц. А SQL используют для того, чтобы влиять на элементы внутри этих таблиц: добавлять, удалять, изменять.
ИИ уже проник во все сферы жизни
— В США объявили о том, что вложат в дальнейшее развитие искусственного интеллекта 500 млрд долларов. Франция объявила, что инвестирует 109 млрд евро в разработку своего ИИ. Зачем нужны такие вложения? На что реально могут пойти эти миллиарды — в железо или в разработку ПО?
Максим Бузинов: Затраты на искусственный интеллект — это вычислительные центры, дата-сторы, сетевое оборудование, электрооборудование и робототехника, разработка программного обеспечения на сетевом и прикладном уровне, а также обеспечение научных и инженерных исследовательских лабораторий. Очевидно, что заявленная сумма обозначена как стратегическая инвестиция с возможностью сокращения обозначенных бюджетов.
— Пока ИИ воспринимается как игрушка — задать вопрос, написать релиз, составить резюме. Он уже может делать что-то действительно важное и прикладное?
Максим Бузинов: ИИ-помощники — это верхушка возможностей айсберга ИИ. Функциональность искусственного интеллекта гораздо шире, чем вопросно-ответная технология больших языковых моделей. ИИ активно применяется во всех сферах жизни — в быту, в промышленности, науке, социальной сфере, культуре и творчестве и так далее.
ИИ интенсивно применяется в медицине, помогает проводить диагностику заболеваний, позволяет людям с ограничениями возможностями слышать и говорить. В фармакологии при помощи искусственного интеллекта определяются, насколько конкретный препарат подходит определенному пациенту или группе пациентов с учетом их генетики.
Нейросети эффективны в управлении транспортными потоками. Кроме того, ИИ помогает исследовать новые месторождения ресурсов, восстанавливать ДНК древних организмов, различать объекты в космическом пространстве.
Сейчас более 200 крупных российских компаний используют технологии ИИ в составе программных продуктов ГК «Солар» для защиты своих данных и ИТ-инфраструктуры. Например, в DLP-систему Solar Dozor мы внедрили модуль распознавания графических файлов: изображений банковских карт, сканов паспортов, служебной, медицинской и конструкторской документации.
ИИ-модуль UBA (User Behaviour Analytics) в Solar Dozor распознает все нестандартные действия сотрудника, которые могут говорить о попытке похитить информацию. Нейросеть, встроенная в наше решение, способна распознать речь на 50 языках и преобразовать ее в текстовый формат. Такие данные, к примеру, могут быть полезны службам безопасности компаний при расследовании киберинцидентов и случаев несанкционированной деятельности персонала.
Максим Бузинов, руководитель R&D-лаборатории Центра технологий кибербезопасности ГК «Солар»
За 10 лет ИИ очень многое поменяет
— Как искусственный интеллект может изменить нашу жизнь? Дайте прогноз на ближайшие 10 лет?
Олен Бартунов: Активное развитие ИИ за последние два года уже дало свои плоды: работа с текстовой информацией экономит огромное количество человеко-часов в рутинных и аналитических задачах. При помощи LLM уже оптимизируются колл-центры, автоматизируется аналитика пользовательского опыта и упрощаются интерфейсы взаимодействия со сложными системами — например, с СУБД PostgreSQL с использованием человеческого языка.
За последние два месяца активно развиваются ризонинг-модели по типу DeepSeek-R1. Все это говорит о том, что в разрезе 10 лет динамика изменений будет колоссальная.
Большой потенциал кроется в ошибках и неточностях, которые сейчас допускаются в ответах. На их основе модели будут развиваться — и чем качественнее станет анализ, тем мощнее будет толчок вперед.
— А в чем проблемы применения ИИ?
Олег Бартунов: В технологической гонке нужно помнить и о социальных аспектах, особенно, что касается молодого поколения. Восприятие ИИ как абсолюта и источника истины чревато в будущем. Поэтому как никогда важно развивать у детей критическое мышление. Пока ИИ в нашей жизни — не более чем помощник, assistant.
— Что скрывается под термином «ризонинг-модель»?
Олег Бартунов: Reasoning-модель — это подход, при котором модель не просто генерирует ответ напрямую, а сначала строит цепочку логических рассуждений, как это делает человек.
Вместо мгновенного вывода результата модель анализирует задачу, рассматривает ее с разных сторон, разделяет на подзадачи и только после этого дает итоговый ответ. Раньше такой прием реализовывался через специальные инструкции для языковых моделей, но в последнее время появились специально обученные LLM, по типу DeepSeek-R1 или ChatGPT o1.
— Для чего нужны системы управления базами данных (СУБД) и как они работают?
Олег Бартунов: СУБД можно сравнить с библиотекарем, который в огромной картотеке помогает быстро находить нужную вам книгу.
— Важна ли в развитии искусственного интеллекта мощность чипов и оборудования в целом? Кто сейчас в основном производит чипы для ИИ в мире?
Олег Бартунов: Что касается ИИ, сейчас не столь важно, кто доминирует на рынке. Обучение LLM было и будет ресурсоемким процессом, однако побеждает не тот, у кого больше чипов, а тот, у кого лучше алгоритмы.
Для большинства это — черный ящик
— Сейчас российские IT-специалисты могут взять какой-либо из имеющихся в мире ИИ и интегрировать его в процессы того или иного предприятия? Или все не так просто?
Максим Бузинов: Большинство моделей ИИ можно использовать и адаптировать под разные отрасли и организации. И здесь перед разработчиками возникает дилемма — сделать быстро или качественно. Часть простых задач языковые модели могут решать без длительной доработки, однако более узкоспециализированные нейросети потребуют значительной модификации и привлечения дополнительных специалистов, а также повышения компетенции сотрудников и дообучения.
— Можно ли доверять данным ИИ? Насколько ИИ безупречен? Если ИИ будет пользоваться, например, неточными данными, то можно ли проверить его выводы? Или это для человека черный ящик?
Максим Бузинов: Для большинства пользователей ИИ действительно является черным ящиком. Нейросети не безупречны и обладают множеством уязвимостей. Сейчас российские разработчики ИИ совместно с госорганизациями формируют перечни наиболее распространенных уязвимостей и угроз, а также разрабатывают меры по борьбе с ними. Стоит отметить, что, стремясь продемонстрировать эффективность и дешевизну отечественных решений, создатели порой забывают о лакунах в информационной безопасности.
Корпорации за счет ИИ сокращают издержки
— Зачем вкладывать миллиарды в развитие искусственного интеллекта? Почему об этих инвестициях постоянно говорят?
Олег Бартунов: Корпорации внедряют ИИ для сокращения издержек, усиления безопасности. В широком смысле ИИ ускоряет научные открытия — от моделирования климатических, экономических и других систем до медицины и разработки лекарств, примеры чего уже есть на российском рынке. Но опыт DeepSeek показал, что не всегда для хорошего результата требуются гигантские вливания.
— В России есть свои разработки в области искусственного интеллекта — например, от «Яндекса» («Шедеврум») и «Сбера» (Kandinsky). Могут они уже посоревноваться с иностранными нейросетями (ChatGPT и DeepSeek)?
Олег Бартунов: Собственные LLM, обученные с нуля или дообученные под конкретные задачи, — это подтверждение больших возможностей и высоких компетенций наших команд.
По сравнению с зарубежными аналогами российские модели пока что уступают в масштабе и универсальности, но эффективны в узкоспециализированных задачах: анализе нормативных документов, обработке запросов на русском языке, поддержке корпоративных процессов.
Любая команда разработчиков «за кадром» ведет много других перспективных исследований. Думаю, пример DeepSeek даст отечественным специалистам еще больше уверенности в своих разработках и вскоре мы о них узнаем.
СПРАВКА MASHNEWS
- ООО «Постгрес Профессиональный» (PostgresProfessional) — российский разработчик систем управления базами данных (СУБД). Компания зарегистрирована в 2015 году в Москве. Выручка компании за 2023 год составила 8,2 млрд рублей, прибыль — 7,1 млрд рублей. Олег Бартунов, генеральный директор и соучредитель компании (доля 21,5%) окончил физический факультет МГУ, работает в Государственном астрономическом институте имени П. К. Штернберга МГУ. Профессиональный астроном. Изначально использовал PostgreSQL для решения задач астрономии. Занимался разработкой портала rambler.ru. Совместно с Федором Сигаевым (также учредитель компании) разработал для PostgreSQL систему полнотекстового поиска, средства поддержки слабоструктурированных данных, индексные методы доступа, в том числе к пространственным данным.
- ГК «Солар» — группа компаний, специализирующаяся на разработке технологий для защиты информационных активов, целевого мониторинга и управления информационной безопасностью, входит в кластер информационной безопасности группы ПАО «Ростелеком». Консолидированная выручка ГК «Солар» по итогам 2023 года составила 17,3 млрд рублей.