C Андреем Белевцевым беседовал главный редактор Бизнес ФМ Илья Копелевич.

Вначале я хотел, чтобы мы чуть-чуть поговорили о гонке больших искусственных интеллектов. Начнем с термина, который не всем до сих пор ясен. Чем просто искусственный интеллект отличается от генеративного искусственного интеллекта?
Андрей Белевцев: Искусственный интеллект как технология, как некий термин существует уже многие десятки лет, прежде всего в основе лежит математика. Это подходы к анализу, аналитике обработки данных и разработке моделей машинного обучения, которые способны в результате анализа, который в них вложен, который в эту модель вкладывается на этапе ее обучения, после этого анализировать данные и выдавать некие правильные ответы. Мы с искусственным интеллектом и с моделями встречаемся везде. У каждого в кармане есть мобильный телефон, практически это означает, что вы каждый день сталкиваетесь с искусственным интеллектом. В современных телефонах камеры обязательно используют алгоритм обработки изображения, любое приложение, которым вы пользуетесь каждый день, содержит модели машинного обучения. Иногда для того, чтобы показать вам таргетированную рекламу, иногда для того, чтобы проложить для вас дорогу, иногда для того, чтобы бороться с мошенниками в банковских приложениях или делать кредитный скоринг, если вы хотите взять кредит. Все это делает искусственный интеллект, он везде. Но в чем разница с генеративным искусственным интеллектом — она заложена в самом определении. Почему он генеративный? Потому что раньше модели в основном были призваны анализировать данные, они не создавали новый контент, они анализировали тот, который им давали. Модели генеративного искусственного интеллекта стали способны создавать новый контент, поэтому они генеративные. Что они могут создавать? На самом деле очень разные вещи. То есть мы увидели этот прорыв в конце 2022 года с появлением ChatGPT, основанного на модели GPT-3.5 от OpenAI, и мы увидели другой уровень диалога. Прошло всего три года, и представленная тогда модель, которая все так перевернула и открыла нам следующую эпоху, по сравнению с современным уровнем очень-очень простая. Тем не менее это был огромный сдвиг парадигмы, потому что мы увидели, что есть этот диалог. После этого все увидели такие же прорывы в генерации изображений, генерации звука, генерации видео. 2022 год — поворотная точка, но работа в этом направлении велась еще за несколько лет до этого, совершился эффект эмерджентности, когда с ростом размерности новая большая система начинает обладать такими свойствами, которые раньше не были присущи ее частям.
Что мы наблюдаем в этом году? Именно гонку платформ, и это уже не отдельные продукты, а именно платформы, которые тратят огромные деньги, во всяком случае если мы говорим об Америке. И все рассуждают, пузырь это или нет. Почему? Потому что это требует огромных расходов. Самая простая и ясная цифра — ChatGPT Сэма Альтмана, он забронировал на предстоящие четыре-пять лет вычислительные мощности на триллион долларов. К ним еще будет нужна электроэнергия, ее уже не хватает. Это не все бесплатно, но значительная часть простого пользовательского контента, на уровне которого человек может обращаться, это бесплатно. В чем, так сказать, волшебство?
Андрей Белевцев: Вы сказали, что началась уже гонка не моделей, а платформ. Почему это произошло? Потому что разработчики очень быстро поняли, что если ты можешь генерировать текст и он действительно дает возможность отвечать на поставленные вопросы, то это означает, что ты можешь генерировать и программный код, а это уже очень важно. Код на самом деле очень хорошая вещь. Код — это текст, но человечество, для того чтобы действительно разрабатывать программы, сделало его очень структурированным. Наша речь не так сильно структурирована, мы используем обороты, междометия, запинаемся...
И чем больше отклоняемся от трафарета, тем интереснее нас слушать.
Андрей Белевцев: Да, надеюсь. Но код сильно структурирован. Модели и их знания в генерации кода оказались очень важны, потому что разработчики поняли, что ты можешь не только поддерживать диалог, но и структурированно вызывать инструменты для того, чтобы исполнять то, что пользователь хочет. То есть ты одновременно можешь вести диалог, а потом модель в какой-то момент понимает: так, от меня сейчас хотят сделать какое-то действие. И в этот момент она может сгенерировать вызов функции и вызвать программный код. Таким образом, она очень плотно соединилась с миром информационных технологий. Стали появляться продукты, которые не только могут вести диалог с человеком, но и могут использовать разнообразные инструменты и в ходе этого диалога редактировать документы по его запросу, генерировать изображения, строить графики, то есть делать все более и более сложные задачи. Все понимают, что вы можете такого рода модели попросить доделать действия до конца. То есть, например, не только поискать товары для вас, но потом и купить то, что было найдено.
У нас уже это произошло. В России две большие языковые модели развиваются под крылом «Сбера» и под крылом «Яндекса». Вот они недавно это заявили, показали. В принципе Amazon давно это делает, но только в системе самой Amazon. Мы к бытовым применениям перейдем в ближайшее время, но все-таки правильно ли я понимаю, что платформы компаний, которые развивают большие языковые модели, готовы тратить любые деньги, и их главная цель — сейчас привлечь в трафик как можно больше пользователей?
Андрей Белевцев: Я думаю, что верно. Если вы постоянно все свои вопросы задаете своему ИИ-помощнику, он вам на эти вопросы не только отвечает, но и способен сделать более сложные задачи. Он способен сделать исследование по вашему вопросу, подобрать услуги, товары, продукты и потом с вашим подтверждением инициировать покупку, в какой-то момент это для вас становится самым удобным способом решения задач.
Про DeepSeek говорили, что он учился уже на ChatGPT. То есть ChatGPT учился на сырье, а он присоседился к ChatGPT, и я не понимаю, как это происходит, но скачивает его, скажите точнее, как это правильно назвать.
Андрей Белевцев: Во-первых, никто не знает, то есть это все набор фантазий, слухов и так далее.
Это можно так сделать? Это так работает или нет?
Андрей Белевцев: В целом развитие этих моделей сейчас идет таким образом, что модели предыдущего поколения обязательно используются для обучения модели следующего поколения. Как это сделать? Например, есть задача, которую текущая модель решает не очень хорошо, но ты можешь определенное количество раз попросить ее эту задачу сделать, выбрать лучший результат.
Как я понимаю, вот у вас есть учебник математики, а в конце уже есть ответы. Если, допустим, ChatGPT данные вопросы уже обработал, и ты забираешь ответы, и твоя контрольная пишется со списыванием ответов. Примерно правильно?
Андрей Белевцев: Чуть-чуть сложнее, потому что в учебнике математики может быть ответ в виде числа.
Ну и способ решения тоже.
Андрей Белевцев: Ответ вам не поможет. А способ решения, подход может помогать. Сейчас для того, чтобы учить существующие модели, ключевой фактор — это данные, и данные какого типа? Компании, занимающиеся разработкой, уже давно скачали все открытые данные в интернете, а процент новизны и качества новой информации очень невеликий. Человечество непрерывно генерит контент в огромных объемах, то есть никогда не будет такого, что мы скачали весь интернет до конца и все, и больше там ничего нет. Такого не существует. Так вот ключевая история — это разметка. То есть это данные, описывающие логику размышлений для того, чтобы получить правильный ответ. Чтобы создать эти данные, активно используются модели текущего поколения, чтобы сделать следующее поколение. Но не только модели, потому что все больше данных и знаний находятся в головах людей, в головах специалистов. И, повторюсь, это знание не правильного ответа, а способа размышлений, который позволяет к нему прийти. Все современные модели стали размышляющими, и для разработки этих моделей активно используются как генерация синтетических данных, то есть сделанных другими моделями прошлого поколения, так и разметка людьми, которая становится все более дорогой и профессиональной, потому что участвуют в этой разметке специалисты в определенных областях, в которых ты хочешь, чтобы модель твоя стала хорошей.
Для западной деловой прессы сквозная тема второй половины года: инвестиции в большие языковые модели — это пузырь или не пузырь? Что об этом думают в нашем сообществе?
Андрей Белевцев: Мы все помним такой этап — пузырь и бум доткомов. Действительно, в какой-то момент огромное количество компаний, видя, что это позволяет привлекать инвестиции, бегут за инвестициями. И действительно, на этом этапе неквалифицированный инвестор, который как бы видит, что паровоз уезжает, он на него не успевает, и в мечте заработать кучу денег пытается вложить деньги, но в некачественные проекты с некачественной командой и с отсутствием бизнес-модели, но как-то они его уговаривают. И, конечно, на любом витке развития технологий часть неквалифицированных инвесторов рискует потерять свои деньги. Но, с другой стороны, если вспоминать про итог доткомов, было ли то изменение, которое в нем закладывалось, изменение пользовательской потребительской парадигмы поведения фундаментально? Было. Если мы сейчас посмотрим на те компании, которые начинали в ту эпоху и все-таки выжили, мы все видим, что инвестиции в них были там более чем оправданны. Наверное, тут не найти человека, который не хотел бы вложить в лидеров той эпохи: в Google, Amazon и так далее.
Есть более радикальная точка зрения на это, полемическая, поэтому я сейчас ее выскажу. И я ее услышал от наших айтишников, которые занимаются как раз не генеративным искусственным интеллектом, а прикладным, отраслевым. Потому что он есть в сельском хозяйстве, в распознавании лиц, в медицине. Многие из них говорят, зачем эта огромная дорогая игрушка, вся прелесть которой только в том, что вы ей пишете запрос простыми словами? Для того чтобы она вам делала то, что человек не хуже делает сам. Ну ладно, он тратит какое-то время писать ненужные вещи типа официального письма и так далее. Производственные, научные задачи лучше решать программами прикладного, отраслевого искусственного интеллекта, они стоят гораздо дешевле в их разработке, применении и так далее. И поиграются люди вот в эти запросы. Игрушка, но очень дорогая.
Андрей Белевцев: На самом деле тем IT-компаниям, которые так говорят, наверное, сейчас ничего другого не остается. Но в целом это говорит о том, что их технологическое будущее предопределено, если они не начнут думать по-другому. В чем сила генеративного искусственного интеллекта, в чем печальная особенность отождествления генеративного искусственного интеллекта как технологии с чат-ботом? Его сила в фантастической универсальности. Разработка узкопрофильных специализированных моделей раньше требовала, чтобы ты нанял как раз эту IT-компанию, у которой есть какое-то количество разработчиков. Ты должен провести длительное время в том, чтобы подготовить специализированный датасет, обучить модель, вывести ее в производство. И потом ты можешь ее применять для очень узкой задачи. Стоит ли продолжать применять работающую технологию? Конечно, стоит до тех пор, пока у тебя экономическая ценность от новых технологий не превзойдет то, что было раньше. Но ценность генеративного искусственного интеллекта в огромной универсальности, то есть очень высокой обобщаемости. Такие технологии в своей работе может применять малый, средний бизнес, например, который не мог нанять большие команды, обучить специализированные модели только для своего бизнеса и так далее, — это первый фактор. Второй фактор — эти модели могут создавать разный контент. Например, мы можем привести пример лекарственных препаратов, формулы которых можно синтезировать. Или Chat-модели для архитектуры здания или модели деталей. Все то, что я сейчас перечисляю, мы как команда умеем синтезировать, использовать тот же подход. То есть ты можешь делать доменно-специфичные модели, которые будут выполнять другие задачи. И здесь очень важно, что надо думать о генеративном, и не о великой модели, которая одна будет решать все на свете задачи. Нет, их тоже будут многие десятки, сотни, может быть, тысячи. Но сам подход, семейство, где-то можно переиспользовать те данные, которые ты собираешь и замечаешь, где-то сами подходы, он будет позволять тебе создавать доменно-специфичные модели, адаптируя их, но другого уровня и другой скорости. Еще важно то, что все они могут сочетаться, большая модель или специализированная, может быть, неким когнитивным ядром. То есть когда ты ведешь диалог, у тебя появляется возможность общаться с моделью, которая будет принимать определенные решения о том, какой инструмент вызвать, какую малую модель использовать для задачи. Или, может быть, сможет написать код под конкретную задачу, потому что она понимает, что это нужно, чтобы решить твой пользовательский запрос.
К разговору о многочисленных курсах использования искусственного интеллекта. Но есть гораздо более сложный и продвинутый уровень использования, в том числе больших генеративных моделей, которые выглядят очень простыми. Так сказать, ты ее просишь что-нибудь сделать, как скатерть-самобранку, — она делает. Но для бизнеса, для решения специфических задач как это сейчас работает уже на примере ГигаЧат и не только?
Андрей Белевцев: Давайте возьмем несколько полярных кейсов. Например, наш партнер — компания «Фосагро», она на базе ГигаЧат сделала помощника инженера-технолога, который помогает сопровождать технологические режимы на установках, которыми они занимаются в своем химическом производстве, и это тот самый ГигаЧат. Другой наш партнер — компания «Сибур» использует ГигаЧат как внутренний портал для поиска и документной аналитики, тот же самый ГигаЧат.
Это очень большие компании, они создают своих агентов?
Андрей Белевцев: Они создают свои интеграции, свои технологические решения у себя, некоторые являются агентами, некоторые и не обязаны быть агентами. Но действительно, большие компании имеют свою специфику. Если говорить о другой стороне, о малом и среднем бизнесе, то есть другая возможность. Вы сейчас можете подключиться к моделям семейства ГигаЧат через программный интерфейс и их использовать. И несколько тысяч компаний в России сейчас активно это делают уже.
Какие задачи решают на специфическом уровне, а не на уровне секретаря или создания ярлычка, этикетки, картинки на бытовом уровне.
Андрей Белевцев: Первое, наверное, что начинает делать компания, — это работа в области взаимодействия со своими клиентами или в работе с документами. Современный бизнес много где, чисто по человеческим причинам, выстроен вокруг работы с документами. Человек обрабатывает документы, принимает решения и дальше приводит их в исполнение. То есть первая группа — клиентская работа. Это клиентская аналитика, запросы, коммерческие предложения, заказы, рекламации, проблемы и так далее. То есть все, кто находится в бизнесе, где у тебя есть большой объем b2c-клиентов, все могут получить большую пользу от того, что ты будешь гораздо быстрее, точнее и качественнее обрабатывать весь клиентский поток, от заказа до проблемы, если она существует. Есть другая история, например закупки.
А какая стоимость развития и интеграции именно этих сервисов внутри компании?
Андрей Белевцев: Там все просто, это же облачный подход. Можно начать с 1 тысячи рублей.
Тут всплывает слово «токен». Понимаю, что это какая-то единица измерительных звеньев, которые нужны для того, чтобы решать твою задачу.
Андрей Белевцев: Для обучения модели, для того чтобы выравнивать тот язык, на котором модели учатся, используются так называемые токенизаторы, как бы это некие алгоритмы, которые переводят текст, допустим, на русском языке, разбивая его побуквенно. Это не классический слог в классической орфографии русского языка, но он смотрит на структуру языка, насколько часто встречаются те или иные конструкции. Один токен — это две-три буквы.
Но стоимость как раз измеряется в токенах?
Андрей Белевцев: Стоимость бывает разная, нужна единица потребления. Так как ты общаешься с моделью, у нее базовая модальность — это текст, но этот текст нужно как-то измерить. Если компания крупная, то она может заказать себе выделенную инфраструктуру, определенный объем оборудования. И тогда по большому счету ее затраты — это пропорция от инвестиций в оборудование и лицензионная база самой модели. Если компания среднего размера, она может заказать так называемые потоки, то есть это выделенные квоты, наоборот.
Кто в компаниях способен квалифицированно этим заниматься? Если мы уже говорим не о секретаре, не о клиентском менеджере, но где очень понятные операции. А вот когда речь идет уже о процессах управления предприятием, производственным процессом или бухгалтерским процессом. Кто может в компании этим заниматься? Это должны появиться реально обученные люди, и где этому научиться?
Андрей Белевцев: Здесь два фактора. Будет странно, если в компании это пройдет мимо их IT-подразделений если они вообще в компании существуют, потому что они не в каждой компании есть. Это нужно, если ты делаешь какую-то кастомизацию. Но самое как бы главное, что в компании этим могут и, мне кажется, должны заниматься все, начиная с лидера компании, с ее генерального директора, с председателя правления, потому что все начинается с осознания бизнесом тех возможностей, которые технологии дают для самого бизнеса. Они должны стать квалифицированными пользователями, постановщиками задач, потому что трансформация их бизнеса зависит от того, как они будут менять сами свои внутренние процессы, она зависит как бы не от самой технологии, технология будет средством.
Мне кажется, что очень многие методом тыка сейчас проходят этот путь. Ну даже мы какие-то пробуем вещи, пробуем и пробуем, что-то из этого выходит хорошее, что-то не выходит, ну у нас простые, у нас текстовые задачи.
Андрей Белевцев: Чисто по-человечески это неплохой метод, если ты собрался внедрять какую-то технологию, а ты вообще, когда с ней в жизни не сталкивался, ты не чувствуешь ее, не понимаешь, ну это будет очень странно. Сейчас каждый вот человек в стране, если ты руководитель предприятий, собрался с этим что-то делать, ну зайди ты на Giga.Chat, это бесплатно, это доступно всем, и там есть много возможностей. Ты можешь не только текстом попереписываться, ты можешь документы обработать, ты можешь голосом поговорить, кстати, там шикарнейший голосовой режим, когда ты просто разговариваешь с ним, как с человеком, ты слышишь совершенно другой уровень речи, он эмоциональный, он сопереживает.
То есть он сам подскажет, как двигаться дальше?
Андрей Белевцев: Конечно, ты можешь задать эти вопросы туда же, можешь поговорить об этом, попросить совета. Ты можешь начать генерировать себе вот в регулярной нашей жизни, вот, например, замечательная возможность. Есть же огромное количество информации, мы все переполнены этой информацией, но почему не послушать то, что тебе интересно, в режиме вот такого разговора, как мы с вами сейчас ведем, такого интерактивного подкаста с двумя ведущими, которые обсуждают какую-то интересную тему, которую ты им задал.
Это уже прямо отдельная тема, мы до нее сегодня не дойдем. Американские газеты все судятся с chatGPT, чтобы он не лез и не использовал, но это отдельная история.
Андрей Белевцев: Про то, как они судятся, это отдельный вопрос, но я, скорее, про то, что появляются совершенно новые форматы, в том числе работы и потребления контента. Ты можешь взять ссылку в интернете, которую ты бы иначе читал, или книжку, и попросить «Гигу» просто превратить ее в подкаст, взять с собой в машину на пробежку или просто послушать. Но ты будешь слушать немонотонный бубнеж, как раньше был голосовой синтез, ты будешь слышать вот такой же разговор.
Это очень опасная территория, споры по поводу которой ведутся отдельные. Вообще насчет креативного контента не только в плане средств массовой информации, но также книги, фильмы, прямо отдельная тема, я думаю, мы в ближайшее время очень многое будем обсуждать, но пока останемся на таких прикладных бизнес-задачах.
Андрей Белевцев: Я бы только одно бы, наверное, завершил, что правильно попробовать.
Да, это мы поняли.
Андрей Белевцев: Прежде чем, прежде чем вы собираетесь размышлять, читать все эти статьи, попробуйте сами составить свое мнение. Это не требует никаких специализированных знаний, навыков и так далее. Просто попробуйте.
Мы только что говорили про эти триллионные суммы, которые получают в качестве инвестиций с фондового рынка или планируют получить триллионы, которые еще не собрал Сэм Альтман, но, правда, планирует собрать, не выставляя никакой встречный финансовый поток в виде выручки. У нас нет таких триллионов? Мы можем в развитии больших языковых моделей гнаться за американскими, за DeepSeek?
Андрей Белевцев: Про триллионы. Не надо забывать, что эти анонсы — это еще и часть конкурентной стратегии. То есть не только практическая реализация, но и некий анонс твоих планов, чтобы твои конкуренты, развиваясь и, например, привлекая себе финансирование, в том числе думали: смотрите, как нам поднять миллиарды, если у него уже триллионы? Надо понимать, что эти публичные заявления и действия в том числе должны повлиять, по их предположениям, на действия их конкурентов. И большой вопрос всегда, а что из этого на практике реализуется? Потому что ты можешь заявлять любые триллионы, если у тебя не будет хорошего продукта, если пользователи не будут ими пользоваться, это все закончится пшиком. То есть в основе все равно лежит продукт, который нравится людям. Потом триллионы. Но да, они действительно об этом заявляют. С точки зрения того, как конкурировать и как реализовывать хорошие продукты в этих условиях, у нас есть определенное преимущество, когда ты все-таки не первый проторяешь сложную, тяжелую дорожку, ты так или иначе можешь видеть результаты экспериментов и их результатов, которые делают те компании, которые берут на себя бремя лидера.
Но тогда ты всегда будешь на шаг назад, а может, на два.
Андрей Белевцев: В этом на самом деле нет ничего плохого. Вопрос, насколько хорошо ты сделаешь потом для своего клиента то, что ты ему предлагаешь. Зачастую те, кто делают что-то на шаг впереди, из-за этой гонки и напряжения у них не получается сделать лучше всех. Огромное количество компаний и сервисов, которые мы сейчас знаем, сейчас лучшие в своих категориях, но не они были ее родоначальниками. Возьмите любые известные технологические компании, например Microsoft? Они во всех своих основных продуктах не первые.
Да, даже многие считали, что они когда-то давно все украли у Apple.
Андрей Белевцев: Давайте отдадим должное, что потом в ряде направлений и продуктов они сделали суперкруто, стали великой компанией. Есть великая китайская компания Huawei, например. Huawei сделал первый в мире мобильный телефон? Нет. Первый в мире смартфон? Нет. Первые в мире операционные системы для смартфонов? Нет. Первое в мире телекоммуникационное оборудование в свое время, на заре компании? Да вроде тоже нет. Но они построили великую компанию с технологически инженерной культурой. В Huawei они говорят, что если мы за что-то беремся, то мы это обязательно доделаем и станем в этом чемпионами.
В этом году прошла презентация внедрения на рынок ГигаЧат второго поколения. Если оценить его сейчас в сопоставлении с лидерами?
Андрей Белевцев: ГигаЧат-2 был весной. Осенью мы показывали уже третье поколение. Если сравнивать его с лидерами, смотрите, у нас есть главный открытый российский бенчмарк, который делает Альянс искусственного интеллекта, называется MERA. И пока превью ГигаЧат-3 Ultra, нашей последней модели, то есть это модель незавершенного обучения — это промежуточная версия, но уже хорошая, она там заняла первое место. Вот простой ответ.
Но мы боролись только внутри своей лиги, не на международном уровне?
Андрей Белевцев: Команды выкладывают международные модели. Они замеряют их через API там, где этот замер возможен, где у модели есть API. Безусловно, это очень активная конкуренция, и наш фокус внимания — на русском языке и на том, что нужно пользователям в России. И этот фокус позволяет делать интересные решения. Для нас важный ориентир — это китайские опенсорсные модели. Однако они не концентрируются на русском языке, а для нас это важно, мы делаем модели, которые оказываются более эффективными здесь. Также в открытый доступ мы выложили еще очень маленькую модель — Lightning. Она вот в своем размере лучше, чем Qwen3. Но смотрите, здесь, что, наверное, важно отметить, что важна не только конкретная модель. Даже если ты сделал очень хорошо, через неделю кто-нибудь в мире сделает лучше, чем ты, а может, через несколько дней. Важно то, что ты построил процесс и обладаешь технологией разработки, которая тебе позволяет ритмично, постоянно развиваться и делать все более качественные решения, которые востребованы твоими пользователями. Для меня, например, очень важным результатом этого года стало то, что ГигаЧат пользуются уже 23 млн человек каждый месяц, рост в десять раз за год. И это для нас важнее всего, это наш главный драйвер в развитии.
О какой цифре вы мечтаете на следующий год?
Андрей Белевцев: Удвоиться, утроиться, в разы.
Потому что спланировать это невозможно, но можно мечтать.
Андрей Белевцев: Будем расти в разы. Это очень важно. Будем расти, потому что мы думаем о людях в России. И наша задача сделать для них продукт, который будет удобнее в бытовом использовании и не будет ничем в их глазах технологически уступать тем же самым решениям ChatGPT.
В отношении русскоязычного контента и русскоязычных задач.
Андрей Белевцев: Да, и тех задач, которые нужны нашей аудитории. Я считаю это абсолютно реалистичным. Мы же занимаемся не только ГигаЧат, у нас есть, например, очень сильное семейство моделей Kandinsky. Мы представили Kandinsky-5.0.
Но они же интегрированы...
Андрей Белевцев: Глазами человека они интегрированы. То есть ты идешь на одну и ту же поверхность, если тебе нужно сделать видео, изображение, ты там же делаешь этот запрос. Но нам удалось выложить ГигаЧат и Kandinsky-5.0 в Open Source, где сравнивают модели по тому, как они людям нравятся. И среди всех открытых моделей Kandinsky-5.0 на прошлой неделе занял первое место.
В чем смысл выкладывания в Open Source?
Андрей Белевцев: Основной смысл развития таких проектов Open Source — это сообщество. Ты получаешь сообщество людей, которые начинают использовать. Многие из них на основе твоих моделей могут создавать интересные технологические решения, таким образом тоже тебе обратную связь давать, а может быть, даже и контрибьютить в твое развитие.
То есть это работает? Когда другие разработчики начинают свободно пользоваться твоей разработкой, но она возвращается в твою разработку через их труд тоже.
Андрей Белевцев: Это работает немного по-другому, чем с программным обеспечением, там ты можешь получить прямые изменения в коде, но так или иначе это работает. Ты видишь внимание, к тебе в команду могут приходить более сильные люди, потому что они видят твою инженерную работу. И нам очень важно, чтобы в России это знание сохранилось. Потому что из того, что я знаю, «Сбер» сейчас — это единственный разработчик полного цикла генеративных моделей в стране, включая сбор подготовки данных, весь процесс обучения, изготовления финальной модели. И для страны это очень важно, за любую современную технологию идет большая мировая конкуренция, и два мировых лидера в этой области, Америка и Китай, каждый избрал свою политику. Но Америка заключает межправительственные соглашения, по которым стране может быть предоставлено право реализовать у себя проект, строительство вычислительного центра на своей территории, в котором будут работать модели этих американских компаний. То есть они очень так серьезно и стратегически к этому подходят.
То, что у нас называется приземлением.
Андрей Белевцев: Да. Если не дружим, то как бы извините. Китай идет другим путем.
Но, кстати, когда они приземляются, я так понимаю, там еще вопрос завтрашнего дня. Пока нет законодательства, а есть очень много спорных моментов по поводу того, какие данные могут использовать, это мы сейчас не будем обсуждать, это очень сложная, интересная тема.
Андрей Белевцев: Я считаю, что здесь нет категории, сможем — не сможем, я считаю, мы должны. Вообще в этом мире уважают только технологически сильных. А что такое для нас технологически сильные? Это люди, знания, компетенции, технологии. И, кстати, те самые модели, которые мы показываем, выкладываем в Open Source для того, чтобы было понятно, на каком уровне мы реально сейчас находимся. Каждый желающий может взять, потрогать, попробовать воспроизвести эксперименты, повторить, посчитать метрики, то есть абсолютно открытый подход. С тобой могут тогда разговаривать как со стратегическим партнером и строить долгосрочные проекты, потому что они понимают, что у тебя есть определенные собственные знания, и вы можете строить что-то взаимовыгодное. Поэтому я считаю, что, как в любом типе технологической инфраструктуры, в нашей стране это сейчас ключевая задача. Мы, может быть, до конца сейчас даже не понимаем, насколько она окажется стратегически важной.