Алгоритм от «Яндекса» вошел в число самых востребованных систем ИИ в мире
Речь идет о CatBoost. Российская разработка применяется практически в каждой 30-й работе
Читать на полной версииРоссийский алгоритм CatBoost от «Яндекса» оказался одним из самых популярных инструментов машинного обучения. Американское издание Marktechpost проанализировало пять тысяч научных статей из семейства британского журнала Nature и подготовило отчет.
CatBoost изначально разрабатывали для улучшения результатов поисковой выдачи «Яндекса», сейчас компания применяет его и в других сервисах, например в «Музыке», «Погоде» и «Маркете». В общий доступ он был выложен в 2017 году.
Подобные CatBoost алгоритмы применяются для решения различного рода задач. Среди прочего это анализ массивов данных, который нужен для проведения качественной научной работы. Разработка от «Яндекса» применялась в различных областях: от социальных и прикладных наук до медицинских тем. Например, как следует из отчета, ученые из Сербии использовали российский алгоритм, чтобы спрогнозировать свойства керамической плитки на этапе обжига, в Польше рассчитывали риск преждевременных родов, а в США с его помощью проводили диагностику болезни Альцгеймера.
Российские разработки и раньше признавались одними из лучших, отмечает сооснователь и директор по развитию компании по производству роботов Promobot Олег Кивокурцев:
Олег Кивокурцев сооснователь и директор по развитию компании по производству роботов Promobot «У разных разработчиков в разных странах разные подходы и инструменты для анализа данных. В математике, которая является основополагающей наукой в машинном обучении, существует множество способов решить одну и ту же задачу. И в некоторых случаях «Яндекс» действительно способен конкурировать, а в некоторых случаях даже делать лучше, чем иностранные решения. И это всегда было так: и пять, и шесть, и десять лет назад инструменты «Яндекса» участвовали в подборках лучших решений в области machine learning и таковыми продолжают оставаться».
Однако все же лидерами в области машинного обучения остаются Соединенные Штаты, так как большинство научных работ используют американские разработки, и Китай, на долю которого приходится наибольшее количество публикаций на тему машинного обучения. Список неамериканских алгоритмов, широко использующихся в науке, довольно небольшой. Помимо российского CatBoost, в него вошли разработки из Германии, Франции, Великобритании и Канады.
То, что российский алгоритм вполне конкурентоспособен на фоне санкций, — это отличный показатель, считает генеральный директор «А-Я эксперт», старший преподаватель кафедры «Кибернетика» НИЯУ МИФИ Роман Душкин:
Всего российский CatBoost в своих работах в 2025 году использовали ученые из 51 страны. Среди авторов представители престижных учебных заведений, в том числе Стэнфорда, Гарварда и MIT.