16+
Суббота, 12 октября 2024
  • BRENT $ 78.79 / ₽ 7569
  • RTS903.24
18 мая 2021, 17:40 Компании

Разработчикам нейросетей в РФ хотят дать платный доступ к госданным

Лента новостей

Над соответствующей концепцией работает Минцифры. Предоставляемая информация будет обезличена. Насколько компаниям будет интересно покупать дата-сеты у государства?

Дата-центр.
Дата-центр. Фото: depositphotos.com

Минцифры предлагает предоставить разработчикам нейросетей платный доступ к государственным данным. Согласно обсуждаемой концепции, в дата-сеты могут войти любые данные: о медицинских обследованиях и поставленных по ним диагнозам, уровне цен в различных регионах, составе почвы для сельскохозяйственных работ и другие, пишет РБК.

Вся информация будет анонимизирована и обезличена. Власти смогут передавать ее коммерческим организациям, цена будет зависеть от объема и сложности данных. Часть баз будет строго конфиденциальной, и доступ к ней будут иметь только организации, аккредитованные профильными ведомствами, например, ФСБ. Если говорить конкретно о данных россиян, то они уже давно используются не только в маркетинге, говорит директор по консалтингу компании Arenadata Антон Балагаев:

Антон Балагаев директор по консалтингу компании Arenadata «На мой взгляд, идея актуальная, мысль вполне здравая, и в эту сторону так или иначе нужно двигаться. Объясню почему. Производственные компании и ряд ретейловых, банковских компаний уже прошли через этот этап. То есть они сделали озеро данных, они дали доступ внешним подрядчикам, и, соответственно, эти внешние подрядчики ищут какие-то внешние инсайды, которые позволяют взглянуть немного по-другому на то, каким образом можно правильно эксплуатировать эти данные. Сама по себе эта функция, при которой данные можно взять из единой точки, обработать и что-то там найти, подключив внешнего провайдера, зарекомендовала свою эффективность».

Пока в концепции Минцифры нет конкретики, рано говорить, насколько интересно покупать дата-сеты у государства, считает ведущий специалист Центра машинного обучения «Инфосистемы Джет» Ярослав Шмулев. Но это определенно поможет научным центрам, отмечает он:

Ярослав Шмулев ведущий специалист Центра машинного обучения «Инфосистемы Джет» «Безусловно, государство владеет огромными ресурсами данных, и эти данные могут быть в принципе очень полезны по разным областям. Например, медицина: те же результаты медицинских анализов. Если полностью исключить какую-то персональную информацию, это все равно очень ценно. Например, результаты МРТ-снимков и возможные опухоли на них. Выборкой из сотни тысяч таких примеров ни один открытый институт не обладает. А сейчас за несколько лет такую выборку вполне можно собрать. Только одних КТ сколько было сделано за эти два года. Такой большой объем и вариативность хорошо может подтолкнуть компании в развитии искусственного интеллекта в России. Если есть конфиденциальные данные, ты их можешь не отдавать частным компаниям, отдаешь только специальным ведомствам. Есть второй вариант. Те же данные, например, можно обезличить, анонимизировать, но это делать нужно правильно. Есть ряд научных статей в литературе, которые показывают, как те же анонимизированные или маскированные данные можно восстановить, использовав специальные методы. Поэтому это нужно делать будет с умом, и в этом действительно есть риск».

Владимир Путин в прошлом году поручил правительству разработать закон о доступе разработчиков искусственного интеллекта к большим данным, в том числе государственным. Он отметил, что эта информация является «питательной средой для развития технологий искусственного интеллекта».

А Минцифры уже подготовило законопроект, согласно которому бизнес должен безвозмездно передавать властям обезличенные данные россиян для оказания цифровых услуг. Как писал «Коммерсантъ», участники рынка выступили против.

Рекомендуем:

Фотоистории

Рекомендуем:

Фотоистории
BFM.ru на вашем мобильном
Посмотреть инструкцию