"Яндекс" открыл для публики свою систему машинного обучения


Опубликованно 30.07.2017 16:11

МОСКВА, 18 июл – РИА новости. Программисты "Яндекса" разработан и направлен в распоряжение системы автоматического обучения CatBoost, что уже сейчас используется в работе, большой адронный коллайдер, сообщает пресс-служба компании.

"Яндекс много лет занимается machine learning, и CatBoost он создал лучшие специалисты в этой области. Я должен сказать, что CatBoost — первый русский метод машинного обучения, который стал доступен для общественности. Мы надеемся, что сообщество оценит его достоинства и поможет вам сделать его еще лучше", - сказал Михаил Биленко, руководитель управления, искусственного интеллекта и поиска "Яндекса".

Как отмечают эксперты, "Наследник", это система машинного обучения, является прямым наследником системы Матрикснет, основы практически всех служб, российского поискового гиганта. Она не является нейросетью, и использует математические приемы, так называемый градиент бустинг, для того чтобы оценить актуальность информации и анализ данных.

Под это слово программисты понимают определенный набор алгоритмов, каждый из которых генерирует ответ, не очень отличается от случайных значений, но сочетание которых позволяет получить достаточно точный ответ на поставленную задачу или классифицировать тот или иной объект.

Основным преимуществом алгоритма CatBoost, по мнению программистов, это то, что позволяет использовать не только числовые данные, но и объекты другого типа, например, фотографии облаков или типов зданий. Это упрощает работу для людей, которые используют его для анализа и классификации информации, и значительно расширяет его применение.

В рамках эксперимента был использован, чтобы улучшить результаты поиска, позиционирования ленты рекомендации Яндекса.Дзен и для вычисления прогноза погоды в технологии Метеум, и во всех случаях он показал лучший Матрикснета.

В результате CatBoost работает и на другие услуги. Он также использует команда Yandex Data Factory — решений для промышленности, в частности для оптимизации расхода сырья и прогнозирования дефектов. Кроме того, CatBoost уже использует и ЕСТЬ: он применил русский алгоритм, чтобы объединить данные, полученные с различных сторон детектора LHCb.

Как пояснила пресс-служба "Ростелекома", компания намерена использовать одну и ту же версию CatBoost в его работе, которая была опубликована в открытом доступе, и программистов, компания планирует использовать предложения, чтобы улучшить эту систему машинного обучения.



Категория: Hi-Tech