Баннер мобильный (3) Пройти тест

Как бизнес использует Data Science, чтобы стать лучше?

Подборка проектов из разных областей: от агросектора до маркетплейсов

Кейс

3 сентября 2024

Поделиться

Скопировано
Как бизнес использует Data Science, чтобы стать лучше?

Содержание

    Data Science — это, конечно, наука. В ней есть математика, статистика, программирование алгоритмов. Но это наука, достижения которой можно применять здесь и сейчас в коммерческих проектах и улучшать бизнес. Поэтому специалисты по обработке данных так востребованы на рынке. 

    Где можно работать дата-сайентисту? Разбираемся на примерах, как Data Science-проекты работают в разных секторах экономики, в том числе в ритейле, медицине и общепите.

    Data Science в медицине

    Data Science давно применяют в медицинских исследованиях, а после пандемии тренд на внедрение технологий только усилился. Есть две больших области их применения: здравоохранение, куда входят диагностика и операционная оптимизация медучреждений, и фармацевтика.

    Схема про применение Data Science в медицине
    Области применения Data Science в медицине

    Анализ больших данных помогает ученым находить новые возможности для повышения точности обследований, ускорения разработки лекарств и усовершенствования медицинских технологий. Вот два ярких примера.

    Ускорение разработки лекарств: IBM Watson for Drug Discovery

    Большие данные в фармацевтике используют, чтобы моделировать биологические процессы в организме и виртуально тестировать новые лекарства. Это делает процесс создания новых препаратов не только быстрее, но и дешевле и безопаснее. 

    Технология IBM Watson for Drug Discovery анализирует большие объемы научной литературы, клинических данных и генетической информации, чтобы оптимизировать процессы исследования. 

    IBM Watson Knowledge Studio
    Интерфейс IBM Watson Knowledge Studio. Источник

    В программе есть несколько инструментов, помогающих исследователю. Например, приложение Entity Explorer используется для поиска научной литературы, Biological Entity Network визуализирует связи между генами, лекарствами и болезнями, а Chemical Search помогает ученым в поиске химических соединений, которые совпадают или структурно похожи на соединение, заданное пользователем. 

    Усовершенствование технологий изготовления протезов

    Несколько лет Data Science активно применяется в протезировании. IT-специалисты используют алгоритмы искусственного интеллекта для «дешифровки» сигналов нервных окончаний через электрод, вживленный в руку. 

    С протезами использующим эту технологию пациентам проще выполнять сложные движения конечности, например движения мелкой моторики. Также некоторые технологии протезирования, основанные на Data Science, открывают возможность ощущать тактильные стимулы. Это значительно улучшает качество жизни владельцев и возвращает их к более активному образу жизни.

    Пример такой технологии — бионические протезы компании «Кибер Моторика». Для реабилитации и обучения пациентов пользованию протезом компания использует мобильные игры. Играя, пациент калибрует протез под свои нервные импульсы, учится делать различные захваты. Такие игры для «Кибер Моторики» разрабатывают студенты Skillfactory.

    Data Science в промышленности

    В промышленном секторе Data Science применяется для разных задач: от повышения эффективности производства до автоматизации операционных процессов. Анализ большого объема данных помогает принимать более информированные решения в управлении предприятием, совершенствовать качество продукции и удешевлять производство.

    Один из ведущих производителей стали и металлопроката в России — «Северсталь» — уже несколько лет активно внедряет искусственный интеллект и Data Science в свои производственные процессы. Самые громкие проекты предприятия — это нейросети «Ева» и «Аделина».

    Улучшение качества металлопродукции

    В 2019 году «Северсталь» запустил нейросеть под названием «Ева». Ее разработали для визуального контроля качества металлопродукции. Система анализирует цифровые снимки поверхности металла и определяет четыре вида дефектов: плена, трещина, механический дефект и раковина. 

    Изображение дефекта металлопроката для обучения нейросети
    Сгенерированное изображение дефекта металлопроката для обучения нейросети. Источник

    «Ева» получает изображения с камер, анализирует их на сервере с высокопроизводительными графическими процессорами, определяет параметры дефектов и отправляет информацию на экран оператора.

    Оптимизация процессов прокатки металла

    После успеха «Евы» в 2020 году «Северсталь» представил новую систему на основе искусственного интеллекта — «Аделина». Нейросеть разработали для управления скоростью агрегата для производства плоского проката.

    «Аделина» анализирует более ста параметров о состоянии оборудования и металлопроката, чтобы адаптировать скорость работы установки. Ранее скорость выставлялась оператором вручную, в соответствии с табличными значениями. Анализ больших данных позволяет точнее управлять этим процессом и снизить нагрузку на установку.

    Data Science в чат-ботах

    Главная цель дата-сайентистов в этой сфере — научить алгоритмы общаться с пользователями более эффективно, улучшить пользовательский опыт. Особое внимание уделяют обработке естественного языка (NLP), персонализации взаимодействия и автоматическому обучению на основе пользовательского опыта. Наиболее знаменитый проект в этой сфере — ChatGPT, однако подобные технологии используют повсеместно.

    Чат-бот для компании ПЭК

    Студенты магистратуры по Data Science Skillfactory и УрФУ на хакатоне разработали чат-бот для компании ПЭК, оператора транспортно-логистических услуг. 

    У заказчика есть база документов, однако найти нужный документ в ней бывает сложно. Многие документы написаны специфическим техническим или юридическим языком. Поэтому заказчику нужен был чат-бот-поисковик, в котором сотрудники могут вбивать вопросы «человеческим» языком, таким же языком получать ответы и ссылки на документы.

    Руслан Кондрашук,
    студент Skillfactory и тимлид команды-победителя

    Проект разбили на несколько задач: чат-бот и путь пользователя, парсинг текстов, векторизация текстов и база данных с векторами. Сложности возникали практически на всех этапах. Документов из разных департаментов составлены по разным правилам, поэтому необходимо было парсить их отдельно. Так же пришлось поступить и с векторизацией: студенты приводили тексты к числовому представлению в рамках каждого департамента.

    Интерфейс разработанного студентами чат-бота
    Из презентации проекта
    Из презентации проекта — победителя хакатона

    На проекте мы научились работать с векторными СУБД, понимать их специфику и подходить более индивидуально к решению сложных задач. Декомпозировать проект на специфические подзадачи, но при этом универсализировать код. Также мы убедились, что простые и проверенные решения могут быть эффективнее передовых и раскрученных.

    Руслан Кондрашук,
    студент Skillfactory и тимлид команды-победителя

    Data Science в сельском хозяйстве 

    В аграрном секторе Data Science помогает следить за состоянием посевов, прогнозировать урожайность, принимать решения о севе и уборке, а также управлять ключевыми ресурсами: водой и удобрениями. Для анализа агропредприятия собирают данные со спутников, уборочной техники и датчиков на полях. Их используют, чтобы строить прогнозы, автоматизировать процессы и повышать эффективность ведения хозяйства. 

    Определение границ полей по спутниковым снимкам

    С помощью Data Science в агросекторе автоматизируют определение границ полей. Распространяет эту технологию швейцарская компания OneSoil. Они разработали платформу для сельскохозяйственных компаний и создают бесплатные приложения для фермеров. Один из ее сервисов помогает автоматически определять границы полей по спутниковым снимкам. 

    Интерфейс OneSoil
    Интерфейс приложения OneSoil. Источник

    Без этой технологии для четкого определения границ участков фермерам приходится объезжать свои поля с GPS-трекерами. Сейчас для определения границ участков приложение используют в 57 странах мира.

    На основе анализа спутниковых снимков технологии компании также позволяют:

    • распознавать сельскохозяйственные культуры;
    • определять уровень урожайности на конкретных участках;
    • получать рекомендации о датах сева.
    Зоны продуктивности
    Зоны продуктивности на полях. Источник

    Data Science в инвестировании

    Data Science — мощный инструмент для изучения рыночной ситуации, управления рисками и персонализации инвестиционного портала. 

    Big Data технологии позволяют даже непрофессиональным инвесторам анализировать внушительные объемы данных и получать информацию о рыночных трендах. Часто ключевой продукт этого анализа — персональные инвестиционные рекомендации. 

    Несмотря на то что они призваны помогать инвесторам повышать эффективность их торговой стратегии, такие решения вызывают опасения со стороны регуляторных органов. Считается, что неопытные инвесторы могут слишком полагаться на виртуальных помощников и принимать необдуманные торговые решения.

    Индивидуальные финансовые эдвайзеры

    Пример такого проекта — Incite AI, персональный финансовый эдвайзер, помогающий принимать решения при торговле на рынке акций. Компания разработала специальный полиморфный алгоритм, который постоянно изучает и совершенствует свои прогнозы на основе потока рыночных данных. Эдвайзер использует сообщения из новостей, биржевые данные, социальные сети, чтобы находить закономерности и прогнозировать будущие движения рынка. 

    Incite AI
    Интерфейс Incite AI. Источник

    Data Science также активно используют в инвестиционных стратегиях профессиональных игроков рынка, например хедж-фондов. Согласно данным, опубликованным BarclayHedge, уже в 2018 году большинство хедж-фондов применяли анализ больших данных и машинное обучение для улучшения своих инвестиционных решений. 

    Data Science в ритейле

    Data Science применяют ритейл-компании для прогнозирования спроса, персонализации предложений, управления запасами и повышения эффективности маркетинга. При помощи технологий бизнесу проще понимать потребности своих клиентов, оптимизировать ассортимент и избегать дефицита или избытка товаров.

    Прогнозирование спроса

    Алгоритмы анализируют историю продаж, сезонные тенденции, демографические характеристики посетителей офлайн-магазинов и сайтов и другие факторы, чтобы спрогнозировать будущие потребности покупателей. Благодаря этому ритейлеры могут заранее подготовиться к периодам интенсивных продаж. Например, закупить больше спросового товара и меньше — позиций с низким спросом.

    Крупные российские компании, такие как «Лента», «Максидом», «Магнит» и «Эльдорадо», собирают данные о клиентах из систем лояльности. Затем они строят аналитические модели, чтобы найти точки для роста бизнеса. Вот некоторые бизнес-процессы, которые ритейлеры могут сделать лучше при помощи Data Science:

    • выявление закономерностей в покупательском поведении;
    • персонализация рекламных предложений;
    • прогнозирование спроса;
    • выбор точки открытия нового магазина.

    Полезные ссылки

    1. Data Science vs Machine Learning: в чем разница?
    2. Кто такой Data Scientist и чем он занимается
    3. Кем работать в Data Science: подборка 7 профессий 

    Кейс

    Поделиться

    Скопировано
    0 комментариев
    Комментарии