Баннер мобильный (3) Пройти тест

«Лаборатория Наносемантика» x Skillfactory: как студенты учили ИИ расшифровывать анализы крови и человеческие эмоции

Подборка ярких кейсов с хакатонов совместно с компанией «Лаборатория Наносемантика»

Кейс

20 августа 2025

Поделиться

Скопировано
«Лаборатория Наносемантика» x Skillfactory: как студенты учили ИИ расшифровывать анализы крови и человеческие эмоции

Содержание

    Быстрая диагностика по анализу крови и определение эмоций в тексте — уже второй год студенты Skillfactory решают амбициозные задачи на хакатонах с компанией-партнером «Лаборатория Наносемантика». Самые впечатляющие кейсы — в нашей подборке. 

    Акула-гематолог Блуди

    Студенты магистратуры Skillfactory и МФТИ «Прикладной анализ данных в медицинской сфере» на хакатоне совместно с компанией «Лаборатория Наносемантика» создали сервис SharkLab. Это простой и дружелюбный инструмент для интерпретации результатов общего анализа крови. Сервис дает понятные рекомендации: когда стоит обратиться к врачу, какие шаги предпринять и на что обратить внимание, а когда не стоит паниковать.

    Команда ввела в интерфейс виртуального помощника — очаровательную акулу-гематолога по имени Блуди. Она делает общение с сервисом более комфортным и снижает тревожность при работе с медицинскими данными.

    Интерфейс приложения с акулой-гематологом Блуди

    Проект реализовали в несколько этапов:

    • Подготовка данных. Команда очистила и стандартизировала результаты анализов крови, учитывая возраст, пол, вес и рост пациентов. В процессе обработки унифицировали единицы измерения и устранили пропуски. 

    Команды получили два датасета: первый включал показатели из ОАК реальных людей (без персонализации), второй предоставил Сеченовский университет, из их исследования заболеваний крови пожилых пациентов. Команда по своей инициативе нашла дополнительный датасет из открытых источников, относящийся к американской национальной программе социальных исследований. Сложность была в том, что исходные данные датасетов отличались единицами измерения, и необходимо было все данные стандартизировать. Это стало дополнительной задачей, но зато позволило значительно улучшить результаты сервиса.

    Татьяна Гапоненко,
    директор по маркетингу, ГК «Лаборатория Наносемантика»
    • Обучение моделей. Использовали алгоритмы Logistic Regression, Random Forest и XGBoost. Благодаря этому команда определила ключевые параметры, влияющие на диагностику, и выстроила логику рекомендаций — к какому врачу обратиться и насколько срочно.
    • Интеграция в продукт. Веб‑сервис разработали с помощью Streamlit, а данные сохранили в базе SQLite3. При этом внимание уделялось защите персональных данных — не запрашивались имя или контакт пользователя.
    • Персонализация и рекомендации. Система учитывает индивидуальные параметры пользователя и формирует советы, избегая сложных медицинских терминов. Для критически тревожных показателей есть уведомления о необходимости срочно обратиться к врачу, а при небольших отклонениях — рекомендации по питанию, активности и профилактике.

    Интерфейс прост и интуитивно понятен, SharkLab можно запускать через браузер или локально — все это сделало проект удобным и функциональным.

    Веб-сервис для анализа крови

    Минималистичное, но не менее проработанное решение той же задачи показали студенты программы Skillfactory и Сеченовского университета «Data Science в медицине». В хакатоне участвовали две команды и один индивидуальный разработчик. 

    Участники представили зрелые и проработанные решения. Видны серьезная работа и вдумчивый подход. Конечно, есть моменты, требующие доработки, но для формата хакатона результаты получились очень достойными.

    Татьяна Гапоненко,
    директор по маркетингу, ГК «Лаборатория Наносемантика»

    Команда под руководством Анастасии Чухонцевой создала модель для прогнозирования рецидивов лейкозов по данным клинического анализа крови. Алгоритм классифицирует пациентов по уровням риска и может заподозрить рецидив до появления симптомов. Решение упаковали в интерфейс для пациентов и врачей, которы й включает модули для диагностики анемий и может масштабироваться за счет анализа изображений и медицинских текстов. Точность модели достигла 98%, что делает ее перспективной для применения в онкогематологии.

    Индивидуальный проект Евгении Андриановой — прототип сервиса автоматической интерпретации общего анализа крови с учетом персональных данных пациента. Евгения очистила и проанализировала данные, внедрила словари медицинских норм, выделила ключевые показатели и создала рекомендации для каждого. MVP реализовала в виде интерактивного файла с мгновенной обратной связью.

    Также активно себя проявила команда под руководством Анастасии Лужецкой. Команда создала браузерный сервис, который по результатам общего анализа крови выдает предполагаемый диагноз, оценивает срочность обращения к врачу и формирует рекомендации. 

    Самым сложным в работе было найти способ разделения выданных данных на классы. Так как, вероятно, база данных будет обновляться с каждым новым пациентом, хотелось достигнуть максимально машинной, автоматизированной работы. Мы старались создать кластеры так, чтобы не упускать уникальные или редкие состояния. В рамках отведенного времени мы не успели это реализовать, но сама идея нам показалась интересной.

    Анастасия Лужецкая,
    тимлид команды

    Участники собрали датасет, объединили тесты в исследования и разметили данные комбинированным методом: по экспертным правилам, с помощью кластеризации и LLM, — после чего лучший вариант валидировали вручную. Обучив несколько алгоритмов, команда выбрала наиболее точный без признаков переобучения и внедрила его в веб-платформу на Flask с использованием JavaScript и CSS

    Прототип сервиса для анализа крови — анкета
    Прототип сервиса для анализа крови — результат и рекомендации
    Так выглядит прототип готового решения. Снаружи — минималистичный интерфейс, внутри — высокоточный алгоритм

    Чат-бот с эмпатией

    На хакатоне студенты Skillfactory по заданию компании «Лаборатория Наносемантика» разрабатывали модель машинного обучения для анализа расшифровок голосовых сообщений и определения эмоций говорящего. В распоряжении участников был датасет с реальными высказываниями и их эмоциональной окраской — от радости и интереса до злости и зависти. Модель должна была принимать текст на вход, анализировать его и возвращать наиболее вероятный класс эмоций.

    Как работает ИИ-модель для распознавания эмоций в тексте схема

    В отличие от голосовых сообщений, текст лишен интонации, поэтому студенты заложили в модель методы глубокого анализа структуры и контекста слов. Для этого они собрали и подготовили данные, очистили и лемматизировали текст, обучили несколько алгоритмов, чтобы выбрать наиболее результативный, и визуализировали итоги для интерпретации. 

    Следуя этим этапам, студенты преобразовали датасет из более 1000 текстовых сообщений в чистый и структурированный набор текстов, пригодный для точной классификации эмоциональной окраски сообщений.

    Анализ эмоций в текстовых сообщениях

    Студенты протестировали несколько алгоритмов и выбрали самое эффективное сочетание: BERT + Логистическая регрессия. Эта комбинация показала точность 0,8325, что значительно превышает результаты остальных моделей.

    Помимо проверки технических навыков на реальных задачах, участники хакатона прокачали свои софт скилы: коммуникацию, управление временем, работу в команде, принятие решений. 

    На хакатоне мы получили опыт, который сложно найти в повседневной учебе, — опыт командной работы. Это не только про разделение обязанностей, но и про совместную работу на GitHub. Я впервые комментила и пушила, исправляла оплошности и оформляла readme-файл. Также было интересно применить свои знания одномоментно. Обычно на курсе нам помогают. Рассказывают про последовательность действий, подсказывают, какие модели использовать. На хакатоне такой роскоши нет, вы сами вольны решать, что делать. Такая свобода, без привычки, очень выбивает из колеи. Если в команде нет более собранного и опытного, можно на пару дней провалиться в бездну : «а что делать-то?»

    Анастасия Лужецкая,
    тимлид команды

    Кейс

    Поделиться

    Скопировано
    0 комментариев
    Комментарии