Баннер мобильный (1) Пройти тест

Обзор голосовых помощников: что умеют Алиса, Салют, Маруся, Google Assistant и Siri 

Рассказываем, какие голосовые помощники есть на российском рынке, зачем они нужны и какой ассистент самый лучший.

Подборка

26 марта 2024

Поделиться

Скопировано
Обзор голосовых помощников: что умеют Алиса, Салют, Маруся, Google Assistant и Siri 

Содержание

    Больше половины россиян в 2022 году пользовались голосовыми помощниками. Чаще всего люди просили ассистентов найти что-то в интернете, построить маршрут во время автомобильной поездки или написать и отправить текстовое сообщение. В 2024 популярность помощников продолжает расти, на рынке появляется больше сервисов от крупных компаний. Рассказываем про классические и новые инструменты в обзоре.

    ✌️Бонус в конце: рассказываем, как создать своего чат-бота.

    Что такое голосовой помощник? 

    Голосовой помощник — это программа, которая позволяет управлять разными устройствами с помощью голосовых команд. Сервис использует искусственный интеллект для обработки голосовых инструкций и выполнения нужных действий. 

    Иногда мы путаем голосового помощника и физический предмет, в котором он размещается, — кто-то может подумать, что помощник живет в портативной колонке, однако это не так. Помощники могут «жить» в бортовых компьютерах, приложениях в смартфонах, смарт-часах и во многих других устройствах. Именно они наделяют устройство даром речи и ускоряют процесс работы: раньше надо было нажать на кнопку, самому найти информацию, а с помощью ассистента этот процесс ускорился в разы. 

    Как работает голосовой помощник

    Как помощник слышит человека?

    Вначале голосовой ассистент должен «уловить» звук запроса. Когда вы произносите фразу, например «закажи пиццу», помощник слышит не два слова, а звуковой сигнал из гласных и согласных. Обычно процесс захвата целевых звуков осложняют окружающие шумы: человек произносит запрос в транспорте или на игровой площадке. Кроме этого, проблемой становятся разные тембры голоса, особенности произношения.

    Например, в зависимости от региона России в речи пользователя могут встречаться диалекты или разная продолжительность звука. Поэтому технологии внутри помощника сначала делят слова на звуковые фрагменты — фонемы. Затем, для наибольшей точности, фонемы разбивают на фреймы. После математических преобразований получаются коэффициенты, описывающие частотные характеристики входящего звукового сигнала. Только после такой разбивки ассистент может «предположить», что именно сказал пользователь. 

    Как помощник понимает, что от него хотят? 

    После того как помощник уловил звуки запроса, системе нужно выявить намерение пользователя. Кроме того, помощник должен учитывать контекст фразы, чтобы дать максимально подходящий ответ. Выяснив намерение и контекст, система переносит запрос в нужный тематический раздел, где происходит сбор информации. Например, мы просим помощника проверить курс валюты, помощник ловит слова, их смысл и отправляет запрос в поисковик, через который можно узнать курс. 

    Как помощник дает ответ? 

    После того как голосовой помощник услышал, интерпретировал запрос и нашел информацию на него, ему нужно вернуться с ответом к пользователю. Почти всегда информация, которую находит ассистент, — текстовая, поэтому ему необходимо считать ее и озвучить. Чтобы речь звучала естественно, для разработки голоса ассистента приглашают профессиональных дикторов или актеров, которые наговаривают тысячи часов речи. 

    В целом, индустрия стремится делать все ответы надежными и этичными, но ошибки иногда встречаются. В составе команд разработчиков голосовых ассистентов может быть психолог, а то и несколько: они анализируют ответ помощника, насколько он безопасен и этичен для пользователя. Кроме того, перед выдачей ответов пользователю важно делать дополнительный фактчекинг данных от помощника. Да, ошибки в ответах пока могут быть, особенно в каких-то сложных навыках, например отгадывании загадок. 

    Леонид Саночкин,
    технический лидер в МТС AI

    У голосовых помощников может быть личность? 

    При работе сразу с несколькими помощниками можно обратить внимание, что у каждого из них есть свои оригинальные черты: чувство юмора, тембр голоса, манера общения и даже пол. Зачем это нужно? 

    Одно из объяснений — человек охотнее взаимодействует с устройством или технологией, у которой есть признаки эмпатии. Например, оно может «подыграть» пользователю: продолжить шутку, обозначить свои границы, дать ненавязчивый «человечный» совет. При этом разработчики голосового ассистента должны учитывать, что аудитория у продукта многомиллионная: пользоваться устройством могут взрослые, дети. Поэтому важно выдержать баланс, чтобы голосовой ассистент никого не обидел, не расстроил и тем более не причинил вред. 

    Бывает, что разработчики стараются придавать своим продуктам некоторые индивидуальные черты. В то же время важно помнить про эффект зловещей долины, и производители это учитывают — большинство ассистентов не пытаются притворяться человеком и обычно стремятся к тому, чтобы не реагировать излишне человечно на определенные вопросы.

    Леонид Саночкин,
    технический лидер в МТС AI

    Сколько стоит создание ассистента и что для этого нужно уметь

    Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Например, разработка Олега обошлась «Тинькофф» примерно в 50 миллионов рублей и оправдала себя уже в первый месяц, когда позволила сэкономить столько же.

    Чтобы разработать своего помощника, стоит определиться с тем, какие проблемы будет решать ИИ и какой результат получат пользователи. Сейчас технологии позволяют разработать как голосового помощника, так и чат-бота. Они оба распознают человеческую речь, но первый может сам выстроить логическую цепочку, а второй отправит автоматизированный ответ.

    Если бюджет не позволяет разработать личного Олега, то лучше будет обратиться к экосистеме Сбера или Алисы, которые помогут разработать свой навык на их платформе.

    Навыки для Алисы можно создать с помощью платформы Яндекс.Диалоги, а Сбер работает в SmartApp Studio. Тех, кто не умеет программировать, выручит визуальный конструктор от Яндекса или сторонний Dialogflower. На базе Aimylogic можно создать навыки почти для всех известных ассистентов.

    По данным Just Al, создание чат-бота займет от недели до 3,5 месяцев и в среднем будет стоить от 250 до 300 тысяч рублей. При том можно заняться разработкой самостоятельно, и тогда придется оплатить лишь лицензию за использование конструктора, которая стоит от 5900 до 59 000 рублей в зависимости от количества пользователей.

    Если проект масштабный, то лучше привлечь дополнительных специалистов:

    • проектного менеджера, который будет заниматься разработкой ТЗ и координацией процесса;
    • NLP-разработчика для создания алгоритмов распознавания речи и ее синтеза;
    • UI/UX-аналитика, чтобы проработать пользовательский опыт в продукте и создать для него оболочку;
    • тестировщика для выявления ошибок и сбоев.

    Работа строится по следующей схеме. Первым этапом определяются требования и создается ТЗ. На проектировании проводятся анализ и разметка пользовательских данных и создание макетов интерфейса. При разработке нужно будет реализовать бизнес-логику и интеграции. А после этого протестировать навык и запустить его.

    Какой голосовой ассистент лучше

    Алиса от Яндекса 

    Интерфейс Алисы
    Интерфейс Алисы на смартфоне. Источник

    По результатам исследования, Алиса — наиболее узнаваемый и популярный ассистент среди пользователей: о помощнике знает более 90% опрошенных. 

    Помощник помогает пользователю в решении разных задач: 

    • Ищет информацию. Алиса может найти информацию по различным темам: погода, новости, курсы валют. 
    • Отвечает на вопросы. Причем самые разные — от «Какая погода сегодня» до «Кто такой Леонардо Ди Каприо». 
    • Развлекает пользователя. Включает музыку, фильмы, подкасты. 
    • Напоминает о событиях. Так ассистент уведомляет о важных мероприятиях: дни рождения, встречи. 
    • Переводит тексты на другие языки. С помощью Алисы можно переводить тексты на более чем 100 языков.
    • Взаимодействует с детьми. Читает сказки, объясняет уроки. 
    • Управляет другими устройствами — умными лампами, кондиционерами, роботами-пылесосами. 

    Помощник интегрируется с сервисами Яндекс: Музыка, Карты, Такси, Еда. Но стоит учитывать, что некоторые функции могут быть недоступны для пользователей Алисы. Все зависит от географического положения человека и степени проникновения сервисов Яндекс. Например, если в вашем городе нет Яндекс.Такси, то заказать машину через Алису не получится. 

    Также стоит учитывать, что лучше всего Алиса понимает русский язык. Помощник поддерживает другие языковые версии, но функционала в них может быть меньше. 

    Алиса может работать на смартфонах, планшетах, десктопах, умных колонках и телевизорах. Кроме того, разработчики Алисы сделали ее доступной для iOS и Android

    Личность Алисы

    При создании помощника разработчики прописали характер персонажа. «Голосом» помощника стала актриса театра и кино Татьяна Шитова. Она же дублировала персонажей Скарлетт Йоханссон, Марго Робби, Эммы Стоун, Натали Портман. 

    Ассистент — молодая девушка, которая всегда готова помочь пользователю. При этом в общении ассистент аккуратно держит дистанцию, она не высокомерна, а при оскорблении аккуратно отстраивается от диалога. Разработчики старались сделать Алису самоироничной, добавить уместные шутки в ее речь.

    Семейство помощников Салют от Сбер 

    Интерфейс Салюта
    Интерфейс Салюта на смартфоне. Источник

    Разработчики голосового ассистента от Сбера шагнули дальше и решили предоставить пользователю на выбор трех помощников: Джоя, Афину и Сбера. У каждого из ассистентов свой характер и особенности, можно выбрать наиболее подходящего для себя помощника. Однако функционал у них в целом одинаковый. 

    Салют может: 

    • Найти информацию и ответить на вопросы. Можно узнать погоду, гороскоп совместимостей, новости и многое другое. 
    • Напомнить о событиях, поставить напоминание или будильник. 
    • Перевести деньги и оплатить услуги через приложение Сбера. 
    • Взаимодействовать с госуслугами. Например, записать пользователя к врачу или узнать о текущих задолженностях. 
    • Развлечь пользователя. Рассказать сказку ребенку, включить фильм или музыку.
    • Заказать продукты или готовые блюда. 
    • Управлять устройствами — умными лампами, кондиционерами, роботами-пылесосами. 

    Часть своих функций помощник осуществляет с помощью интеграции в экосистему Сбера. Например, деньги Салют переводит через приложение банка, музыку загружает из Звука, продукты заказывает через СберМаркет, а кино включает через Okko. Так же как и Алиса, часть функций Салют может не осуществлять из-за своего географического расположения. 

    Что касается вариативности, то создатели Салюта интегрировали его в ряд устройств. Помощник работает на смартфоне, планшете, в умных колонках, телевизорах. На данный момент помощник работает с устройствами на Android, а также через веб-приложение на iOS. 

    Личность Салюта 

    А точнее, три. Разработчики создали целое семейство ассистентов под одной родовой фамилией — Салют. На выбор пользователя: Джой, Афина и Сбер. 

    Джой. Общительная и веселая девушка, которая обращается к пользователю на «ты». При решении возложенных на нее задач Джой решает их скорее как друг, а не как бизнес-партнер. Например, может пошутить, подбодрить. При этом ассистент соблюдает границы и немного жалеет, что не человек. 

    Афина. По названию помощника понятно: этот ассистент чуть менее эмоционален и общителен. Афина, по собственному признанию, обожает графики, схемы и цифры. Ее позиционируют как идеального помощника для тех, кто любит порядок и хочет контролировать свои действия.

    Сбер. Нейтральный персонаж по сравнению с Афиной и Джой. Но, по словам разработчиков, у него тоже есть свои особенности. Например, ассистент обожает комиксы и фильмы про супергероев, настольные игры. А еще любит музыку из 90-х и время от времени цитирует строки из песен того времени. Сбер признается: он интроверт, но ему нравится общаться с людьми. 

    Голосовой помощник Маруся от VK

    Интерфейс Маруси
    Интерфейс Маруси на смартфоне. Источник

    Следующий помощник — Маруся, которая, по отзывам пользователей, больше всего понравится родителям и детям за счет расширенных «детских» функций. Однако это не мешает ассистенту справляться с задачами для других возрастов.

    По функционалу Маруся похожа на других голосовых помощников: 

    • Поиск информации в интернете. Помощник может найти новости, ответить на запрос, рассказать про погоду. 
    • Поиск локаций.
    • Напоминание о событиях. Ставит напоминания или будильник, проверяет почту. 
    • Развлечения для детей. Рассказывает сказки, учит выговаривать буквы, проводит зарядку и много другое. 
    • Развлечения для взрослых. Предлагает игры в города, клевер, рассказывает необычные факты, включает музыку или кино. 
    • Управление умными устройствами в доме.

    Заказать еду на дом Маруся предложит через Самокат или Delivery Club. Интересен тот факт, что у Маруси есть свое собственное приложение, а у Алисы или Сбера нет — помощники находятся внутри приложений Сбера или Яндекса. 

    Маруся работает с сервисами VK, например Mail Почтой, VK Музыкой. Разместить Марусю можно на множестве устройств: помощник легко устанавливается на смартфон, он есть в умных колонках, на телевизорах Smart TV и в ТВ-приставке Wink. Кроме того, помощник может работать на iOS и Android. 

    Личность Маруси

    Голосовой помощник говорит голосом актрисы Елены Соловьевой. Если вы поклонник World of Warcraft, то именно Елена озвучивала Сильвану Ветрокрылую. Также ее голосом говорит Тринити из «Матрицы».

    Что же касается индивидуальных особенностей Маруси, то, по наблюдениям некоторых пользователей, помощник больше ориентирован на семейную или детскую аудиторию. Например, у ассистента в разы детальнее проработаны развлекательные функции, есть много авторских игр. А еще на умной колонке с Марусей можно включить мимишный режим — изображение часов на колонке поменяется на изображение милых глаз. 

    Google Assistant от Google 

    Интерфейс Google Assistant
    Google Assistant в смартфоне. Источник

    Голосовой помощник американского происхождения, который может выполнять широкий диапазон пользовательских задач:

    • Поиск информации в интернете: погода, новости, ответы на вопросы.
    • Перевод денег другому пользователю через Google Pay.
    • На телефоне — работа с галереей и мультимедиа.
    • Настройка маршрута, поиск локаций.
    • Перевод текста.
    • Установка напоминаний и будильников, проверка почты.
    • Запись и отправка сообщений, осуществление звонков.
    • Управление предметами умного дома.

    Компания Google создала широкую линейку собственных продуктов, поэтому Ассистент способен выполнять самые разные поручения от пользователя. Например, поставить напоминание через Google Календарь, построить маршрут через Google Карты. А часть услуг, для которых у Google нет своих продуктов, покрывается за счет приложений от компаний-партнеров. 

    Ассистент можно установить на ряд устройств: планшеты, смартфоны, умные часы, десктоп, телевизор. Он может работать с девайсами на iOS и Android. 

    Личность Google Assistant

    Этот голосовой помощник популярен во всем мире, поэтому его создателям нужно было учесть разнообразные культурные особенности стран, уместность шуток, наличие тех или иных стереотипов. Например, то, что приемлемо сказать в Китае, может стать оскорблением в Японии, и наоборот. Отчасти это могло повлиять на то, что у Google Assistant есть шутки, но не в таком количестве, как у отечественных продуктов. 

    Кроме того, при создании помощника его разработчики хотели сделать его более доступным в различных культурах. Именно поэтому было принято решение не давать ему человеческое имя, а оставить Google Assistant. Также разработчики сохранили связь с компанией производителем — Google. 

    Еще одним аргументом в сохранении большей дистанции между ассистентом и пользователем было желание разработчиков вести прозрачную коммуникацию с людьми: потребители не должны путать его с реальным человеком.

    По словам разработчиков, «человечность» и индивидуальность помощника достигается благодаря развитой речи ассистента: его тембр, интонации звучат вполне естественно. При этом пользователь может выбрать, каким голосом будет разговаривать помощник: мужским или женским. 

    Siri от Apple

    Интерфейс Siri
    Siri в смартфоне. Источник

    Siri — один из самых известных и первых голосовых помощников. Уникальность ассистента заключается в его локализованности: с ним могут взаимодействовать только владельцы продуктов Apple. Работа с Siri позволяет пользователям легко переключаться между своими устройствами и получать доступ к нужным функциям без необходимости входить в приложения.

    У помощника целый спектр функций и возможностей для пользователей устройств Apple. Siri умеет:

    • Отвечать на различные вопросы пользователя, например рассказывать о погоде, курсе валют, последних новостях.
    • Управлять устройствами Apple, такими как HomePod, HomeKit-совместимые устройства и другими. Например, с помощью голосовых команд можно включить или выключить свет, открыть или закрыть дверь, изменить температуру в комнате. 
    • Выполнять поручения — Siri отправит сообщение, создаст напоминание, установит будильник. 
    • Строить маршруты.
    • Включать видео, музыку, подкасты или аудиокниги. 

    При работе с Siri также стоит учитывать геопозицию. Возможно, помощник не сможет построить точный маршрут в определенной локации или заказать такси. 

    Создатели помощника неохотно работают со сторонними, не из экосистемы Apple, приложениями. По мнению некоторых разработчиков, подобная закрытость стала одной из причин технологического отставания Siri по сравнению с ее конкурентами — Google, Amazon, Samsung. 

    Siri «живет» во всех устройствах Apple — часах, ноутбуках, планшетах с операционной системой iOS, iPadOS, macOS, watchOS и VisualOS. При этом помощник стоит по умолчанию во всех устройствах Apple, его не надо скачивать или устанавливать. 

    Кстати, если активировать Siri и сказать «Люмос», на смартфоне включится фонарик, а на фразе «Нокс» он выключится.

    Личность Siri

    Как и в случае с Google Assistant, пользователь может выбрать сам, каким голосом будет разговаривать помощник — мужским или женским. Личность Siri ее создатели также решили прописывать не слишком сильно. Причины такого решения отчасти перекликаются с причинами Google Assistant: человек должен понимать, что общается с полезной технологией, а не личностью, а вся коммуникация должна быть этичной и осторожной.

    Перед тем как выбрать помощника, важнее всего понять, зачем ассистент нужен. Важна работа в пределах одной экосистемы, которую используете? Или есть конкретные запросы по функционалу, например часто заказываете такси или еду домой? Выбирайте помощника только после того, как ответите себе на вопрос: зачем он вам? Какие задачи вы хотите на него переложить?

    Леонид Саночкин,
    технический лидер в МТС AI

    Где еще встречаются голосовые помощники? 

    Ассистентами пользуются не только обычные люди, чтобы поставить будильник или спросить погоду. Бизнес также использует голосовых помощников: банки, ритейл, девелоперы, интернет-провайдеры, мобильные операторы активно внедряют их в свои системы. 

    Бизнес использует голосовых помощников по нескольким причинам: 

    Уменьшить нагрузку на контактные центры. Помощник может оперативно ответить на простые запросы пользователя — подсказать баланс, оставить заявку. 

    Снизить пользовательское время ожидания. Иногда, чтобы узнать простую информацию, пользователю необходимо «отстоять» очередь за ней. А голосовые помощники это время сокращают, быстро информируя людей. 

    Уведомить пользователя о предстоящей активности или задаче. Например, с помощью голосового ассистента компания может сообщить, что истекает срок погашения кредита или такси подано.

    Рассказать о рекламных и маркетинговых активностях в компании. 

    Кстати, если кто-то переживает, что голосовой помощник забирает рабочие места, то это не совсем так. Ассистент выполняет простые задания, оставляя специалистам задачи более высокого уровня. Кроме того, бизнес постоянно масштабируется, и сотрудники могут качать экспертизу в новых, более креативных областях. 

    У голосовых помощников есть еще одна отличительная черта, которая не позволит им заменить людей. Многие голосовые бизнес-ассистенты еще слабо «очеловечены» — почти сразу пользователь понимает, что беседует с роботом. 

    Если вы хотите самостоятельно разработать чат-бота, то вот сборник уроков, который все объяснит.

    Подборка

    Поделиться

    Скопировано
    0 комментариев
    Комментарии