2023/06/15 11:03:48

Александр Крушинский, BSS: Массовое использование речевых роботов в коммуникациях с клиентами — это неизбежность

О текущем уровне развития текстовых и голосовых роботов для бизнес-коммуникаций и ключевых факторах успеха при выборе решений в интервью TAdviser рассказал Александр Крушинский, директор департамента голосовых цифровых технологий компании BSS.

Александр
Крушинский
Роботы используются везде, где необходима коммуникация с клиентами.

Чат-боты, как и голосовые боты в последние год-два стали абсолютным мастхэвом для всех. Какие типы чат-ботов можно выделить?

Александр Крушинский: Роботы используются везде, где необходима коммуникация с клиентами. Здесь можно выделить два кластера решений. Первый кластер составляют боты, служащие заменой сайту или мобильному приложению, то есть решения, которые выполняют специфичную функцию и не переводят клиента на оператора. Например, чат-бот для записи в банк, для получения карты и сбора обратной связи после получения.

Второй кластер — это роботы, основной задачей которых является замена живого оператора в контакт-центре. Такие роботы ориентированы на широкий круг задач, могут обслуживать клиентов по совершенно разным вопросам и часто неотличимы от живого человека. Например, это может быть виртуальный ассистент банка, который готов проконсультировать по тарифам, перевести деньги в мессенджере, помочь найти ближайший банкомат. А если клиент задает вопрос вне компетенций робота — подключит живого оператора. Мы занимаемся разработкой и внедрением роботов обоих типов.

В каких отраслях и сферах они применяются наиболее активно?

Александр Крушинский: Виртуальные ассистенты с равным успехом могут применяться в совершенно разных отраслях. Например, в нашем портфеле несколько десятков успешно реализованных проектов как в госсекторе, так и в коммерческих компаниях из других отраслей: финансовый сектор, ритейл, телеком и т.д.

Еще одна важная сфера применения чат-ботов — это автоматизация внутренних служб больших компаний. В таких случаях умные помощники призваны решать задачи сотрудников. Например, собственным чат-ботом может управлять HR-служба (собеседование соискателей, оформление отпусков, заказ справок и т.д.) или ИТ-департамент (прием заявок на установку ПО или ремонт/ замену оборудования).

Вы, как разработчик голосовых и текстовых ботов лучше всех можете доступно рассказать какие основные технологии и методы используются для их создания? Какие боты востребованы бизнесом?

Александр Крушинский: Основные технологии, используемые для создания речевых роботов, можно разделить на несколько категорий: бот-платформа для описания сценария диалога и управления контентом, NLU-нейросети для распознавания запросов абонента и генерации индивидуальных ответов, распознавание устной речи, синтез устной речи, речевая аналитика для анализа и самоулучшения роботов, голосовая биометрия. В зависимости от задачи могут использоваться как все эти технологии, так и часть из них. Поясню на примере.

Для создания простейшего кнопочного бота достаточно написать сценарий диалога и подключить его к какому-нибудь мессенджеру. Здесь все просто — нет необходимости в распознавании речи и установке решения в закрытом контуре компании. Для этого вполне подходит использование простейшей бот-платформы (бот-конструктора), где мы пропишем сценарий диалога в виде кнопочного меню мессенджера и ответы бота. Догнать и перегнать: Российские ВКС прирастают новыми функциями 8.9 т

Если мы хотим реализовать более сложные задачи, например, дать возможность пользователям не выбирать варианты обращений из меню, а формулировать запросы текстом, в свободной форме, то нам потребуется подключить NLU-нейросеть. Она сможет обучаться на основе загрузки реальных реплик, понимать то, что хочет человек, и выбирать релевантный ответ из базы знаний. На этом этапе нам будет нужна NLU-модель и инструментарий для ее обучения.

Если мы хотим, чтобы наш робот мог использоваться не только в текстовых каналах, но и консультировать клиентов голосом по телефону — нам потребуется подключить ASR (распознавание устной речи) и TTS (синтез речи), и интегрировать бот-платформу с телефонией.

Можно пойти еще дальше. Так, если мы хотим, чтобы робот не только умел распознавать намерения клиентов и отвечал готовыми формулировками из базы знаний, но и был способен преобразовывать имеющуюся информацию в уникальные ответы, точно соответствующие запросам пользователей, то надо подключать генеративные нейросети. С их помощью робот может не только понять, что человек говорит, но и будет способен формулировать индивидуальные ответы по самому широкому спектру вопросов. Примером такого генеративного чат-бота является широко известный ChatGPT. Но в enterprise-решениях генеративные чат-боты пока практически не используются, т.к. организация хочет полностью контролировать ответы робота, который говорит от ее лица.

Что больше всего волнует компании при интеграции роботов в бизнес-процессы? Назовите типичные проблемы и вызовы, возникающие при этом?

Александр Крушинский: Основные вопросы — это экономический эффект и восприятие робота клиентами.

Ответить на вопрос про экономику довольно просто — достаточно оценить, какой процент обращений робот сможет обслуживать, и сравнить затраты на обслуживание этой доли обращений с затратами на автоматизацию. Для оценки доли обращений мы обычно анализируем весь поток обращений, выбираем тематики, которые встречаются наиболее часто и среди них выбираем те, которые можно автоматизировать с минимальными затратами. Обычно уже на первом этапе внедрения можно автоматизировать порядка 30% потока.

Второй аспект (восприятие робота клиентами) несколько сложнее. Робот, действительно, может ошибаться, давать какие-то нерелевантные ответы и, тем самым, раздражать клиентов. Но есть и известные рецепты, которые позволяют запустить робота максимально мягко для клиентов компании.

Во-первых, все новые сценарии робота надо обязательно тестировать на реальных репликах клиентов. Для этого, например, можно выводить новые сценарии только на часть лояльных пользователей и детально анализировать первые диалоги.

Во-вторых, при запуске новых навыков важно, чтобы у пользователя сохранялась простая возможность переключения на оператора. Часто организации специально затрудняют эту возможность, желая снизить нагрузку на контакт-центр, но тут важно соблюдать баланс. И важно использовать интеллектуальную стратегию подключения оператора, учитывающую «уверенность» робота при распознавании. А также циклы (когда робот пытается дать один и тот же ответ несколько раз), критичность тематики обращений (например, всегда переводить на оператора если пользователь сообщает о краже кредитки) и т.д.

В-третьих, важно следить за тем, чтобы реплики робота были не слишком формализованы и обязательно адаптированы к тому каналу, в котором ведется общение. Например, в текстовых каналах удобно использовать ссылки и подробные описания. А в голосовом канале (по телефону) ответы должны быть максимально краткими и раскрываться через уточняющие вопросы.

В-четвертых, по нашему опыту есть еще такой неочевидный эффект, как привыкание пользователей к боту. С одной стороны, пользователи учатся формулировать вопросы более кратко. С другой — они начинают понимать на какие вопросы робот сможет ответить, а где надо сразу звать оператора. Ну и наконец, пользователи начинают ценить то, что робот доступен 24/7 и отвечает мгновенно.

Какие навыки и знания необходимы для разработки и внедрения текстовых и голосовых ботов? Что говорит опыт вашей компании?

Александр Крушинский: Здесь многое зависит от того, используете ли вы готовый инструментарий типа бот-конструкторов или хотите разработать бота с нуля. Чем более развитый инструментарий используется, тем меньше требований к специалистам заказчика.

Мы, например, предоставляем нашим клиентам бот-конструктор, где, используя визуальный интерфейс, аналитик может собрать из готовых блоков сценарий диалога, обучить нейросеть, протестировать сценарий через встроенный отладчик и опубликовать новый навык робота. То есть, требования к специалистам, конструирующим роботов для коммуникаций, благодаря нашей платформе Digital2Speech, сводятся только к умению пользоваться визуальным конструктором. Программирование может потребоваться лишь для интеграции с системами заказчика.

Тема безопасности и защиты данных встает все острее — мы это видим по ежедневной сводке новостей. Как она решается при использовании роботов?

Александр Крушинский: В ходе диалога человек может озвучить самую разную информацию, в том числе конфиденциальные данные. Поэтому риск утечки информации, действительно, есть. Специфика роботов заключается в том, что средства защиты информации предполагают развертывание всего софта внутри контура заказчика, а нейросети очень требовательны к ресурсам.

Если говорить про опыт BSS, то, хотя мы и предоставляем возможность использования наших решений из облака, 99% наших заказчиков развертывают решения в своем контуре. Поэтому мы уделяем очень много внимания оптимизации всех наших компонентов в части производительности, чтобы они не требовали для своей работы дорогостоящих GPU-серверов, которые сейчас в ЦОДах встречаются довольно редко.

Наверняка компании, стремящиеся к использованию голосовых и текстовых роботов, задаются вопросом, как выбрать подходящую под свои задачи и цели платформу? Подскажите, какие факторы будут ключевыми? На что необходимо обратить пристальное внимание?

Александр Крушинский: Я могу рассказать на чем концентрируемся мы, при разработке своей бот-платформы.

Во-первых, это модели распознавания и синтеза речи. Именно модели распознавания определяют точность ответов робота. Точность моделей складывается из нескольких составляющих: базовая архитектура нейросетей, наличие предобученных доменных моделей и возможности дообучения под лексику конкретного заказчика. Все это вместе определяет, насколько хорошо модель начнет работать со старта, и как быстро будет дообучаться в процессе эксплуатации. Помимо этого, именно нейросети, используемые в моделях распознавания, требуют значительных серверных мощностей. В зависимости от их оптимизации, требования к железу могут отличаться не только в разы, но и на порядки значений.

Второй фактор после качества моделей — это инструментарий бот-платформы. В нашем случае, инструментарий — это визуальный конструктор, в котором можно из готовых компонентов собрать сценарий диалога, протестировать его, дообучить модель распознавания. Причем мы стараемся, чтобы инструментарий был ориентирован скорее на аналитиков, чем на разработчиков. Это очень важно для развития заказчиками робота своими силами, вместо заказа всех доработок у нас или найма каких-то отдельных разработчиков и датасайнтистов себе в штат.

Удобство инструментария имеет решающее влияние на скорость разработки сценариев робота и скорость развития его навыков. Здесь могу вспомнить проект, которым я лично очень горжусь. В начале пандемии ковида при введении локдауна, к нам обратился клиент с довольно нестандартной просьбой. Это был региональный контакт-центр, который обеспечивал оформление пропусков на перемещение. Клиент позвонил в воскресенье днем и попросил поставить робота… в понедельник. В контакт-центре было 60 операторов в пиковой смене, а в связи с введением карантина нагрузка выросла до 300 одновременных звонков, и контакт-центр задыхался от потока обращений. Мы этот вызов приняли, и в течение двух суток спроектировали сценарии, интегрировали робота с внутренней системой выдачи пропусков и запустили его в работу. Причем все компоненты были развернуты в закрытом контуре заказчика. Таким образом, уже во вторник днем робот принимал звонки. Мы, конечно, эти два дня работали по 14 часов, но, если бы не тот самый инструментарий, о важности которого я говорю, этого было бы недостаточно.

Еще одним ключевым фактором является возможность установки всех компонентов решения в защищенном контуре заказчика. С одной стороны, это может показаться избыточным требованием — можно построить решение на облачных сервисах распознавания и синтеза речи, например, на базе сервисов «Яндекса». Но абсолютное большинство крупных заказчиков предпочитают ставить решение в контур, обеспечивая таким образом защиту конфиденциальных данных и максимальный контроль решения.

Стоит обращать внимание на требование омниканальности к решению. Об этом порой забывают. Начиная внедрение бота с текстового канала, потом оказывается, что для запуска голосового робота инструментарий не подходит, и надо переписывать все сценарии на другом решении. В нашем случае для запуска голосового робота достаточно к бот-платформе подключить модули распознавания и синтеза речи, и может быть подкорректировать реплики, чтобы сделать их более комфортными для восприятия на слух.

Еще у нас есть модуль голосовой биометрии, который позволяет верифицировать человека по его речи. И модуль речевой аналитики, с помощью которого заказчики могут проводить регулярный анализ диалогов клиента с оператором, а также исследовать диалоги клиента с ботом для улучшения его качества.

Есть мнение, что внедрение роботов для коммуникаций с клиентами — это не только технологическая необходимость, но и дань моде. К тому же, многие клиенты, например, в банках и телекоме, недолюбливают ботов и часто стремятся прекратить общение с ними. В этой связи возникает вопрос: есть ли измеряемый эффект от использования роботов компаниями-заказчиками? Действительно ли умные помощники не только снижают нагрузку на контакт-центр, но и обеспечивают совершенствование клиентского опыта, улучшают взаимодействие с клиентами?

Александр Крушинский: Снижение нагрузки на операторов контакт-центра и сокращение фонда оплаты труда – это исторически самые понятные цели при внедрении речевых роботов. В некоторых случаях уже можно убрать 70% нагрузки, но в практике перехода на роботов нормальными считаются показатели от 20% до 50%.

Если говорить про метрики клиентского обслуживания, то, с одной стороны, надо понимать, что клиентам в большинстве случаев пока приятнее общаться с живыми людьми, а не с роботами. Но, с другой стороны, очень часто клиенты не могут дозвониться до оператора без помощи робота. Им нужно продираться через IVR-меню: «Нажмите цифру 0… Нажмите цифру 1…». Преодолев это меню, человек попадает на режим ожидания, когда ему предлагают ждать какое-то количество минут, пока освободится оператор. А если контакт-центр не работает в режиме 24/7, то оператор может быть недоступен ночью. Дозвонившись, наконец, до оператора, клиент объясняет суть своего обращения, но должен снова ждать, так как оператору требуется время на то, чтобы найти ответ.

Понятно, что в идеальном мире, где клиент быстро попадает на оператора, а тот может оперативно дать ответ, общение с живым человеком лучше. Однако, как мы видим, в реальности часто все намного сложнее. Если мощности контакт-центра ограничены и часто возникают очереди к операторам, бот выступает очень эффективным помощником, так как позволяет снять нагрузку с оператора и дать клиенту возможность обойтись без использования IVR-меню, и не ждать ответа оператора. Если речевой робот подключен к различным базам данных, то клиент получает мгновенный и релевантный ответ.

Можно сказать, что пока роботы, в целом, уступают по уровню консультаций наиболее квалифицированным операторам, но, как правило, уже справляются не хуже операторов среднего уровня. Все-таки живой человек может ошибаться, его общение порой зависит от настроения и самочувствия, а робот никогда не ошибается, так как подключен к различным внутренним системам, его реплики выверены, он всегда вежлив. Я считаю, что хорошо организованный робот не только выгоден в экономическом плане для компании, но и может существенно улучшить клиентский опыт, обеспечив мгновенную, грамотную и безотказную реакцию на обращения.

Какие тенденции и инновации в области речевых роботов вы считаете наиболее перспективными?

Александр Крушинский: Нейросети сейчас развиваются очень быстро, но самое перспективное направление — это большие языковые модели (LLM) с примером реализации в виде ChatGPT. В принципе, сама технология появилась еще в 2019-м году, но в 2022-м произошел качественный скачок с появлением модели уже близкой к искусственному интеллекту, как бы громко это не звучало.

Пока их использование в качестве полноценного виртуального ассистента ограничено рядом технических моментов — очень серьезными требованиями к железу, склонностью к «галлюционированию» (уверенным, но не имеющим отношения к реальности, ответам), низким качеством некоммерческих моделей. Но эти ограничения будут постепенно сниматься, и в перспективе нескольких лет GPT-like нейросети, типа ChatGPT, начнут активно использоваться и для создания корпоративных решений в области автоматизации общения с клиентами, и для автоматизации многих внутренних операций.

Мы со своей стороны внимательно следим за развитием этой ветки технологий и уже довольно активно используем в своих внутренних процессах. Наша цель — создание большой языковой модели (LLM), ориентированной на клиента. Она сможет соответствовать потребностям корпоративных клиентов и их конечных заказчиков, благодаря точному пониманию контекста, генерации и прогнозированию нового контента.

В дополнение к нашей омниканальной платформе и реализованным в ней речевым решениям, LLM предоставит большую гибкость, когда требуются ответы на запросы, темы которых выходят за рамки реализованных сценариев. Обогатит базу часто задаваемых вопросов и позволит автоматически создавать статьи в базе знаний. Поможет внедрить улучшенную кластеризацию диалогов, обобщение, возможности «семантического поиска» и «семантического облака», обеспечивающие контекстно-зависимый поиск, сравнение сходства высказываний и другие новые функции.

Все это поможет добиться большей удовлетворенности клиентов, снижения затрат за счет автоматизации и увеличения продаж, помимо других преимуществ для бизнеса.

Как вы видите будущее речевых роботов и их влияние на мир технологий и обслуживания клиентов?

Александр Крушинский: Уже сейчас роботы могут выполнять многие задачи, снимая, как правило, до 50% нагрузки с контакт-центров, а в некоторых случаях и до 70%. При этом технологии развиваются очень быстро, нейросети умнеют на глазах, появляются готовые решения, которые снижают порог входа для заказчиков. Например, у нас есть целый ряд готовых отраслевых решений с предобученными сценариями консультирования по наиболее частым запросам. И это не только снижает порог входа заказчиков, но и существенно ускоряет запуск робота.

AI технологии должны кардинально улучшить качество обслуживания. Простые вопросы и консультации будут полностью закрывать виртуальные ассистенты, обеспечивая мгновенный отклик на запрос. А сложные задачи останутся за живыми людьми. Но благодаря консультационной поддержке AI, такие операторы будут не просто говорящими головами, отвечающими по жесткому скрипту, но станут глубокими экспертами и помощниками в любой нестандартной ситуации.

Заказать демонстрацию речевых решений и чат-ботов >>>