Обзор Microsoft Azure: ультрасовременная обработка голоса

Преобразование речи в текст Microsoft Azure - одна из самых передовых платформ распознавания голоса. Как часть ассортимента продуктов Microsoft Cognitive Speech Services, он использует алгоритмы глубокого обучения для преодоления плохого качества звука и может адаптироваться к различным стилям речи для точной транскрипции звука. В этом обзоре Microsoft Azure Speech to Text мы подробно рассмотрим эту услугу.

Стоит отметить, что Microsoft Azure Speech to Text - нетрадиционная программа для диктовки, удобная для пользователя. Вместо этого это ориентированная на разработчиков платформа, призванная помочь предприятиям создавать, тестировать и управлять своими собственными продуктами. Если вы просто хотите расшифровать пакет аудиофайлов, альтернативные приложения для преобразования речи в текст могут быть лучшим вариантом. Взгляните на наше лучшее руководство по программному обеспечению для преобразования речи в текст, чтобы узнать о лучших альтернативах.

Речь в текст Microsoft Azure: планы и цены

Используя Microsoft Azure Speech to Text, вы можете бесплатно транскрибировать до пяти часов аудио и создавать одну настраиваемую модель голоса в месяц. Однако с бесплатным планом одновременно доступен только один одновременный звуковой запрос, а это означает, что этот вариант не подходит для большинства компаний.

Выставление счетов за речевую службу Azure делится на интервалы в одну секунду.

Если вы хотите транскрибировать несколько речевых клипов одновременно, вам необходимо перейти на стандартную систему ценообразования Azure. Это стоит 1 доллар за час аудио и поддерживает до 20 одновременных запросов. Дополнительная плата взимается, если вам нужно использовать настраиваемую аудиомодель или расшифровывать многоканальные звуковые файлы. Эти дополнительные услуги стоят 1,40 и 2,10 доллара за аудио час соответственно.

Хотя Microsoft указывает свои цены в формате «за аудио-час», что является отраслевым стандартом, фактическое выставление счетов делится на интервалы в одну секунду, поэтому вы не будете платить за большее время обработки, чем требуется.

Преобразование речи в текст Microsoft Azure: особенности

Ключевой функцией Azure «Преобразование речи в текст» является доступ к мощной системе обработки естественного языка Microsoft. За последние несколько лет речевой искусственный интеллект Microsoft достиг нескольких важных этапов. Это означает, что теперь он может выполнять задачи, которые раньше были невозможны для службы распознавания речи, такие как точная расшифровка перекрестных разговоров во время разговоров в небольших группах.

Служба преобразования речи в текст Microsoft Azure может интегрироваться с Office 365 для обеспечения оптимальной точности.

Azure работает с десятками языков и диалектов и может быть обучен с использованием настраиваемых моделей распознавания речи, чтобы лучше адаптироваться к стилю речи пользователя, фоновому шуму среды и словарному запасу. Если ваша организация уже привержена экосистеме продуктов Microsoft, вы можете использовать пользовательские данные Office 365, чтобы повысить точность распознавания речи для конкретных условий организации. И, что важно, это можно сделать без ущерба для безопасности данных, поскольку преобразование речи в текст можно запускать локально.

Преобразование речи в текст Microsoft Azure: настройка

Microsoft Azure был разработан для разработчиков, а не для потребителей. Это означает, что его настройка - сложная и в некоторой степени сложная процедура, которую лучше всего доверить кому-то с большим количеством технических ноу-хау.

Настроить Azure не так-то просто, если у вас нет опыта программирования.

Самый быстрый способ настроить Azure - использовать Azure Speech SDK на таком языке программирования, как Java или C ++. Для этого вам нужно будет зарегистрировать бесплатную учетную запись Azure и создать пустой проект в своей среде разработки. Затем вам нужно будет использовать Microsoft Visual Studio и написать небольшую программу для инициализации объекта SpeechRecognizer Microsoft.

Преобразование речи в текст Microsoft Azure: интерфейс

Как и другие платформы массовой транскрипции, Microsoft Azure Speech to Text предназначена для работы в качестве интерфейса прикладного программирования (API), добавления в программы Office 365 или интеграции в новые платформы и службы. Из-за этого не существует единого интерфейса Azure Speech to Text. То, что увидит конечный пользователь, зависит от того, как интегрирована речь Azure в текст.

Интернет-портал Azure интуитивно понятен и прост в использовании.

Тем временем разработчик, управляющий Azure, будет делать это через онлайн-портал Microsoft Azure, который выглядит современным и в котором легко ориентироваться. Чтобы найти страницу ресурсов речевых служб, требуется всего несколько минут, и после добавления экземпляра в вашу учетную запись предупреждения и использование мониторинга можно будет просмотреть в одном окне.

Преобразование речи в текст Microsoft Azure: производительность

В рамках нашего обзора речи в текст Microsoft Azure мы хотели увидеть, как эта платформа справляется с задачей обработки необработанных голосовых записей, поэтому, как только наша учетная запись Azure была готова к работе, мы загрузили серию клипов с различными уровнями фонового шума. . В целом, Azure хорошо обработала наши образцы, поскольку в ходе оценки мы обнаружили лишь несколько ошибок.

Включение настраиваемой модели речи Azure повысило точность нашей транскрипции.

Поначалу Azure немного затруднялся обрабатывать необычные или специальные фразы, такие как названия спортивных команд и научные термины, но эта проблема была быстро решена путем включения опции вывода настраиваемой модели. Как только мы активировали эту опцию, Azure смогла адаптироваться к используемому нами уникальному словарю и стилю речи.

Преобразование речи в текст Microsoft Azure: Поддержка

Чтобы узнать, как взаимодействовать с SDK Azure Speech Services на разных языках программирования и интегрировать функции Azure Speech to Text в свою платформу, вам обязательно понадобится помощь. К счастью, Microsoft создала полный каталог учебных материалов для платформы Azure, в котором вы найдете примеры кода и полезные советы.

Раздел обучения на сайте Azure содержит множество полезных ресурсов.

Кроме того, все клиенты Azure получают бесплатную поддержку по выставлению счетов и управлению подпиской, доступ к которой можно получить через систему заявок. Более подробная поддержка может быть добавлена ​​к вашей учетной записи за регулярную плату, начиная с 29 долларов в месяц.

Microsoft Azure Speech to Text: окончательный вердикт

Платформа Azure Speech to Text использует передовые технологии для предоставления почти идеальной услуги транскрипции. Он наиболее подходит для предприятий, уже вложивших средства в экосистему Microsoft Office 365, поскольку пользовательские модели голоса и словаря могут быть безопасно сгенерированы из вашего существующего архива документов. Некоторым малым предприятиям может быть сложно использовать Azure, поскольку ее правильная настройка требует внимания квалифицированного облачного разработчика Microsoft.

Соревнование

Amazon Transcribe, Google Cloud Speech-to-Text и Watson Speech to-Text являются прямыми конкурентами Microsoft Azure. Все эти три платформы также способны точно выполнять пакетную транскрипцию большого объема. Google Cloud - единственный близкий конкурент, способный работать с большим количеством языков, чем Azure, но он дороже: начальная цена составляет всего 0,006 доллара за 15 секунд по сравнению с 0,017 доллара за минуту в Azure (0,00425 доллара за 15 секунд).

Чтобы найти другие альтернативы Microsoft Azure Speech to Text, ознакомьтесь с нашим руководством по лучшему преобразованию речи в текст.

Интересные статьи...