Обзор программного обеспечения для транскрипции Sonix.ai

Каждый инструмент, который транскрибирует, ориентирован на определенную нишу, и Sonix выбрала те, которые записывают встречи или презентации, а затем нуждаются в печатной версии для поиска или распространения.

Следовательно, он может быть одинаково полезен как для студента, так и для руководителя, предоставляя транскрипции, которые можно легко проиндексировать для использования в будущем.

Но для успешного решения этих задач программное обеспечение должно быть точным и доступным.
Является ли Sonix.ai таким инструментом, и может ли онлайн-сервис конкурировать с установленным приложением?

  • Хотите попробовать Sonix.ai? Посетите веб-сайт здесь

Планы и цены

Как и во многих других услугах по расшифровке текста, модель затрат Sonix основана на времени. В частности, продолжительность любой записи, которую вы загружаете в службу для обработки, и стоимость этого ресурса составляет 10 долларов в час, если вы используете стандартную услугу с оплатой по мере использования.

Стоимость в час может быть снижена до 5 долларов, если вы подпишетесь на услугу подписки Premium за 22 доллара в месяц для каждого пользователя. Кроме того, оптовые скидки доступны для тех компаний, которым требуется более 100 часов записи в месяц.

Стандартный план имеет самые основные функции, а Премиум добавляет дополнительные, такие как многопользовательский доступ и совместное использование команды. Кроме того, в Enterprise есть все, что предлагает Premium, с большим количеством дополнительных административных функций и расширенной моделью поддержки.

Что касается услуг транскрипции, Sonix является одним из самых дорогих и, конечно же, не то, что большинство студентов или домашних пользователей могли бы разумно себе позволить.

Дизайн

Сайт my.sonix.ai имеет исключительно чистый дизайн, а создание учетной записи бесплатное.

На момент написания это исключительно веб-сервис, и у Sonix нет мобильного приложения для захвата и отправки для обработки аудиозаписей.

Однако, как мы расскажем позже, есть простые способы решения этой проблемы, которые несколько решают проблему отсутствия мобильного приложения.

Отправной точкой для любого задания по транскрибированию является панель управления Sonix.ai, где вы можете увидеть аудио, которое уже было расшифровано, и добавить новые для обработки.

Поскольку эта система была разработана для нескольких пользователей, она включает в себя систему виртуальных папок для организации транскрипции любым удобным способом.

При нажатии кнопки «загрузить» пользователь попадает на страницу, где несколько файлов могут быть загружены в систему, и, если в учетной записи достаточно средств на счете, они могут быть обработаны.

Поддерживаются все стандартные форматы аудиофайлов, включая wav, mp3, mp4a, aiff, acc, ogg и wma, а также вы можете загружать некоторые структуры упаковки видео. Максимальный размер файла составляет 4 ГБ, поэтому перед загрузкой большого видеофайла с разрешением 4K мы рекомендуем использовать другой инструмент для разделения звука, чтобы ускорить загрузку.

Хороший способ ускорить загрузку - использовать облачное хранилище, такое как Google Drive, One Drive, Box или Dropbox, и связать его напрямую с учетной записью. Вы также можете отправить системе электронное письмо с помощью Gmail, как средство создания более элегантного рабочего процесса, чем размещение файлов на веб-странице.

Эта автоматизация обеспечивается через Zapier, что обеспечивает гораздо более широкую интеграцию, если бизнес, использующий ее, вложил средства в эту технологию для соединения своих бизнес-процессов.

Еще одним приятным моментом является то, что наряду с аудио- или видеофайлом вы можете включить существующую транскрипцию, чтобы ускорить процесс и повысить точность.

Еще одним приятным моментом является то, что вместе с аудио- или видеофайлом вы можете включить существующую транскрипцию, чтобы ускорить процесс и повысить точность.

Из-за природы облачной обработки невозможно оценить, насколько быстрой или медленной может быть обработка, но, по нашему опыту, Sonix.ai относительно быстр. Обычно на расшифровку требуется от 10% до 20% времени в процессе записи. Поэтому завершение 10-минутной записи обычно занимает менее 2 минут.

Вам не нужно следить за обработкой, так как система отправит вам уведомление по электронной почте, когда работа будет выполнена, вместе со ссылкой на новую расшифровку.

После обработки файла вы можете открыть его на странице редактирования, чтобы просмотреть результаты, а также экспортировать текст в широкий спектр полезных форматов, включая те, которые определены некоторыми приложениями как субтитры.

Количество языков и диалектов, поддерживаемых системой, составляет 36, включая несколько стран, говорящих на английском, французском, кантонском, мандаринском, португальском и испанском языках, а также все распространенные западные и восточноевропейские языки, а также некоторые азиатские и арабские языки.

Записи

Наряду с работой, которая была проделана в ИИ, необходимом для интерпретации шумов, производимых людьми, вероятно, страница записей представляет собой значительные усилия по кодированию.

Здесь и звук, и связанная с ним расшифровка могут быть сравнены и вручную улучшены с подробностями об изменениях выступающих и исправлениями неправильных интерпретаций.

Для всех, кто работает над расшифровкой стенограммы, чтобы отшлифовать текст, на этой странице указано местоположение угольного забоя. Имеет смысл, что в эту часть были вложены некоторые усилия, так как она очень проста в использовании и отслеживании.

В попытке указать пользователю, где могут возникнуть проблемы, Sonix.ai закодирует содержимое цветом, чтобы выделить те разделы, в которых он менее уверен. Эта функция может быть полезной, хотя Sonix.ai может допускать ошибки даже в тех частях, где он считает, что транскрипция имеет статус «Очень достоверно».

Лучшие аспекты этой страницы - это синхронизация воспроизведения звука и текста, так что размещение курсора в тексте перемещает позицию воспроизведения в один и тот же раздел.

Наряду с простым редактированием, также можно выделять разделы в различных стилях и делать заметки, которые будут сопровождать транскрипцию.

Вы также можете настроить тайм-код, что особенно полезно, если запись начинается с длинной паузы или нежелательной преамбулы.

Точность

Sonix описывает Sonix.ai как «лучшее программное обеспечение для автоматической транскрипции на базе передового ИИ».

Учитывая результаты нашего тестирования, мы бы охарактеризовали этот продукт как сильно зависящий от качества записи и многих других факторов, которые трудно контролировать.

При обработке наших классических исторических речевых записей было действительно трудно с некоторыми динамиками, даже если они казались нам ясными.

Эти результаты резко контрастировали с некоторыми другими одновременными записями, точность которых была приемлемой, но вряд ли звездной.

Мы пришли к выводу, что подход, принятый Sonix, делает несколько предположений, которые могут работать или нет, в зависимости от говорящего и качества записи.

Что было интересно, так это то, что служба будет кодировать свою транскрипцию цветом в зависимости от того, насколько она уверена в том, что говорится, и этот самоанализ очень показателен.

В некоторых случаях он правильно определит, что раздел может быть подозрительным, но в других частях он уверен, что раздел был полностью неверно расшифрован.

Несколько распространенных проблем, кажется, бросают вызов, и одна из них - люди, которые не говорят грамматически совершенной прозой. Чтобы сделать свою речь более прямой, они удалили некоторые слова из предложений, сделав их стиль более драматичным. Когда они расшифровываются Sonix, он, кажется, полон решимости добавить эти слова обратно, чтобы соответствовать своей внутренней грамматической модели, а не к тому, что было фактически произнесено.

Транскрипция лучше читается как документ, но она не совсем отражает то, что было сказано.

Sonix, безусловно, лучше, когда качество записи и четкость динамика высоки, как мы доказали с небольшим клипом Стивена Фрая, читающего Гарри Поттера. Но не всегда можно так контролировать качество звука, и в этом тесте все равно были ошибки.

Еще одна проблемная область - это официальные названия и технические слова или сокращения. Их можно решить, добавив их в настраиваемый словарь, но это требует работы, чтобы система могла лучше понимать, когда используются имена или акронимы.

Для тех, кому нужна идеальная транскрипция слова, у Sonix есть набор связанных профессиональных транскриберов, которые могут работать с записью и решать эти проблемы, но это в некоторой степени сводит на нет цель обработанной транскрипции.

Безопасность

В центре внимания безопасности Sonix.ai находятся серверы, на которых обрабатывается звук и хранятся транскрипции.

Весь трафик шифруется с использованием TLS (Transport Layer Security), и как только файлы находятся на сервере, который защищен несколькими уровнями межсетевого экрана, защита от вторжений и все данные защищаются кольцевым шифрованием AES-256 на стороне сервера. И компания обещает, что у сотрудников не будет доступа к записям или транскрипциям, если на это не будет дано явное разрешение.

Критическая проблема с этим подходом заключается в том, что простой логин и пароль могут все это обойти. Sonix.ai не имеет двухфакторной аутентификации и не имеет легкодоступного журнала, в котором указано, кто и когда обращается к файлам.

С точки зрения безопасности это вполне можно рассматривать как чрезмерную уверенность в целостности тех, кто использует систему, чтобы не делиться записями с другими людьми за пределами бизнеса или сохранять потенциально конфиденциальные файлы, когда они уходят из компании.

Короче говоря, безопасность должна быть лучше, а отслеживанию или активности пользователей должен быть отдан больший приоритет.

Окончательный вердикт

Учитывая относительно высокую стоимость, мы ожидали, что Sonix будет работать лучше, чем она.

Возможно, нам не повезло с выбором того, что нужно перекодировать, но, похоже, он все равно допускал чрезмерное количество ошибок.

Положительным моментом этого уравнения является то, что это быстрая и удивительно простая система в использовании, хотя мы рекомендуем запустить несколько примеров записей с помощью этого решения, прежде чем оформлять подписку.

Самая большая проблема с Sonix - высокая стоимость, и даже если это подходящий инструмент для ваших конкретных требований, есть более дешевые способы преобразования звука в текст в другом месте.

Интересные статьи...