Вокалматический обзор

Vocalmatic - это онлайн-сервис транскрипции, созданный канадской компанией Enactics Inc.

Согласно его сайту, он существует, чтобы «помочь людям, которые работают с аудиозаписями, сэкономить время, преобразовывая свои аудио и видео в текст».

Что делает этот особенный, учитывая количество различных доступных онлайн-инструментов для транскрипции?

Хотите попробовать Vocalmatic? Посетите веб-сайт здесь

Планы и цены

Когда вы подписываетесь на Vocalmatic, вам сразу же дается 30 минут времени для транскрипции, а когда оно заканчивается, можно купить дополнительные часы, начиная с 15 долларов за один час.

Чем больше часов вы покупаете, тем меньше они стоят: в среднем 90–100 часов обходятся всего в 6 долларов в час.

Эти цены указаны для индивидуальных пользователей, а Enactics предлагает гибкие цены для предприятий, где доступ требуется нескольким пользователям, а объемы, предположительно, будут высокими.

Если у вас массовая потребность, лучший способ сократить расходы - использовать дневной абонемент. Это позволяет неограниченное использование службы в течение дня с лимитом трех файлов в час.

Использование этих пропусков на один день стоит 15 долларов, три дня - 17 долларов, а семь дней - 25 долларов, и если вы можете организовать всю свою работу по блокам, то это самый дешевый способ использовать Vocalmatic.

Дизайн

Даже по стандартам онлайн-транскрипции Vocalmatic является базовым. Но, наоборот, это делает его удивительно простым в использовании даже для людей с ограниченными компьютерными навыками.

Простой четырехэтапный процесс начинается с того, что вы определяете, если у вас есть аудио, видео или исключительно для американских клиентов, вы хотите позвонить и напрямую расшифровать свои слова.

Большинство пользователей будут использовать аудио- или видеофайлы, которые на шаге 2 загружаются на сайт Vocalmatic. К поддерживаемым в настоящее время типам относятся: аудиофайлы mp3, m4a, mp4, flac, ogg, wav, aac, opus, oga, mogg, webm и wma.

Третий шаг - определить национальность говорящего, а четвертый шаг - сказать, как вам понравится результат.

Языки, безусловно, сильная сторона этой системы, так как в настоящее время она транскрибирует английский, испанский, французский, немецкий, португальский, итальянский, голландский, польский, чешский, румынский, китайский (мандаринский диалект), китайский (кантонский диалект), японский, филиппинский, вьетнамский, арабский , Персидский, хинди, тайский, корейский, урду, турецкий, иврит, греческий, болгарский, русский, финский, шведский, датский, африкаанс, амхарский, армянский, азербайджанский, индонезийский, малайский, бенгальский, каталонский, баскский, галисийский, грузинский, гуджарати , Хорватский, зулусский, исландский, яванский, каннада, кхмерский, лаосский, латышский, литовский, венгерский, малаялам, маратхи, норвежский, сербский, украинский, сингальский, словацкий, словенский, сунданский, суахили, тамильский и телугу.

Каким бы впечатляющим ни был этот список, не все акценты и диалекты в каждом языке распознаются.

Параметр вывода по умолчанию использует простое форматирование, а вариант SRT предназначен для тех, кто создает субтитры для видео.

После того, как вы выберете этот вариант и предоставите файл, если у вас останется достаточно времени в учетной записи, система начнет преобразовывать файл в текст.

Электронное письмо отправляется с объявлением о том, что система запустила процесс, а другое отправляется после его завершения.

Сколько времени это займет, полностью зависит от того, насколько загружены серверы Vocalmatic, но в целом мы обнаружили, что это было близко ко времени записи или, может быть, немного дольше.

Обработка одной 19-минутной записи заняла около 28 минут, но другие более короткие части были пропорционально быстрее.

После обработки файла вы можете войти в редактор и посмотреть, как он работает, и внести некоторые изменения в форматирование и содержимое.

Чего эта система не делает, так это грамматического форматирования. Он не вставляет символы возврата каретки между предложениями, независимо от разговора, и не всегда использует заглавные буквы.

И он помещает временной код между фрагментами транскрипции, даже если вы не используете его для создания файла SRT.

Аудио можно воспроизвести в редакторе содержимого, но он не пытается показать вам, где в транскрипции находится звук.

Если вы "довольны" результатами, текст можно экспортировать как документ Word или текстовый файл в режиме по умолчанию или как файлы SRT, если вы выбрали этот режим вывода.

Точность

В часто задаваемых вопросах по Vocalmatic говорится: «Мы ожидаем точности 80–90% для чистого звука. При сильном фоновом шуме или при одновременном разговоре людей точность транскрипции может составлять менее 10% ».

Что ж, в ограниченном тестировании даже фрагментов аудиокниг с максимально чистым звуком нам не удалось достичь такого уровня точности.

Даже при самых лучших попытках он часто повторяет часть абзаца или слов, ошибается в названии, так как он правильно понял предыдущее предложение, и засоряет транскрипцию ошибками.

Когда записи не являются безупречными, как, например, наши тесты исторических речей, результаты могут быть непонятными.

Что нас больше всего беспокоит, так это то, что при возникновении проблем со словом или фразой Vocalmatic случайным образом выбрасывает отдельные буквы. В английском языке, который мы использовали для тестирования, буква «y» сама по себе не является словом, как и «m», «k» или «t».

То, что вывод не соответствует ни одному словарю или определенным грамматическим формам, не является проблемой для программного обеспечения. Ему также не хватает понимания контекста, поскольку он неоднократно интерпретировал сына как «Солнце».

Когда вы учитываете все исправления и правильно добавляете точки, запятые и заглавные буквы, даже лучшие попытки требуют существенной корректировки, чтобы считаться точными.

Окончательный вердикт

Эта услуга не из дешевых, не такая быстрая и не очень точная.

Радость от 30 минут свободного времени исчезает тревожно быстро, даже если раствор очень доступен и очень прост в использовании.

Одно из преимуществ, которое дает потенциальному клиенту свободное время, заключается в том, что оно позволяет вам загрузить пример записей, которые вам, вероятно, потребуется расшифровать, и посмотреть, как это работает.

Мы продолжим, только если он вернет текст, который обычно представляет то, что было сказано в аудио, но попробуйте другие варианты, прежде чем платить за этот.

По сравнению с некоторыми другими вариантами, в первую очередь Transcribe by Wreally, Trint и Happy Scribe, это недостаточно точно, чтобы окупить затраты.

Может быть, мы недобры, и он великолепно транскрибирует суахили или другие языки, но, основываясь исключительно на его усилиях с английским, мы бы выбрали что-то другое.