23 марта 2019 г., 12:52

408

Балаболка 3.0

15 понравилось 40 комментариев 2 добавить в избранное

Несколько заметок о синтезе речи

Как-то гуляя по заболоченным переулкам, перепрыгивая с кочки на кочку, дыша свежим весенним воздухом я подумал (да такое иногда случается), что наверное очень скоро создать аудиоверсию любой книги станет очень просто. Ну как скоро? Лет 20-30 и технологии достигнут такого уровня, что легко можно будет получить хорошо озвученный текст приличного качества.
ИИ возьмет большую ложку, и зачерпнув голоса Клюквина, Чонишвили, Князева, Багдасарова и так далее, синтезирует какой-нибудь Орфей 2050.
Конечно это будет не уровень Александра Клюквина, но вполне достаточно чтобы с комфортом слушать книгу.
Действительно уже сейчас ИИ рисует картины, пишет музыку, пишет книги. Понятно, что это только первые шаги, но малыш растет очень быстро. И причин тому, чтобы это развитие прекратилось как-то не заметно.
Не знаю хорошо это или плохо. Наверное не так и не эдак. Такова реальность и никуда от этого не деться.

И тогда наверное количество востребованных исполнителей аудиокниг сократится чуть ли вдвое. На первое место выйдут актерские данные и умения, уже будет не достаточно ясно и четко, без ошибок прочитать текст. Возможно аудио спектакли по книгам станут более востребованным форматом, чем чтение одного человека.
Вряд ли, что всё изменится коренным образом. В конце концов тем же бумажным книгам предрекали смерть уже не раз за последние 10 лет, однако что-то пока не видно, что эти пророчества сбылись )))

Возможно сейчас трудно это представить, слушая по гугловской ТТS читалку, хотя многим коллегам по цеху этот вариант очень даже подходит )))
Однако, немного побродив по сети, я обнаружил, что дело хорошо двинулось вперед. И всё дело в цене вопроса, а это значит, что уже скоро всё это будет общедоступно и бесплатно.

Вот например Yandex SpeechKit Можете сами вставить небольшой кусочек текста и поиграться с голосами. Самое забавное, что там можно выбрать эмоцию. Пока только три, но уже интересно.

А вот российская разработка по российским ценам 1сек за 10 копеек. Понятно, что это не для частного использования ))) Однако разработчики заявляют, что учли особенности русской речи и, что больше не будет проблем с ударениями ))) Также они утверждают, что эту технологию можно встроить куда угодно и разумеется также можно поиграться с эмоциями и разными голосами.
Вот некоторые примеры голосов.
А это видео с Ютуб, озвученное с помощью этой технологии. По -моему это Владимир 22 кГц (над именами им точно нужно поработать, хотя это лучше чем Локал Фемали 3)

Еще один сервис Narro, с помощью которого можно озвучить как текст (платно), так и просто статью с сайта с помощью плагина. После простой регистрации тоже можно поиграться. Из русских там живут Татьяна и Максим ))) Мне понравились эти ребята, хоть и не без огрехов )))
Есть бесплатная версия, но там куча ограничений и с его помощью книжку не озвучишь. Если конечно вы не знаете куда девать деньги )))
Вот пример Максима, извини Наташ varvarra , что взял твою замечательную рецензию за образец, без спроса )))
А это Татьяна со статьей с Мира Фантастики )))
Стоит промотать первые секунд 15, чтобы не слышать эти слэши и дабл дабл дабл ю )))

Друзья, что вы думает на эту тему?
Есть ли у вас какие-то находки?

В группу Мир аудиокниг Все обсуждения группы
15 понравилось 2 добавить в избранное

Комментарии 40

Находки есть! Мне убить хочется этот электронный голос, порвать наушники, когда этот самый неизвестно кто портит книгу! Думаю, я надолго остановилась на профессиональных живых исполнителях, и это обусловлено именно опытом проб и ошибок. Допускаю такой вариант, что мне просто не попадалось ничего стоящего из голосов балаболки, но впечатление и отвращение как в детстве - всерьёз и надолго.

Мне убить хочется этот электронный голос

Так началась 5 мировая война )))
Хотя я не так эмоционален, но я тоже выберу живой голос ))) Хотя есть такие голоса, что лучше так почитать.

Librevista,

Хотя есть такие голоса, что лучше так почитать.


Бесспорно. Думаю, имён тут называть не будем, а то есть риск соскочить с темы.

kupreeva74, Но всё таки прогресс есть, по сравнению с тем что было))))

Librevista, А вот тут просто не буду спорить. Да, прогресс есть. Но голоса в читалке и живое исполнение книги далеки друг от друга также, как театр роботов и театр с актёрами-людьми. Да, интересно (на один раз), но эмоции все, образно говоря, силиконовые, а в книгу вложены живые чувства. Нестыковочка. Лев Толстой и исполнение балаболки? НЕТ! Клюквин!!!

kupreeva74, Конечно, сейчас сравнения человеческим исполнением и речи не идет )))
Можно только сравнивать эти технологии между собой, конкуренции человеку они пока составить не могут.

Включила видео и только под конец заметила крохотные металлические нотки и странные интонации, которые свойственны балаболкам. Предложение сверху я сначала пропустила. Действительно, если не концентрировать внимание на голосе перевода, а слушать оригинального выступающего, как делала я, то можно даже не обратить внимание на искусственный голос.

В цепочке последовательных переходов Бумажная книга - Электронная книга - Аудиокнига - Балаболка каждый шаг требует сознательного напряжения/освоения. Вопрос в удобстве и целях. Текст всегда один и тот же! А если вам нужны рюшечки то это ваше законное право.

tortila,

Вопрос в удобстве и целях.

Абсолютно верно. Ни о каком соревновании форматов речь не идет.

Просто текст - статью там, доклад вполне можно с подобной говорилкой прослушать...
Но художественную книгу? Если она мне нравится, то ни за что!

OksanaPeder, В принципе именно на такие крохотульки тексты сайты эти технологии и делают упор в своем продвижении. Сами понимают, что художественные тексты пока не по плечу

Я уже созрела для того, чтобы освоить говорилку. Я долго к этому шла, и вот настал этот момент. Буду пробовать:)

ari, Только стоит учитывать, что доступные ТТS не так круты, как приведенные в статье. Хотя если поискать и подобрать свой голос то вполне может что-то и подойти. Это лучше обратится к нашим любителям говорилок: Жене, Юле, Майе)))

Librevista, Собственно, я на Юлю и ориентировалась, у нас с ней схожие вкусы в выборе предпочтительных чтецов. Просто я очень долго собиралась, и наконец все сложилось. И я решила нескромно поведать об этом миру.

Librevista, это точно, я тут единственный белорусский движок откопал - еще очень-очень-очень слабый, слушать тяжело, да и зависает иногда, хотя русские, английские и даже польские голоса вполне слушабельные

ari, отлично! начинай только с гугловских :) лучше английский голос :)

russischergeist, Что значит "английский голос"? На английском? Я же не слушаю на английском:(

ari, жалко, просто он лучше всего разработан, лаконичен и понятен

Между Татьяной и Максимом, я выбираю мужского балабола:)
Спасибо, очень интересно и познавательно.

Liben,

я выбираю мужского балабола:)

Звучит!

Liben, Девочки, они всегда такие девочки... Вот потому и начитываю эротику, шепчу непристойности в женское ушко ;-)

53r93y, :)) Ну не так категорично:) Я и женские озвучки люблю, а в нынешней балаболке у меня женский голос, кстати.

Liben, Ну, вот и рухнул очередной гендерный стереотип! Как жить дальше? "Потрясён, пойду полежу в кусты!" Прошу прощения за сарказм)
А балаболка шепчет нечто сапфическое?

53r93y, на меня не стоит ориентироваться, наверное, так что не за что прощать:))) Опыт слушания плюс любовь и к дикторскому, и к артистическому чтению...

А балаболка шепчет нечто сапфическое

балаболка шепчет в основном тогда, когда глазам не нравится история, а дочитать надо по игре или еще какой причине. Уши в этом плане всеяднее:))

Liben, Сочувствую... для меня это самое страшное наказание - читать не понравившуюся книгу. А уж тем более начитывать!

Тем, кто слушает много фэнтези и фантастики еще сложнее - много несуществующих в реальности имен и неологизмов. Понятно, что и так кто-то про себя читает имя персонажа с одним ударением, кто-то с другим. Но говорилки умудряются читать с третьим, совершенно невообразимым. Либо вообще читают по буквам, но это мы отнесем к старым технологиям.
Голос из видео-примера сгодится для короткого ролика, но слушать длинную книгу в такой начитке мне было бы очень сложно.

Orisa,

но слушать длинную книгу в такой начитке мне было бы очень сложно.

Да, это многие отмечают. Говорилка всё таки больше вспомогательный инструмент. Хотя, знаю примеры, что люди даже втягиваются. Человек существо, которое может приспособится к чему угодно.)))

Librevista,

Человек существо, которое может приспособится к чему угодно.)))

Приспособиться и привыкнуть, конечно, можно. Но не всегда это приспособление к более комфортным условиям.

Orisa,

но слушать длинную книгу в такой начитке мне было бы очень сложно.

Опять же вопрос в привыкании. Масса людей ни аудиоформат не признают, ни электронку.
У говорилки два главных преимущества:
- отпадает необходимость одну книгу читать на диванчике, а другую слушать в трамвае
- кроме того текст рядом, всегда есть возможность прочитать глазками и/или сделать пометки
Кроме того современные говорилки допускают приличное ускорение и порой слушается не медленнее , чем читается.

tortila,

Кроме того современные говорилки допускают приличное ускорение и порой слушается не медленнее , чем читается.

Аудиоплееры тоже позволяют слушать записи с некоторым ускорением без высоких-мультяшных голосов. В том же AIMP голос при ускорении/замедлении немного меняется, но остается вполне человеческим.
И я же не говорю говорилкам "нет и никогда", и признаю все те преимущества, которые они дают, и жалуюсь иногда, что у какой-то книги нет аудиоверсии. Речь о том, что пока искусственные голоса не могут полноценно заменить человеческие.

Orisa, С AIMP у меня не срослось. Тут или моя криворукость или серьезный баг разработчика, но качество не идет ни в какое сравнение, с теми ускорителями, что стоят у меня.
Согласен, это пока эрзац и не скоро станет идеален. Но например триллер в 1000 страниц или научпоп вполне подходят для такого качества. А в научпопе возвожность зацитатить или пометить сразу и сейчас, ИМХО, даже ставит говорилку выше аудиокниги.

я все жду, когда появится возможность озвучивать книги своим голосом) представьте, какая красота- один раз начитываешь контрольные отрывки, настраиваешь скорость и манеру, а потом любой текст слушаешь как будто внутренним голосом.

Nata_Nosova, Классная идея! Я вот, например, блестящий чтец! Так точно подобраны интонации, комфортная скорость чтения, артистизм просто ... Станиславский нервно курит в сторонке))) Но это всё до тех пор, пока я не начинаю всё это проделывать вслух!

Librevista, а я свой голос не люблю слушать по телефону, скайпу и т.д. Мне не нравится, как он звучит :) это не для меня

russischergeist, Вот честно, удивлен!

russischergeist, Гы, это хорошая отправная точка для карьеры чтеца! С такой мотивацией можно начинать тренировки по расширению своего голосового диапазона и использования особенностей своего речевого аппарата! Давно заметил, что тот студент, кто критически оценивает собственный голос лучше справляется с программой курса техники речи! Т.е. работать можно)

Всё же не удержался и вставил! Вставил в шапку последней своей записи «Поэтика» Аристотель Оксану! Звучит дама, ей-ей звучит!

53r93y,

Вставил в шапку последней своей записи

Это где?