🎙️Наша Система Синтеза Речи V3

Last updated on 27 июня 2022 г.

Недавно мы сделали мажорный релиз нашей системы синтеза речи V3. В этой версии мы внесли огромное число улучшений:

Снизили размер модели в 2 раза;
Научили наши модели делать паузы;
Добавили один высококачественный голос (и бесконечное число случайных);
Ускорили наши модели где-то примерно в 10 раз (!);
Упаковали всех спикеров одного языка в одну модель;
Наши модели теперь могут принимать на вход даже целые абзацы текста;
Добавили функции контроля скорости и высоты речи через SSML;
Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;
Добавили 20 языков и более 170 голосов;

Наша система синтеза живет внутри нашего проекта Silero Models тут и мы написали про нее отличные и подробные посты, которые вновь стали очень популярными на Хабре:

Сейчас проще всего послушать наш синтез можно:

Через колаб - Google Colaboratory;
Можно послушать многочисленные примеры в самих статьях;
В ближайшее время подъедет бот в Телеграме;

Следите за нашими релизами:

На Хабре - https://habr.com/ru/users/snakers4/posts/;
На канале с нашими новостями - https://t.me/silero_news;