Есть программа синтезатор голоса festival, но она очень привередливая к формату того, что её пытаются заставить говорить.
Поэтому набросал скрипт speaker.py, обёртку для festival, который приводит входной текст в относительный порядок. Скрипт использовать так:
cat test.txt | python3 speaker.py
Скрипт читает голосом текст, перенаправленный в него.
Сам скрипт speaker.py:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Программа для преобразования входного текста в голос
kmsvsr.ru
"""
import sys
import os
def prepare(text):
"""Подготовить текст для передачи в фестиваль"""
text = text.lower()
text = text.replace("&", "- энд -")
text = text.replace("«", "")
text = text.replace("»", "")
text = text.replace("—", "")
text = text.replace(" ", " ")
if text[-len("с англ"):] == "с англ":
text = text.replace("с англ", "с английского")
if text[-len("(англ"):] == "(англ":
text = text.replace("(англ", "(с английского")
text = text.replace("the", "дэ")
text = text.replace("productions", "прод+акшенс")
text = text.replace("track", "трак")
text = text.replace("3do", "3 ди+о, ")
text = text.replace("в 199", "в 1990 ")
text = text.replace("в 20", "в 2000 ")
text = text.replace(" 0 году", "м год+у")
text = text.replace(" 1 году", " первом год+у")
text = text.replace(" 2 году", " втором год+у")
text = text.replace(" 3 году", " третьем год+у")
text = text.replace(" 4 году", " четвёртом год+у")
text = text.replace(" 5 году", " пятом год+у")
text = text.replace(" 6 году", " шестом год+у")
text = text.replace(" 7 году", " седьмом год+у")
text = text.replace(" 8 году", " восьмом год+у")
text = text.replace(" 9 году", " девятом год+у")
text = text.replace(" году", " год+у")
text = text.replace("pioneer", "пионер")
text = text.replace("canada", "кан+ада")
text = text.replace("лятор", "л+ятор")
text = text.replace(" ea ", " е, эй, ")
text = text.replace(" и ", ", и ")
text = text.replace("electronic", "электр+оник")
text = text.replace(" arts", " артс")
text = text.replace("ирован", "+ирован")
text = text.replace("playstation", "плэйст+эйшэн")
text = text.replace("sega", "с+ега")
text = text.replace("saturn", "сат+урн")
text = text.replace("special", "сп+ешиал")
text = text.replace("edition", "эд+ишен")
text = text.replace("отзывы", "+отзывы")
text = text.replace("высокое", "выс+окое")
if text[-len(" ii"):] == " ii":
text = text.replace(" ii", " два")
text = text.replace("speed", "спид")
text = text.replace("сиквел", "с+иквел")
text = text.replace("сведения", "св+едения")
text = text.replace("сериал", "сери+ал")
text = text.replace(" a ", " э ")
text = text.replace("discovery", "диск+авери")
text = text.replace("witches", "в+итчес")
text = text.replace(" of ", " оф ")
text = text.replace("[", ", ")
text = text.replace("]", ", ")
text = text.replace(" ,", ",")
text = text.replace("души", "д+уши")
text = text.replace("дебор", "деб+ор")
text = text.replace("харкнесс", "х+аркнесс")
text = text.replace(" one", " у+ан")
text = text.replace("канал", "кан+ал")
text = text.replace("бря 20", "бря 2000 ")
text = text.replace("противостоя", "противосто+я")
text = text.replace("вампир", "вамп+ир")
text = text.replace("веково", "веков+о")
text = text.replace("warner", "в+орнер")
text = text.replace(" bros", " бр+азерс")
text = text.replace("„", " из ")
text = text.replace("%", " процентов ")
text = text.replace("/", " ")
text = text.replace("“", " ")
text = text.replace("ролях", "рол+ях")
text = text.replace("великобритан", "великобрит+ан")
text = text.replace(" мин", " минут")
text = text.replace(" млн", " милли+онов")
text = text.replace("…", ". ")
text = text.replace(")", ". ")
text = text.replace("[", ", есть ссылка ")
text = text.replace("↑", ", ")
text = text.replace("‘", ", ")
text = text.replace("é", ", ")
text = text.replace(" см.", " смотреть в ")
text = text.replace("®", ", ")
text = text.replace("–", ", ")
text = text.replace("•", ", ")
text = text.replace(":", ", двоеточие, ")
text = text.replace("nasa", "н+аса")
text = text.replace("*", " умножить на ")
text = text.replace("дизайнер", "диз+айнер")
text = text.replace("просмотр", "просм+отр")
text = text.replace("бан", "б+ан")
text = text.replace("симбиоз", "симби+оз")
text = text.replace("хабр", "х+абр")
text = text.replace("итог", "ит+ог")
text = text.replace("аналог", "ан+алог")
text = text.replace("≥", " больше, либо равно ")
text = text.replace(" мгу", " эм гэ у")
text = text.replace("шлеме", "шл+еме")
text = text.replace("космонавт", "космон+авт")
text = text.replace("буран", "бур+ан")
text = text.replace("систем", "сист+ем")
text = text.replace("перенос", "перен+ос")
text = text.replace("→", ", ")
text = text.replace("песоч", "пес+оч")
text = text.replace("правил", "пр+авил")
text = text.replace(" руб.", " рублей ")
text = text.replace("отклик", "+отклик")
text = text.replace("клиент", "кли+ент")
text = text.replace("разработчик", "разраб+отчик")
text = text.replace("базов", "б+азов")
text = text.replace(" слова", " слов+а")
text = text.replace("этап", "эт+ап")
text = text.replace(" 2-ое", " второе")
text = text.replace("pmi", " пи эм ай ")
text = text.replace("снг", "эс эн гэ")
text = text.replace("data", "д+эйта")
text = text.replace("sciense", "сайнс")
text = text.replace("bounce", "баунс")
text = text.replace("китай", "кит+ай")
text = text.replace("сайт", "с+айт")
text = text.replace("wifi", "вай фай ")
text = text.replace("разработ", "разраб+от")
text = text.replace("встраив", "встр+аив")
text = text.replace("php", "пи эйч пи ")
text = text.replace("sql", "эс ку эль ")
text = text.replace("valve", "вальв")
text = text.replace("слеж", "сл+еж")
text = text.replace("любом", "люб+ом")
text = text.replace("ware", "вэйр")
text = text.replace("ight", "айт")
text = text.replace("ine", "айн")
text = text.replace("nginx", "нжин+икс")
text = text.replace("office", "+офис")
text = text.replace("ё", "+ё")
text = text.replace("лямбд", "л+ямбд")
text = text.replace("минпромторг", "минпромт+орг")
text = text.replace("купа", "куп+а")
text = text.replace("шот", "ш+от")
text = text.replace("network", "нетв+орк")
text = text.replace("сервер", "с+ервер")
text = text.replace(">", " больше ")
text = text.replace(" ,", ", ")
text = text.replace("opennet", "оупенн+ет ")
text = text.replace("dns", "диэн+эс ")
text = text.replace("firefox", "файрф+окс")
text = text.replace("отзыва", "отзыв+а")
text = text.replace("erlang", "ерл+анг")
text = text.replace("java ", "дж+ава ")
text = text.replace("javascript", "джаваскр+ипт")
text = text.replace("пользо", "п+ользо")
text = text.replace("технологии", "технол+огии")
text = text.replace("www", "дабл ю дабл ю дабл ю ")
text = text.replace("https://", "эйчтитипи+эс ")
text = text.replace("http://", "эйчтитип+и ")
text = text.replace("·", ", ")
text = text.replace("|", ", ")
text = text.replace("вывоз", "в+ывоз")
text = text.replace("гаджет", "г+аджет")
text = text.replace("машин", "маш+ин")
text = text.replace("ноутбук", "ноутб+ук")
text = text.replace("сетево", "сетев+о")
text = text.replace("картридж", "к!артридж")
text = text.replace("компресс", "компр!есс")
text = text.replace("polaris", "пол+ярис")
text = text.replace("процесс", "проц+есс")
text = text.replace("иговая", "игов+ая")
text = text.replace("мотор", "мот+ор")
text = text.replace("квадрокоп", "квадрок+оп")
text = text.replace("новинк", "нов+инк")
text = text.replace("жестк", "ж+ёстк")
text = text.replace("₽", "рублей")
text = text.replace("варка", "в+арка")
text = text.replace("bloody", "бл+ади")
text = text.replace("ps5", "плэйст+эйшн 5")
text = text.replace("amd", "аэмд+э")
text = text.replace("samsung", "самс+унг")
text = text.replace("philips", "ф+илипс")
text = text.replace("bluetooth", "блют+ус")
text = text.replace("испыта", "испыт+а")
text = text.replace("™", ", ")
text = text.replace("бренд", "бр+енд")
text = text.replace("фон", "ф+он")
text = text.replace("офис", "+офис")
text = text.replace("причем", "прич+ём")
text = text.replace("см.", "смотреть")
text = text.replace("основно", "основн+о")
text = text.replace("windows", "в+индоус")
text = text.replace("дела", "дел+а")
text = text.replace("edge", "эдж")
text = text.replace(" se ", " эсъ+е ")
text = text.replace("store", "стор")
text = text.replace("azure", "+эйжъюр ")
text = text.replace("©", "копирасты ")
text = text.replace("staging", "ст+эйджинг")
text = text.replace("gpl", "джипи+эл")
text = text.replace("дистрибутив", "дистрибут+ив")
text = text.replace("исходны", "исх+одны")
text = text.replace("блокировк", "блокир+овк")
text = text.replace("технологий", "технол+огий")
text = text.replace("origin", "ор+иджин")
text = text.replace("пороч", "пор+оч")
text = text.replace("побежден", "побежд+ён")
text = text.replace("мвд", "эмвэд+э")
text = text.replace("касперск", "касп+ерск")
text = text.replace("названы", "н+азваны")
text = text.replace("биткойн", "битк+ойн")
text = text.replace("биткоин", "битк+ойн")
text = text.replace("тренд", "тр+енд")
text = text.replace("удаленк", "удал+ёнк")
text = text.replace("ddos", "дид+ос")
text = text.replace("бург", "б+ург")
text = text.replace("цифровая", "цифров+ая")
text = text.replace("ритм", "р+итм")
text = text.replace("интернет", "интерн+ет")
text = text.replace("призм", "пр+изм")
text = text.replace("сдел", "сд+ел")
text = text.replace("автоматиза", "автоматиз+а")
text = text.replace("цифрово", "цифров+о")
text = text.replace("пандеми", "пандем+и")
text = text.replace("сектор", "с+ектор")
text = text.replace("замещен", "замещ+ен")
text = text.replace("ssd", "эсэсд+и")
text = text.replace("hdd", "эйчдид+и")
text = text.replace("тариф", "тар+иф")
text = text.replace("морско", "морск+о")
text = text.replace("№", "номер ")
text = text.replace("депутат", "депут+ат")
text = text.replace("вступа", "вступ+а")
text = text.replace("прием ", "при+ём ")
text = text.replace("рубля", "рубл+я")
text = text.replace(" делает", " д+елает")
text = text.replace(" делают", " д+елают")
text = text.replace(" рф", " эр+эф")
text = text.replace("росси", "росс+и")
text = text.replace("спартаке", "спартак+е")
text = text.replace("спартака", "спартак+а")
text = text.replace("финал", "фин+ал")
text = text.replace("футбол", "футб+ол")
text = text.replace("огайо", "ог+айо")
text = text.replace("конго", "к+онго")
text = text.replace("тюмен", "тюм+ен")
text = text.replace("белков", "белк+ов")
text = text.replace("кроссовер", "кросс+овер")
text = text.replace(" it ", " айт+и ")
text = text.replace(" ит-", " айт+и ")
text = text.replace("чане", "ч+ане")
text = text.replace("интерфейс", "интерф+ейс")
text = text.replace("запустим", "зап+устим")
text = text.replace("ходить", "ход+ить")
text = text.replace("’", " ")
text = text.replace("расчет", "расч+ёт")
text = text.replace("_", " ")
text = text.replace("тестировал", "тест+ировал")
text = text.replace("во всем", "во всём")
text = text.replace("удаленно", "удал+ённо")
text = text.replace("digital ", "д+иджитал ")
text = text.replace("nft", "энэф+ти")
text = text.replace("домен", "дом+ен")
text = text.replace("оборон", "обор+он")
text = text.replace("коллектив", "коллект+ив")
text = text.replace("мгу", "эмгэ+у")
text = text.replace("кндр", "каэндэ+эр")
text = text.replace(" тв ", " тэв+э ")
text = text.replace(" tv ", " тив+и ")
text = text.replace("старт", "ст+арт")
text = text.replace("мск", "по моск+овскому вр+емени")
text = text.replace("кабелями", "кабел+ями")
text = text.replace("скоп", "ск+оп")
text = text.replace("бортовой", "бортов+ой")
text = text.replace("на борту", "на борт+у")
text = text.replace("разъем", "разъ+ём")
text = text.replace("четко", "ч+ётко")
text = text.replace("грузил", "груз+ил")
text = text.replace("тормозно", "тормозн+о")
text = text.replace("-", " ")
text = text.replace("дежур", "деж+ур")
text = text.replace("команд", "ком+анд")
text = text.replace("полетами", "пол+ётами")
text = text.replace("км", " километров")
text = text.replace("тормозна", "тормозн+а")
text = text.replace("м/с", " метров в секунду")
text = text.replace("торвальдс", "т+орвальдс")
text = text.replace("правок", "пр+авок")
text = text.replace("сша", "сэшэ+а")
text = text.replace("ссср", "эсэсэс+эр")
text = text.replace("linux", " л+инукс ")
text = text.replace("см.", "смотреть")
text = text.replace("<", " меньше ")
text = text.replace("всмпо", "вэсээмпэ+о")
text = text.replace("институт", "инстит+ут")
text = text.replace("банкрот", "банкр+от")
text = text.replace("титан", "тит+ан")
text = text.replace("европ", "евр+оп")
text = text.replace("тагил", "таг+ил")
text = text.replace("позднее", "поздне+е")
text = text.replace("apple", "эпл")
text = text.replace("disk", "диск")
text = text.replace("скале", "скал+е")
text = text.replace("в виду", "в вид+у")
text = text.replace("игров", "игров+")
text = text.replace("консол", "конс+ол")
text = text.replace("facebook", "фейсб+ук")
text = text.replace("loot", "лут")
text = text.replace("drop", "дроп")
text = text.replace("wolf", "вольф")
text = text.replace("stein", "шт+айн")
text = text.replace("doom", "дум")
text = text.replace("ation", "+эйшен")
text = text.replace("оо", "у")
text = text.replace("this", "дис")
text = text.replace("пробел", "проб+ел")
text = text.replace("синтаксис", "синтаксис")
text = text.replace("python", "п+айтон")
text = text.replace("глобальн", "глоб+альн")
text = text.replace("devops", "дев+опс")
text = text.replace("ладк", "л+адк")
text = text.replace("сначала", "снач+ала")
text = text.replace("сообщест", "со+общест")
text = text.replace("=", " равн+о ")
text = text.replace("пушкин", "п+ушкин")
text = text.replace("послушн", "посл+ушн")
text = text.replace("оспарив", "осп+арив")
text = text.replace("!", ", ")
return text
def speak(text):
"""Сказать текст"""
os.system(
f'echo "{prepare(text)}" | festival --tts --language russian'
)
for line in sys.stdin:
parts = line.split(".")
for part in parts:
part = part.strip()
speak(part)
Исправления слов и ударений можно пополнять по мере необходимости. Кто добавит — можете сюда в коментарии скидывать, пополню.
Установка Festival на ubuntu-подобный Linux: https://kmsvsr.ru/2015/11/04/uchim-kompyuter-govorit-ustanovka-festival-na-ubuntu-podobnyj-linux/