Архив метки: festival

Python скрипт для чтения голосом необработанных текстовых файлов через festival

Есть программа синтезатор голоса festival, но она очень привередливая к формату того, что её пытаются заставить говорить.

Поэтому набросал скрипт speaker.py, обёртку для festival, который приводит входной текст в относительный порядок. Скрипт использовать так:

 cat test.txt | python3 speaker.py

Скрипт читает голосом текст, перенаправленный в него.

Сам скрипт speaker.py:

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Программа для преобразования входного текста в голос
kmsvsr.ru
"""

import sys
import os

def prepare(text):
    """Подготовить текст для передачи в фестиваль"""
    text = text.lower()
    text = text.replace("&", "- энд -")
    text = text.replace("«", "")
    text = text.replace("»", "")
    text = text.replace("—", "")
    text = text.replace(" ", " ")
    if text[-len("с англ"):] == "с англ":
        text = text.replace("с англ", "с английского")
    if text[-len("(англ"):] == "(англ":
        text = text.replace("(англ", "(с английского")
    text = text.replace("the", "дэ")
    text = text.replace("productions", "прод+акшенс")
    text = text.replace("track", "трак")
    text = text.replace("3do", "3 ди+о, ")
    text = text.replace("в 199", "в 1990 ")
    text = text.replace("в 20", "в 2000 ")
    text = text.replace(" 0 году", "м год+у")
    text = text.replace(" 1 году", " первом год+у")
    text = text.replace(" 2 году", " втором год+у")
    text = text.replace(" 3 году", " третьем год+у")
    text = text.replace(" 4 году", " четвёртом год+у")
    text = text.replace(" 5 году", " пятом год+у")
    text = text.replace(" 6 году", " шестом год+у")
    text = text.replace(" 7 году", " седьмом год+у")
    text = text.replace(" 8 году", " восьмом год+у")
    text = text.replace(" 9 году", " девятом год+у")
    text = text.replace(" году", " год+у")
    text = text.replace("pioneer", "пионер")
    text = text.replace("canada", "кан+ада")
    text = text.replace("лятор", "л+ятор")
    text = text.replace(" ea ", " е, эй, ")
    text = text.replace(" и ", ", и ")
    text = text.replace("electronic", "электр+оник")
    text = text.replace(" arts", "  артс")
    text = text.replace("ирован", "+ирован")
    text = text.replace("playstation", "плэйст+эйшэн")
    text = text.replace("sega", "с+ега")
    text = text.replace("saturn", "сат+урн")
    text = text.replace("special", "сп+ешиал")
    text = text.replace("edition", "эд+ишен")
    text = text.replace("отзывы", "+отзывы")
    text = text.replace("высокое", "выс+окое")
    if text[-len(" ii"):] == " ii":
        text = text.replace(" ii", " два")
    text = text.replace("speed", "спид")
    text = text.replace("сиквел", "с+иквел")
    text = text.replace("сведения", "св+едения")
    text = text.replace("сериал", "сери+ал")
    text = text.replace(" a ", " э ")
    text = text.replace("discovery", "диск+авери")
    text = text.replace("witches", "в+итчес")
    text = text.replace(" of ", " оф ")
    text = text.replace("[", ", ")
    text = text.replace("]", ", ")
    text = text.replace(" ,", ",")
    text = text.replace("души", "д+уши")
    text = text.replace("дебор", "деб+ор")
    text = text.replace("харкнесс", "х+аркнесс")
    text = text.replace(" one", " у+ан")
    text = text.replace("канал", "кан+ал")
    text = text.replace("бря 20", "бря 2000 ")
    text = text.replace("противостоя", "противосто+я")
    text = text.replace("вампир", "вамп+ир")
    text = text.replace("веково", "веков+о")
    text = text.replace("warner", "в+орнер")
    text = text.replace(" bros", " бр+азерс")
    text = text.replace("„", " из ")
    text = text.replace("%", " процентов ")
    text = text.replace("/", " ")
    text = text.replace("“", " ")
    text = text.replace("ролях", "рол+ях")
    text = text.replace("великобритан", "великобрит+ан")
    text = text.replace(" мин", " минут")
    text = text.replace(" млн", " милли+онов")
    text = text.replace("…", ". ")
    text = text.replace(")", ". ")
    text = text.replace("[", ", есть ссылка  ")
    text = text.replace("↑", ", ")
    text = text.replace("‘", ", ")
    text = text.replace("é", ", ")
    text = text.replace(" см.", " смотреть в ")
    text = text.replace("®", ", ")
    text = text.replace("–", ", ")
    text = text.replace("•", ", ")
    text = text.replace(":", ", двоеточие, ")
    text = text.replace("nasa", "н+аса")
    text = text.replace("*", " умножить на ")
    text = text.replace("дизайнер", "диз+айнер")
    text = text.replace("просмотр", "просм+отр")
    text = text.replace("бан", "б+ан")
    text = text.replace("симбиоз", "симби+оз")
    text = text.replace("хабр", "х+абр")
    text = text.replace("итог", "ит+ог")
    text = text.replace("аналог", "ан+алог")
    text = text.replace("≥", " больше, либо равно ")
    text = text.replace(" мгу", " эм гэ у")
    text = text.replace("шлеме", "шл+еме")
    text = text.replace("космонавт", "космон+авт")
    text = text.replace("буран", "бур+ан")
    text = text.replace("систем", "сист+ем")
    text = text.replace("перенос", "перен+ос")
    text = text.replace("→", ", ")
    text = text.replace("песоч", "пес+оч")
    text = text.replace("правил", "пр+авил")
    text = text.replace(" руб.", " рублей ")
    text = text.replace("отклик", "+отклик")
    text = text.replace("клиент", "кли+ент")
    text = text.replace("разработчик", "разраб+отчик")
    text = text.replace("базов", "б+азов")
    text = text.replace(" слова", " слов+а")
    text = text.replace("этап", "эт+ап")
    text = text.replace(" 2-ое", " второе")
    text = text.replace("pmi", " пи эм ай ")
    text = text.replace("снг", "эс эн гэ")
    text = text.replace("data", "д+эйта")
    text = text.replace("sciense", "сайнс")
    text = text.replace("bounce", "баунс")
    text = text.replace("китай", "кит+ай")
    text = text.replace("сайт", "с+айт")
    text = text.replace("wifi", "вай фай ")
    text = text.replace("разработ", "разраб+от")
    text = text.replace("встраив", "встр+аив")
    text = text.replace("php", "пи эйч пи ")
    text = text.replace("sql", "эс ку эль ")
    text = text.replace("valve", "вальв")
    text = text.replace("слеж", "сл+еж")
    text = text.replace("любом", "люб+ом")
    text = text.replace("ware", "вэйр")
    text = text.replace("ight", "айт")
    text = text.replace("ine", "айн")
    text = text.replace("nginx", "нжин+икс")
    text = text.replace("office", "+офис")
    text = text.replace("ё", "+ё")
    text = text.replace("лямбд", "л+ямбд")
    text = text.replace("минпромторг", "минпромт+орг")
    text = text.replace("купа", "куп+а")
    text = text.replace("шот", "ш+от")
    text = text.replace("network", "нетв+орк")
    text = text.replace("сервер", "с+ервер")
    text = text.replace(">", " больше ")
    text = text.replace(" ,", ", ")
    text = text.replace("opennet", "оупенн+ет ")
    text = text.replace("dns", "диэн+эс ")
    text = text.replace("firefox", "файрф+окс")
    text = text.replace("отзыва", "отзыв+а")
    text = text.replace("erlang", "ерл+анг")
    text = text.replace("java ", "дж+ава ")
    text = text.replace("javascript", "джаваскр+ипт")
    text = text.replace("пользо", "п+ользо")
    text = text.replace("технологии", "технол+огии")
    text = text.replace("www", "дабл ю дабл ю дабл ю ")
    text = text.replace("https://", "эйчтитипи+эс ")
    text = text.replace("http://", "эйчтитип+и ")
    text = text.replace("·", ", ")
    text = text.replace("|", ", ")
    text = text.replace("вывоз", "в+ывоз")
    text = text.replace("гаджет", "г+аджет")
    text = text.replace("машин", "маш+ин")
    text = text.replace("ноутбук", "ноутб+ук")
    text = text.replace("сетево", "сетев+о")
    text = text.replace("картридж", "к!артридж")
    text = text.replace("компресс", "компр!есс")
    text = text.replace("polaris", "пол+ярис")
    text = text.replace("процесс", "проц+есс")
    text = text.replace("иговая", "игов+ая")
    text = text.replace("мотор", "мот+ор")
    text = text.replace("квадрокоп", "квадрок+оп")
    text = text.replace("новинк", "нов+инк")
    text = text.replace("жестк", "ж+ёстк")
    text = text.replace("₽", "рублей")
    text = text.replace("варка", "в+арка")
    text = text.replace("bloody", "бл+ади")
    text = text.replace("ps5", "плэйст+эйшн 5")
    text = text.replace("amd", "аэмд+э")
    text = text.replace("samsung", "самс+унг")
    text = text.replace("philips", "ф+илипс")
    text = text.replace("bluetooth", "блют+ус")
    text = text.replace("испыта", "испыт+а")
    text = text.replace("™", ", ")
    text = text.replace("бренд", "бр+енд")
    text = text.replace("фон", "ф+он")
    text = text.replace("офис", "+офис")
    text = text.replace("причем", "прич+ём")
    text = text.replace("см.", "смотреть")
    text = text.replace("основно", "основн+о")
    text = text.replace("windows", "в+индоус")
    text = text.replace("дела", "дел+а")
    text = text.replace("edge", "эдж")
    text = text.replace(" se ", " эсъ+е ")
    text = text.replace("store", "стор")
    text = text.replace("azure", "+эйжъюр ")
    text = text.replace("©", "копирасты ")
    text = text.replace("staging", "ст+эйджинг")
    text = text.replace("gpl", "джипи+эл")
    text = text.replace("дистрибутив", "дистрибут+ив")
    text = text.replace("исходны", "исх+одны")
    text = text.replace("блокировк", "блокир+овк")
    text = text.replace("технологий", "технол+огий")
    text = text.replace("origin", "ор+иджин")
    text = text.replace("пороч", "пор+оч")
    text = text.replace("побежден", "побежд+ён")
    text = text.replace("мвд", "эмвэд+э")
    text = text.replace("касперск", "касп+ерск")
    text = text.replace("названы", "н+азваны")
    text = text.replace("биткойн", "битк+ойн")
    text = text.replace("биткоин", "битк+ойн")
    text = text.replace("тренд", "тр+енд")
    text = text.replace("удаленк", "удал+ёнк")
    text = text.replace("ddos", "дид+ос")
    text = text.replace("бург", "б+ург")
    text = text.replace("цифровая", "цифров+ая")
    text = text.replace("ритм", "р+итм")
    text = text.replace("интернет", "интерн+ет")
    text = text.replace("призм", "пр+изм")
    text = text.replace("сдел", "сд+ел")
    text = text.replace("автоматиза", "автоматиз+а")
    text = text.replace("цифрово", "цифров+о")
    text = text.replace("пандеми", "пандем+и")
    text = text.replace("сектор", "с+ектор")
    text = text.replace("замещен", "замещ+ен")
    text = text.replace("ssd", "эсэсд+и")
    text = text.replace("hdd", "эйчдид+и")
    text = text.replace("тариф", "тар+иф")
    text = text.replace("морско", "морск+о")
    text = text.replace("№", "номер ")
    text = text.replace("депутат", "депут+ат")
    text = text.replace("вступа", "вступ+а")
    text = text.replace("прием ", "при+ём ")
    text = text.replace("рубля", "рубл+я")
    text = text.replace(" делает", " д+елает")
    text = text.replace(" делают", " д+елают")
    text = text.replace(" рф", " эр+эф")
    text = text.replace("росси", "росс+и")
    text = text.replace("спартаке", "спартак+е")
    text = text.replace("спартака", "спартак+а")
    text = text.replace("финал", "фин+ал")
    text = text.replace("футбол", "футб+ол")
    text = text.replace("огайо", "ог+айо")
    text = text.replace("конго", "к+онго")
    text = text.replace("тюмен", "тюм+ен")
    text = text.replace("белков", "белк+ов")
    text = text.replace("кроссовер", "кросс+овер")
    text = text.replace(" it ", " айт+и ")
    text = text.replace(" ит-", " айт+и ")
    text = text.replace("чане", "ч+ане")
    text = text.replace("интерфейс", "интерф+ейс")
    text = text.replace("запустим", "зап+устим")
    text = text.replace("ходить", "ход+ить")
    text = text.replace("’", " ")
    text = text.replace("расчет", "расч+ёт")
    text = text.replace("_", " ")
    text = text.replace("тестировал", "тест+ировал")
    text = text.replace("во всем", "во всём")
    text = text.replace("удаленно", "удал+ённо")
    text = text.replace("digital ", "д+иджитал ")
    text = text.replace("nft", "энэф+ти")
    text = text.replace("домен", "дом+ен")
    text = text.replace("оборон", "обор+он")
    text = text.replace("коллектив", "коллект+ив")
    text = text.replace("мгу", "эмгэ+у")
    text = text.replace("кндр", "каэндэ+эр")
    text = text.replace(" тв ", " тэв+э ")
    text = text.replace(" tv ", " тив+и ")
    text = text.replace("старт", "ст+арт")
    text = text.replace("мск", "по моск+овскому вр+емени")
    text = text.replace("кабелями", "кабел+ями")
    text = text.replace("скоп", "ск+оп")
    text = text.replace("бортовой", "бортов+ой")
    text = text.replace("на борту", "на борт+у")
    text = text.replace("разъем", "разъ+ём")
    text = text.replace("четко", "ч+ётко")
    text = text.replace("грузил", "груз+ил")
    text = text.replace("тормозно", "тормозн+о")
    text = text.replace("-", " ")
    text = text.replace("дежур", "деж+ур")
    text = text.replace("команд", "ком+анд")
    text = text.replace("полетами", "пол+ётами")
    text = text.replace("км", " километров")
    text = text.replace("тормозна", "тормозн+а")
    text = text.replace("м/с", " метров в секунду")
    text = text.replace("торвальдс", "т+орвальдс")
    text = text.replace("правок", "пр+авок")
    text = text.replace("сша", "сэшэ+а")
    text = text.replace("ссср", "эсэсэс+эр")
    text = text.replace("linux", " л+инукс ")
    text = text.replace("см.", "смотреть")
    text = text.replace("<", " меньше ")
    text = text.replace("всмпо", "вэсээмпэ+о")
    text = text.replace("институт", "инстит+ут")
    text = text.replace("банкрот", "банкр+от")
    text = text.replace("титан", "тит+ан")
    text = text.replace("европ", "евр+оп")
    text = text.replace("тагил", "таг+ил")
    text = text.replace("позднее", "поздне+е")
    text = text.replace("apple", "эпл")
    text = text.replace("disk", "диск")
    text = text.replace("скале", "скал+е")
    text = text.replace("в виду", "в вид+у")
    text = text.replace("игров", "игров+")
    text = text.replace("консол", "конс+ол")
    text = text.replace("facebook", "фейсб+ук")
    text = text.replace("loot", "лут")
    text = text.replace("drop", "дроп")
    text = text.replace("wolf", "вольф")
    text = text.replace("stein", "шт+айн")
    text = text.replace("doom", "дум")
    text = text.replace("ation", "+эйшен")
    text = text.replace("оо", "у")
    text = text.replace("this", "дис")
    text = text.replace("пробел", "проб+ел")
    text = text.replace("синтаксис", "синтаксис")
    text = text.replace("python", "п+айтон")
    text = text.replace("глобальн", "глоб+альн")
    text = text.replace("devops", "дев+опс")
    text = text.replace("ладк", "л+адк")
    text = text.replace("сначала", "снач+ала")
    text = text.replace("сообщест", "со+общест")
    text = text.replace("=", " равн+о ")
    text = text.replace("пушкин", "п+ушкин")
    text = text.replace("послушн", "посл+ушн")
    text = text.replace("оспарив", "осп+арив")
    text = text.replace("!", ", ")
    return text

def speak(text):
    """Сказать текст"""
    os.system(
        f'echo "{prepare(text)}" | festival --tts --language russian'
    )

for line in sys.stdin:
    parts = line.split(".")
    for part in parts:
        part = part.strip()
        speak(part)

Исправления слов и ударений можно пополнять по мере необходимости. Кто добавит — можете сюда в коментарии скидывать, пополню.

Установка Festival на ubuntu-подобный Linux: https://kmsvsr.ru/2015/11/04/uchim-kompyuter-govorit-ustanovka-festival-na-ubuntu-podobnyj-linux/

Кухонный таймер на Bash для Raspberry Pi

Добавил своей малинке функцию кухонного таймера. Написал короткий скрипт для воспроизведения звукового файла через назначенный пользователем интервал времени. Скрипт получился такой:

#!/bin/bash
# kmstimer
echo "Таймер сработает через $1 минут"
for ((i=0; i<$1; i++))
  do
    echo "Прошло $i минут"
    sleep 60
  done
echo "Время вышло!"
echo "Время вышло" | festival --tts --language russian
mpg123 /home/pi/usr/share/sounds/default.mp3

Если на системе установлен синтезатор речи festival, то система получеловеческим голосом объявит, что время вышло, после чего воспроизведёт указанный в скрипте музыкальный файл.

Пример использования скрипта следующий:

/bin/kmstimer 15

где 15 — время в минутах.

Получившимся скриптом удобно пользоваться с android-смартфона, например через программу Raspi SSH. Добавляем новые кнопки с названием вроде «Таймер 15 минут (гречка)» и соответственно кодом «kmstimer 15» — таймер будет включаться нажатием одной кнопки на смартфоне.

Учим компьютер говорить — установка Festival на ubuntu-подобный Linux

После этих команд компьютер начал разговаривать на русском языке:

sudo apt-get install festival
sudo apt-get install speech-tools
sudo apt-get install festvox-kallpc16k 
sudo apt-get install festvox-ru

Теперь можно заставить его говорить например следующей командой:

echo "сейчас 20 40" | festival --tts --language russian