Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Delphi программирование > Общие вопросы Delphi
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 17.01.2008, 12:52   #1
Gauss
Форумчанин
 
Аватар для Gauss
 
Регистрация: 26.11.2007
Сообщений: 235
По умолчанию Синтез речи. Создание голосового движка (не русского).

Всем привет! Помогите пожалуйста, ссылками на книги, или инфу, что нибудь про создание голосового движка. С чего следует начать это дело? Какие оптимальные алгоритмы существуют? и т.д. Очень буду благодарен и буду делиться мною добытой инфой

Дело в том, что я пытаюсь создать голосовой движок, но не русский, для этого языка их создано приличное кол-во))
Как я понял, существуют всего лишь 2 метода создания таких движков - это

1 Модель компилятивного синтеза - в основе лежит понятие о соединении (конкатенации) готовых, с помощью микрофона или чего либо другого, готовых звуковых файлов (в основном используют wav-файлы). {Сколько я не искал нормального алгоритма по этому методу, я не смог найти} Придумали свой , но он не оптимальный и вообще думаю этот метод не очень подходящий.
2 Формантно-голосовая модель - основана на моделировании речевого тракта человека, как я понял в основе данного метода лежит полностью программное управление. То есть нет нужды в дополнительных звуковых файлах, и все делаеться путем программирования готового звука. Путём изменения соответсвующих параметров звука, таких как частота, тон, продолжительность и другие получают нужные звуки, типа "A","B"... и т.д.

Я тоже собираюсь написать прогу, основываясь на 2-ом методе, задача канеш интересная , но трудная( Так что жду вашей помощи. Да, вот некоторые интересные сслыки тоже нашел, главное на русском инфы про это мало, в основном все на инглише.
http://www.frolov-lib.ru/books/hi/ch...#_Toc153187663
http://text2speech.sourceforge.net/ -- тут полезная инфа тоже, на C# сделанная говорилка (английская правда).
Gauss вне форума Ответить с цитированием
Старый 17.01.2008, 21:40   #2
mutabor
Телепат с дипломом
Старожил
 
Аватар для mutabor
 
Регистрация: 10.06.2007
Сообщений: 4,929
По умолчанию

Инглиш в этом деле не последняя вещь. Можешь на нем читать - имеешь на порядок больше инфы (из личного опыта).
Это собственно и был мой простой совет, не сочтите за флуд
The future is not a tablet with a 9" screen no more than the future was a 9" black & white screen in a box. It’s the paradigm that survives. (Kroc Camen)
Проверь себя! Онлайн тестирование | Мой блог
mutabor вне форума Ответить с цитированием
Старый 21.01.2014, 10:12   #3
lazyDi
Новичок
Джуниор
 
Регистрация: 21.01.2014
Сообщений: 1
По умолчанию

Как у тебя успехи то? Получилось?
lazyDi вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Программа распознавания русской речи - Комбат denis47 Помощь студентам 10 25.06.2016 22:39
Создание звукового движка varvara16 Общие вопросы Delphi 5 25.07.2008 00:18
Программа для разпознавания речи Иллидан Софт 3 25.03.2008 20:37
что лучше для голосового движка Oracle или MSSQL? Gauss БД в Delphi 15 17.03.2008 11:32
Поддержка русского языка в сообщении shurik_7866 Работа с сетью в Delphi 2 08.01.2008 17:09