Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Delphi программирование > Общие вопросы Delphi
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 03.07.2013, 17:04   #1
TUberwer
Форумчанин
 
Регистрация: 01.07.2013
Сообщений: 221
По умолчанию Google Speech-Recognition API

Всем привет!
Я очень сильно захотел сделать один проект.
Рассказывать о нем не хочу, т.к. в инете такого не находил...=)
Но для его реализации мне нужен распознаватель речи.
Я решил воспользоваться Google Speech-Recognition API.
Только у меня есть проблемы.
Есть ли где-то урок по созданию простого распознавателя голоса с использованием Google Speech-Recognition API ?
Нужно что-то простое, например 1 кнопка, при нажатии на нее будет записываться звук с микрофона, переводиться в формат FLAC, отправляться по адресу https://www.google.com/speech-api/v1...ium&lang=ru-RU, представляясь гуглу клиентом Chrome.
Потом получать ответ в форме JSON. И записывать его в текстовое поле=))
TUberwer вне форума Ответить с цитированием
Старый 03.07.2013, 17:33   #2
Человек_Борща
Старожил
 
Аватар для Человек_Борща
 
Регистрация: 30.12.2009
Сообщений: 11,442
По умолчанию

Вот тут есть толпа полезных статей на тему гоголя.
Человек_Борща вне форума Ответить с цитированием
Старый 03.07.2013, 18:34   #3
raxp
Старожил
 
Регистрация: 29.09.2009
Сообщений: 9,742
По умолчанию

Цитата:
простого распознавателя голоса с использованием Google Speech-Recognition API ?
Нужно что-то простое, например 1 кнопка, при нажатии на нее будет записываться звук с микрофона, переводиться в формат FLAC, отправляться по адресу https://www.google.com/speech-api/v1...ium&lang=ru-RU, представляясь гуглу клиентом Chrome.
Потом получать ответ в форме JSON. И записывать его в текстовое поле=))
Описание API вызова библиотеки GoogleSpeechRecognizeAPI3.DLL

http://www.youtube.com/watch?v=aRRvXOOlxmI


Практический пример

Голосовой плагин для AIMP

http://www.youtube.com/watch?v=eIqKQcD7FEg
Разработки и научно-технические публикации :: Видеоблог :: Твиттер
Radar systems engineer & Software developer of industrial automation

Последний раз редактировалось raxp; 03.07.2013 в 18:37.
raxp вне форума Ответить с цитированием
Старый 05.07.2013, 08:24   #4
Toxa
Форумчанин Подтвердите свой е-майл
 
Аватар для Toxa
 
Регистрация: 01.12.2006
Сообщений: 516
По умолчанию

вот, только надо нормально запилить парсинг JSON

AFlacFileName = путь к аудиофайлу

Код:
сonst
  CRLF = #$0D + #$0A;
  ANSWER = '"utterance":"';
  KACHESTVO = '"confidence":';
var
  HTTP: THTTPSend;
  Bound, Str: String;
  fs : TFileStream;
  sl : TStringList;
  bResHTTPMethod : boolean;
begin
  Bound := IntToHex(Random(MaxInt), 8) + '_Synapse_boundary';
  HTTP := THTTPSend.Create;
  sl := TStringList.Create;
  fs := TFileStream.Create(AFlacFileName,fmOpenRead);
  try
    Str := '--' + Bound + CRLF;
    Str := Str + 'content-disposition: form-data; name="userfile";';
    Str := Str + ' filename="' + ExtractFileName(AFlacFileName) + '"' + CRLF;
    Str := Str + 'Content-Type: audio/x-flac; rate=8000' + CRLF + CRLF;
    HTTP.Document.Write(Pointer(Str)^, Length(Str));
    HTTP.Document.CopyFrom(fs, 0);
    Str := CRLF + '--' + Bound + '--' + CRLF;
    HTTP.Document.Write(Pointer(Str)^, Length(Str));
    HTTP.MimeType := 'audio/x-flac; rate=8000, boundary=' + Bound;
    bResHTTPMethod := HTTP.HTTPMethod('POST', 'https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=ru-RU');
    sl.LoadFromStream(HTTP.Document);
    str := sl.Text;
    if pos('"status":0',str) > 0 then
     begin
      Result := UTF8ToString(copy(str,pos(ANSWER,str)+length(ANSWER),posex('"',str,pos(ANSWER,str)+length(ANSWER)+1) - pos(ANSWER,str)-length(ANSWER)));
     end
    else
     begin
      Result := '';
     end;
  finally
    HTTP.Free;
    sl.Free;
    fs.free;
  end;
Пишу на Delphi за еду

Последний раз редактировалось Toxa; 05.07.2013 в 08:24. Причина: забыл тэги [CODE]
Toxa вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
xna speech recognition AntonPro C# (си шарп) 1 30.01.2013 15:55
Использование Speech Recognition RuVarez Софт 2 23.04.2012 15:32
Speech Recognition Windows 7 (Delphi) ProgMaster Помощь студентам 4 07.03.2012 14:23
Speech api Яр|/||< (^_^) Windows 2 06.07.2009 20:18
Подсветка в Speech api Яр|/||< (^_^) Мультимедиа в Delphi 0 19.06.2009 11:33