Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > IT форум > Общие вопросы по программированию, компьютерный форум
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 20.05.2020, 18:08   #1
макс1611
Новичок
Джуниор
 
Регистрация: 20.05.2020
Сообщений: 6
Радость хочу то,не знаю что,хочу так,не знаю как(про голосовой ввод)

сразу прошу прощения за кривое объяснение.

в общем я хочу голосом вводить текст. но не просто надиктовка обычная ,а чтобы его(текст) еще и в разные места (тем же голосом) пихать можно было.

к примеру. взял я эксель. обозвал ячейку а1-"38",а2-"37" и т.д. и говорю "38" ,далее начинаю надиктовывать текст ,а он попадает в ячейку а1. ,потом говорю "37" ,текст начинает уже в а2 ячейку попадать и т.д.

не обязательно в экселе это реализовывать. это пример просто.
но сама суть.что я могу текст голосом распихивать в разные места,чтобы в дальнейшем вытягивать этот текст и четко знать,что от куда было взято

куда идти с этой бедой,кто поможет ?
макс1611 вне форума Ответить с цитированием
Старый 20.05.2020, 19:05   #2
digitalis
Старожил
 
Аватар для digitalis
 
Регистрация: 04.02.2011
Сообщений: 4,546
По умолчанию

Сменить хотелку. Распознавание голоса - очень сложная задача, особенно - с неограниченным словарём.
digitalis на форуме Ответить с цитированием
Старый 20.05.2020, 19:35   #3
макс1611
Новичок
Джуниор
 
Регистрация: 20.05.2020
Сообщений: 6
По умолчанию

Цитата:
Сообщение от digitalis Посмотреть сообщение
Сменить хотелку. Распознавание голоса - очень сложная задача, особенно - с неограниченным словарём.
т.е. не представляется возможным использовать любой сторонний сервис ? (даже в телефоне у меня есть распознание голоса) и совместить использование стороннего сервиса для распознания голоса,чтобы получить желаемый текст,а дальше уже решить вопрос с тем,как бы этим текстом управлять голосом
макс1611 вне форума Ответить с цитированием
Старый 21.05.2020, 05:48   #4
MihalNik
МегаМодератор
СуперМодератор
 
Регистрация: 27.11.2012
Сообщений: 5,657
По умолчанию

Цитата:
Сообщение от digitalis Посмотреть сообщение
Сменить хотелку. Распознавание голоса - очень сложная задача, особенно - с неограниченным словарём.
Тут как раз очень ограниченный словарь. Так что хотелка нормальная.
Благими намерениями устлана дорога на programmersforum.ru
MihalNik вне форума Ответить с цитированием
Старый 21.05.2020, 07:46   #5
evg_m
Старожил
 
Регистрация: 20.04.2008
Сообщений: 5,526
По умолчанию

Цитата:
Тут как раз очень ограниченный словарь. Так что хотелка нормальная.
ну-ну...
Цитата:
в общем я хочу голосом вводить текст. но не просто надиктовка обычная
программа — запись алгоритма на языке понятном транслятору
evg_m вне форума Ответить с цитированием
Старый 21.05.2020, 09:54   #6
ViktorR
Старожил
 
Регистрация: 23.10.2010
Сообщений: 2,306
По умолчанию

Точно в этой области не дока. Но!

Москва, Астросовет, лето-осень 1970-го.
Мой товарищ программировал голосом задачу, связанную с расчётом эволюционных треков звёзд.
Это была его преддипломная практика.
Так как было это очень давно, то язык не помню, но что-то в стиле Алгола-60.
ЭВМ, как понимаете, были не персоналки с гигами ОЗУ и террами ЖД.
Да, там ограниченный словарь и перед началом записи он проговаривал несколько фраз, которые запрашивала программа.

И неужто эволюция не продвинулась дальше тех экспериментальных установок?
Как-то так, ...
ViktorR вне форума Ответить с цитированием
Старый 21.05.2020, 10:30   #7
digitalis
Старожил
 
Аватар для digitalis
 
Регистрация: 04.02.2011
Сообщений: 4,546
По умолчанию

Эволюция, конечно, продвинулась, но не до такой же степени, что вопрос можно решить парой десятков строк кода. Конечно, есть законченные решения (думаю, ФСБ тут согласно кивнёт головой ), но добыть их и интегрировать в задачу ТСа - это, IMHO, - не два байта переслать.
При слове Алгол-60 прошибла ностальгическая слеза: 75-76г, ВЦ АН СССР, БЭСМ-6...

Последний раз редактировалось digitalis; 21.05.2020 в 10:32.
digitalis на форуме Ответить с цитированием
Старый 21.05.2020, 12:01   #8
kvitaliy
Участник клуба
 
Регистрация: 17.05.2011
Сообщений: 1,660
По умолчанию

Цитата:
Сообщение от ViktorR Посмотреть сообщение
И неужто эволюция не продвинулась дальше
У вас смартфон на Андроиде есть? Там распознавание работает достаточно четко, по крайней мере сообщения в различных сетях я диктую на любые темы и ошибки бывают крайне редко.
Другой вопрос, что там работают мощные модели нейронных сетей, а на одном процессоре такое организовать мочи не хватает. В Win 10 встроена фича распознавания. Но по-русски это не работает. Да и по не-русски наверняка не так хорошо, как у Гугла на Андроиде.
Это я сейчас к тому написал, что продвинутся самолично на этом поприще ресурсов не хватит.
Есть попытки, типа Горыныч - программа распознавания русской речи, но хороших отзывов я не слышал.
Кстати, Гугл предоставляют свой АПИ для встраивания в ваши приложения, но не бесплатно. Хотите повелевать голосом компом - платите
По сути всё, что вам требуется, это получить сказанную фразу обратно в виде текста. Остальную обработку должна сделать уже ваша программа, так сказать Front-end.
По этому можете пока программировать свою часть на предмет: если такая то фраза, то сделать то-то и то-то.
А распознавание потом прикрутить - дело техники (изучение соотв. API ) и немного денег.
kvitaliy вне форума Ответить с цитированием
Старый 21.05.2020, 14:29   #9
сфинкс
Форумчанин
 
Аватар для сфинкс
 
Регистрация: 17.06.2012
Сообщений: 957
По умолчанию

думаю по теме: speechpad

но лично я не проверял
Случайные и Массивы https://programmersforum.ru/showthread.php?t=344371 Учим C# & basic & excel & python https://programmersforum.ru/showthre...=327446&page=5 ничего нерекомендую
сфинкс вне форума Ответить с цитированием
Старый 21.05.2020, 21:22   #10
макс1611
Новичок
Джуниор
 
Регистрация: 20.05.2020
Сообщений: 6
По умолчанию

Цитата:
Сообщение от kvitaliy Посмотреть сообщение
У вас смартфон на Андроиде есть? Там распознавание работает достаточно четко, по крайней мере сообщения в различных сетях я диктую на любые темы и ошибки бывают крайне редко.
Другой вопрос, что там работают мощные модели нейронных сетей, а на одном процессоре такое организовать мочи не хватает. В Win 10 встроена фича распознавания. Но по-русски это не работает. Да и по не-русски наверняка не так хорошо, как у Гугла на Андроиде.
Это я сейчас к тому написал, что продвинутся самолично на этом поприще ресурсов не хватит.
Есть попытки, типа Горыныч - программа распознавания русской речи, но хороших отзывов я не слышал.
Кстати, Гугл предоставляют свой АПИ для встраивания в ваши приложения, но не бесплатно. Хотите повелевать голосом компом - платите
По сути всё, что вам требуется, это получить сказанную фразу обратно в виде текста. Остальную обработку должна сделать уже ваша программа, так сказать Front-end.
По этому можете пока программировать свою часть на предмет: если такая то фраза, то сделать то-то и то-то.
А распознавание потом прикрутить - дело техники (изучение соотв. API ) и немного денег.
мне таки стоит научиться лучше формулировать вводные.
вообще делается это всё для врачей стоматологов. которые записывают зубную формулу.чтобы они могли это делать в режиме "руки во рту " (т.е. представьте,вам надо надиктовать некие данные,но данные не о чем-то...а всегда об одном и том же)
и что мы имеем?
1) нет задачи делать всё "самостоятельным" (не,было бы круто,но не нужно ), никто не мешает сделает диалоговое окно ,тыкнув в которое можно будет набрать сообщение голосом с помощью телефона,далее настроить автоматическую отправку сообщения ,после 5 секунд "простоя" (и не надо горынычей ,используем возможности гугла бесплатно)
2) вопрос стоит скорее в написании нужного кода ,который разеберёт полученный текст. правда вот прелесть ситуации в том,что речь вполне себе конкретная ,с набором слов весьма ограниченным. так еще и естественные "метки" имеются (речь выглядит так "зуб такой то - то то ,зуб такой то - то то" и т.д. ),по которым можно относительно легко эту речь поделить на составные
3) приделываться это будет к сайту,сделанному на питоне . что (как я знаю) тоже немного руки развязывает и облегчает задачу

вопрос в том,как наиболее изящно решить данную задачу.
без привлечения сверх средств (мне уже предлагали набрать инвестиций на пару лямов $ и собрать команду программистов для решения это нереально сложной задачи)
без приобретения подписок на какие то сервисы
реализовать идею с максимальной "hands free" юзабельностью
макс1611 вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Хочу апгрейдить ПК для игр но не знаю что будет лучше Nozar Компьютерное железо 40 10.02.2015 01:11
Хочу изучить язык для личных целей и не знаю на чем остановиться Bounty_7_Coin Свободное общение 7 13.07.2013 11:51
Хочу научится програмированию, не знаю какое направление выбрать. Indoril Общие вопросы по программированию, компьютерный форум 3 14.02.2013 20:06