fk0, легенда (26.06.2013 16:06, просмотров: 177) ответил Blackbird на нумера и гласные звуки в словах еще в 1960х научились различть - бо не сложно . А щас мельком взглянул на алгоритмы распознавания - их МНОГО то бишь ОЧЕНЬ много и холивар идет нехилый КАК именно распознавать эту долбаную речь. Цельные институты
Алгоритмов много может в области языка. А что касается именно распознания речевых фрагментов, о чём я писал, вариант практически один с мелкими вариациями (т.н. Dynamic time warping над двойным FFT). Но он те же числа произносимые разными людьми уже не различает. А на счёт 60-х годов вспоминаются другие интересные технологии незаслуженно забытые. Сейчас их можно ещё видеть на почтовых конвертах и кредитных картах: специальные шрифты, упрощающие компьютерное распознавание (OCR-A шрифт, например). Причём распознавание велось совершенно по другим принципам, не как человек или современный софт воспринимает, всё гораздо проще: подсчитывалось сколько раз символ пересекается горизонтальными, вертикальными и наклонными линиями. И это работает. Так же и с речью может быть. Нет, речь не о распознавании речи и осмыслении компьютером сказанного с привязкой к человеческому языку. Но если есть три десятка команд, то они могут обнаруживаться, например, по чередованию гласных, например. А распознавание запускаться вовсе нажатием на кнопку, для исключения ложных срабатываний. По такому принципу работают некоторые любительские поделки на ATMEGA8... Без могучих серверов.
[ZX]