3Д БУМ

3Д принтеры и всё что с ними связано

СТРУКТУРА ПРОИЗНОСИМЫХ СЛОВ

Было обнаружено, что для распознавания произносимых цифр в сочетании с такими немногочисленными словами, как «plus» (плюс), «minus» (минус) и «total» (сумма), достаточно оперировать двумя типами согласных звуков английского языка — взрыв­ными (s, t и т. д.) и мягкими (th, f и т. д.). Гласные звуки требуются в качестве дополнения, а для распознавания используются отно­сительные фазы звуковых компонентов. При таком подходе три различных параметра распознаются в каждой из трех различ­ных позиций при условии чередования звуков «согласный—глас­ный—согласный».

В диалоге между людьми используются такие виды визуаль­ной обратной связи, как кивок головой или определенное выраже­ние лица собеседника, и эта обратная связь помогает в общении. При телефонном разговоре отсутствие такой связи может вызвать снижение скорости передачи сообщения.

При диалоге человека с роботом визуальная обратная связь отсутствует и поэтому было бы полезно предусмотреть какую-либо звуковую обратную связь типа высокого короткого радиосигнала «бип» в знак приема и понимания и «жужжания» при неприеме или непонимании сказанного. Параллельно с такой формой обрат­ной связи или вместо нее может использоваться и обратная связь посредством лампочки.

В некоторых типах устройств распознавания речи в конце предложения человек устно запрашивает повторения сказанного им предложения, употребляя слово «проверка», и может затем выдать устное заключение: «правильно» или «неверно». И хотя это, несомненно, снижает скорость общения человека с роботом, для получения одобрения в первых применениях роботов необ­ходимо обеспечить как можно более низкий уровень ошибок. Лучше, чтобы робот, получив устное распоряжение, попросил повторить его, чем рисковать в случае ошибочных действий робота.

Классификация слышимых человеком звуков базируется на поистине безграничном опыте, на основе которого были сформи­рованы знания о языковой системе, которой обладают люди. Далее, благодаря высокой избыточности речи, слушатель может извлечь из памяти гораздо больше языковой информации, чем он получает из непосредственной звуковой информации во время разговора. Поэтому человек может понимать беглую речь.

Большинство устройств распознавания речи целиком основы­вается на входной информации о волновом звуковом сигнале. Этот подход полностью себя оправдывает лишь при ограниченном словаре, особенно тогда, когда используются звуки, произносимые только одним индивидуумом [47].

Однако уже для простейшей формы беглой речи нельзя ожи­дать, что данный подход будет успешным. Единственная возмож­ность в этом случае — построение устройства, способного к само­обучению, и отказ от попыток соорудить такое устройство, ба­зируясь на наших собственных предвзятых представлениях [31 ]. Такой прибор надо снабдить чем-то вроде улитки уха человека и предоставить ему возможность самостоятельно устанавливать ассо­циативные связи между звуками речи [47]. Этот процесс, как и у людей, будет медленным.

Для любых предложений по сайту: [email protected]