Опыты со слушателями по ограничению ширины полосы частотного диапазона речи показали, что при подавлении речевых частот ниже 350 Гц разборчивость речи существенно не меняется. Более того, в хороших условиях слышимости разборчивость почти не уменьшается при частоте среза 580 Гц.
Обнаружено также, что подавление высокочастотных составляющих речевого сигнала с частотой среза 3900 Гц дает весьма небольшое снижение разборчивости для слушателя. Однако при уменьшении частоты среза до 2500 Гц разборчивость значительно ухудшается. Очевидно, стоит упомянуть о том, что эти цифры были получены в опытах со слушателями при использовании фильтров с очень точным выставлением уровня среза.
Интересно заметить, что используемая человеком форма внешнего анализа звуковой частоты с помощью базилярной мембраны и волосковых клеток отсутствует у рыб и низших форм живых организмов. По-видимому, у них нервные импульсы, имеющие частоту, совпадающую с частотой принимаемого звука, поступают для анализа непосредственно в мозг.
14.3. ЕДИНАЯ ЭКВИВАЛЕНТНАЯ ФОРМАНТА [12]
Принято считать, что звуки речи состоят из комбинации трех компонентов, имеющих различные формантные частоты. Их можно заменить единой эквивалентной формантной частотой, сохранив при этом фонетическое содержание звука речи.
Предполагают, что многочисленные медленно меняющиеся составляющие выходного сигнала вокодера обычного типа заменяют только три медленно изменяющихся параметра: единая эквивалентная формантная частота; амплитуда единой эквивалентной форманты; степень «звонкости» звука.
Оказалось, что для упрощения выделения частоты и амплитуды единой эквивалентной форманты можно оперировать длительностью и амплитудой первого полупериода речевого сигнала, следующего за закрытием голосовых связок, либо за быстрым изменением формы звуковой волны сигнала глухого или шипящего звука.
Хотя в работах по реализации такого подхода использовалось очень сложное оборудование, наконец-то появилась возможность ввести меру инвариантности произношения звуков. Можно надеяться, что дальнейшие исследования в этой области позволят дать простое решение проблемы распознавания речи.