3Д БУМ

3Д принтеры и всё что с ними связано

СЛУХ И РЕЧЬ РОБОТОВ

15.1. УСТРОЙСТВА РАСПОЗНАВАНИЯ РЕЧИ [20—22, 24—26, 28—33, 36, 37, 41]

О природе речи известно достаточно много, и, может быть, поэтому считают, что не будет сложно сконструировать устрой­ство для распознавания отдельных слов. В этом направлении велось много работ, и тем не менее успех, по-видимому, столь же неуловим, как и прежде. В то время как оказалось возможным создание устройств, которые могли использоваться человеком для распознавания слов, произносившихся раздельно диктором, было доказано, что построение подобным образом устройства рас­познавания множества слов независимо от диктора и особенно­стей его речи является гораздо более сложной задачей.

Попытки разработки устройств распознавания речи широко освещались автором в другой работе [27]. Использовавшиеся методы в основном базировались на известной структуре уха человека и, следовательно, на некоторых типах частотных анали­заторов. Однако очевидно, что аппарат частотного анализа сам по себе недостаточен даже для распознавания слов с постоянными временными характеристиками, но с изменяющимся энергосо­держанием на различных частотах. Следовательно, этот путь ведет к попытке распознавания частотно-временной структуры — фактически группы информационных элементов Габора [43, 44]. К сожалению, структура частотно-временных элементов речи раз­ных дикторов различается, и возможно, что для учета фильтрую­щего воздействия центральной нервной системы на информацию от органа слуха потребуются другие подходы и особое значение частотного анализа будет утрачено.

Хотя нам представляется, что до распознавания непрерывной речи еще далеко, некоторый прогресс в этом направлении достиг­нут. Однако вероятно, что создать устройство для распознавания речи, подобное естественному, не удастся до тех пор, пока не удастся построить машины, которые на основе заложенных в них элементов информации могли бы обучаться связывать речевые образы с другими явлениями. Нет сомнения в том, что, когда такие машины будут изобретены, они помогут нам узнать о луч­ших способах конструирования устройств, поддающихся обучению распознаванию речи.

Важно отметить, что для человека, слушающего либо речь с незнакомым акцентом, либо незнакомый голос, либо просто находящегося в каких-нибудь новых обстоятельствах, необходимо в течение некоторого времени привыкать к этой речи, к ее звукам, прежде чем станет возможно ее адекватное распознавание.

Сегодняшняя ситуация такова, что в то время как распозна­вание ограниченного набора речевых образов вполне возможно и демонстрировалось многими, мы все еще ожидаем важного от­крытия в этой области. По всей вероятности, его может совершить тот, кто, игнорируя необъятные проблемы, очевидные для лю­бого исследователя, потратившего изрядное время на ознакомле­ние с имеющимися трудностями, решит испробовать простейший способ, совершенно не обязательно основанный на общеизвестных знаниях о речи и слухе.

Во всем мире в этом направлении велось много работ, и далее будут описаны некоторые основные исследования, проведенные в Астоне. Главная их цель — разработка методов распознавания речи, которые могли бы использоваться в сочетаний с соответству­ющими устройствами, подобными машине «Астра», так чго конеч­ной целью является скорее самообучение, чем просто конструи­рование устройств распознавания.

15.2. ВОКОДЕР С ПАССИВНЫМИ ФИЛЬТРАМИ

Первые исследования в Астонской кибернетической лаборатории по использованию вокодеров для обеспечения ввода речевых сиг­налов в ассоциативные устройства были проведены А. Макмил­ланом и JI. Д. J1. Соутером [45].

В ранних работах в качестве избирательных элементов исполь­зовались выпускавшиеся промышленностью LC-фильтры. В це-

Принципиальная схема фильтров с выпрямите­лями

лях ограничения стоимости работ применялись серийные устрой­ства, предназначавшиеся первоначально для фильтрации сигна­лов в телеграфных системах на речевых частотах.

В идеале полосовые фильтры, применявшиеся в вокодерах в экспериментальных целях, должны были бы иметь прямоуголь­ную полосу пропускания. Однако это требование практически невыполнимо, и характеристика фильтра складывалась из суммы двух более простых характеристик фильтров для каждого диа­пазона.

Для того чтобы избежать трудностей, связанных с фазирова­нием, сигналы с фильтров перед смешиванием выпрямлялись (рис. 15.1). В данном случае это вполне допустимо, так как един­ственное требование к выходному сигналу — включать или вы­ключать некоторую схему в зависимости от уровня энергии в соот­ветствующем волновом диапазоне во входном сигнале звуковой частоты.

Фильтрующее устройство подключено к усилителю постоян­ного тока, который управляет выходным ключом. В некоторых из переключающих устройств использовались тиристоры.

Такие устройства довольно успешно применялись на первом этапе расследований, но их использование выявило необходимость уменьшения конструкции до приемлемых размеров.

Для любых предложений по сайту: [email protected]