12.1. ПРОСТЫЕ СПОСОБЫ РАСПОЗНАВАНИЯ СИМВОЛОВ
Часто можно видеть очень сложное оборудование, сконструированное для распознавания печатных или письменных символов и преобразования их в код, удобный для использования в вычислительной машине. Роботы такого рода совершенно справедливо относятся к кибернетической технике. Интересно попытаться упростить это чрезвычайно сложное оборудование до необходимого минимума. Большая часть сложностей приходится на основные механические манипуляционные системы, необходимые для подачи документов, которые должна читать машина. Однако сама читающая часть оборудования зачастую тоже достаточно сложна.
Сотрудник Астонской кибернетической лаборатории Д. Г. Хопкинс сделал попытку найти способы сужения задачи распознавания символов до минимально необходимой [35 1. Обычно принято заранее жестко определять внешний вид символа, подлежащего распознаванию какой-либо системой для распознавания символов. После того как это сделано, возникает вопрос, каков минимальный объем оборудования, которое может использоваться для распознавания и различения заданного числа различных символов. Как и в большинстве оригинальных работ, ответ Хопкинса на этот вопрос, после того как он получен, кажется настолько очевидным, что интересно кратко проследить процесс продвижения от сложного к простому в этом случае.
Хопкинс начал с допущения о том, что он будет использовать множество из 25 фотоэлементов, в то же время ясно сознавая, что глаз человека содержит намного больше чувствительных элементов. Затем он видоизменил конфигурацию 10 своих цифровых символов таким образом, чтобы они состояли из прямых линий, а кривые линии были почти полностью исключены. Благодаря этому обеспечивалось адекватное «покрытие» используемых фотоэлементов и уменьшалась неопределенность. Преобразованные символы приобрели квадратную форму, но не в очень сильной степени.
Затем фотоэлементы были обозначены по рядам: ряд 1, ряд 2, …, ряд 5 —■ и по столбцам: столбец А, столбец В, . . ., столбец Е. Теперь любой фотоэлемент мог быть определен, например, как СЗ. Информация об освещенности фотоэлементов, связанная с каждым из символов, подлежащих распознаванию, сводилась в таблицы. Эти таблицы тщательно проверялись на избыточность, например на наличие элементов, которые никогда не освещаются, или повторяющихся образцов.
В результате проверки обнаруживаются элементы, которые покрываются всеми символами, кроме одного, или же не покрываются никакими символами, кроме одного. Девять таких элементов могут использоваться для индикации всех 10 символов (10-й делается избыточным применением метода исключения). Однако, даже если и находятся девять таких элементов, это число все еще превышает абсолютный минимум, равный четырем элементам. Минимальное число элементов, необходимых для обнаружения 10 различных символов, которые можно разделить, располагая тремя элементами, равно 8 = 23. Если теперь найдены элементы, которые покрываются (или ие покрываются) двумя из символов, то потребуется минимальное число элементов, равное шести. В том случае, когда число символов, позволяющих покрыть или не покрыть любой отдельный элемент, равно трем, теоретически требуется только пять различных элементов. Приведенные рассуждения позволяют сделать вывод, что интерес должны представлять такие системы, в которых четыре или пять из 10 цифровых символов могут покрывать (или не покрывать) любой отдельный фотоэлемент.
Работая с уменьшенной таблицей, о которой упоминалось выше, мы обнаружили в результате проверки, что в полной матрице, состоящей из 25 элементов, есть три элемента, а именно элементы под номерами А4, ВЗ, Е2, которые удовлетворяют указанным требованиям. Однако они не позволяют различить цифры 2 и 8, а также цифры 3 и 9. Этого и следовало ожидать, поскольку используются только три фотоэлемента. Добавление еще одного фотоэлемента должно позволить разделять 2 и 8, а также 3 и 9. Это оказалось именно так, и проверка матрицы показала, что номер этого дополнительного элемента—■ А2. Таким образом, располагая четырьмя элементами—А2, А4, ВЗ, Е2,— можно различать все 10 различных символов.
Теперь важно отметить, что полученная конфигурация элементов не обязательно единственная, в частности потому, что конкретное множество символов выбиралось до нахождения требуемого расположения фотоэлементов. Как бы то ни было, наиболее важно то, что Хопкинск показал осуществимость этого метода, которая, в свою очередь, демонстрирует целесообразность формального инженерного подхода к конструированию символов и их распознованию. Экспериментальное оборудование, созданное в Астоне Хопкинсом, очень простое и весьма удачное.