Ряд факультетов в различных университетах мира получил солидную финансовую поддержку, которая позволила вести работу по управлению полностью подвижной машиной от большой цифровой ЭВМ.
Такие исследования проводились в М. I. Т. [33] под руководством Минского и Паперта, в Стэнфордском университете под 132 руководством Маккарти [20, 35, 36] и в Эдинбурге под руководством Мичи [4, 32, 65, 107, 124].
В МЛ. Т. весьма сложная суставная искусственная рука и кисть [33] управлялись ЭВМ PDP6, получающей информацию от телевизионной камеры. Кисть этой руки могла захватить и поднять кубики разных размеров, а затем собрать из них вполне определенную фигуру на заданной площади. Фигуры можно собирать в заданной последовательности.
Имея дело с такими сложными сборочными операциями, трудно выбрать задание, которое было бы не слишком трудным и не слишком простым. В Стэнфорде использовалась полностью подвижная машина, смонтированная на управляемой тележке. В начале работы не стремились встроить ЭВМ в подвижное устройство, поэтому мощный кабель подводился к ЭВМ сверху. Тележка приводилась в движение двумя шаговыми двигателями с независимыми приводами к ведущим колесам на каждой стороне тележки. Телевизионная камера, установленная на тележке, также приводилась в движение шаговым двигателем. На первом этапе работы стзнфордская тележка не оснащалась рукой, но могла толкать объекты вдоль пути движения. На тележке устанавливался оптический дальномер, снабжавший ЭВМ дополнительной информацией по кабелю. В дальнейшем было решено заменить кабельные линии связи радиоканалами. Для управления использовалась большая ЭВМ, работающая в режиме с разделением времени.
Обнаружение контура изображения в электронной системе, связанной с телевизионной камерой, а также процессы дифференцирования, сегментирования изображения и реконструкции сегментов использовались в ЭВМ для построения эквивалентного линейного контурного рисунка осматриваемого объекта. Управление движением тележки производилось прямым отсчетом координат от исходного положения, хотя этот способ ведет к ошибкам, связанным с проскальзыванием и неровностями поверхности.
В недавней работе над устройством «Фредди» на отделении машинного интеллекта Эдинбургского университета для искусственного зрения использовалась телевизионная камера на види — коне. Большая двухпалая рука управлялась ЭВМ по сигналам от телевизионной камеры. Эта работа была направлена главным образом на создание программного обеспечения для интегральной «познающей» системы, т. е. системы, которая может строить абстрактные модели внешнего мира и манипулировать ими [124,
Робот «Хивип» фирмы «Хитачи». Японский робот-рука «Хивип МКЬ фирмы «Хитачи» представляет собой сборочное устройство, которое осматривает ортогональную проекцию объекта сборки и составляющие его части, затем устанавливает последовательность сборки и управляет семистепенным манипулятором в процессе сборки. Эта работа фирмы «Хитачи» описана Июри и др. [50, 105, 106]. В отличие от первых промышленных роботов, для которых требовалось подробное программирование точной последовательности всех движений робота, инструкции для «Хивипа» задаются всего лишь в виде чертежа объекта сборки в трех проекциях аналогично тому, как это делается при выполнении сборки человеком.
Робот объединяет три подсистемы: «глаз», «мозг» и «рука». Одна из телевизионных камер на видиконе осматривает чертеж сборки, в то время как другая осматривает стол и определяет местоположение группы деталей, ожидающих сборки и произвольно расположенных на столе.
Каждое телевизионное изображение разбивается на 76 800 элементов: 240 по вертикали и 320 по горизонтали, и световой поток, отраженный от каждого из этих элементов, кодируется в аналого-цифровом преобразователе пятиразрядным кодом (32 уровня кодирования).
Вычисления, необходимые для управления движениями руки, осуществляются управляющей ЭВМ «Хитак-7250», которая имеет память на сердечниках объемом 32 768 16-разрядных слов и требует 2 мкс на цикл и 4,5 мкс на операцию сложения. ЭВМ обрабатывает информацию о сцене, осматриваемой объективами камер, до тех пор, пока не останется только одно требуемое изображение. Оставшаяся после обработки изображения информация «прореживается» в три шага: сначала каждый четвертый элемент изображения, затем каждый второй и вслед за этим отдельные элементы изображения вводятся в ЭВМ, которая сама выбирает соответствующий уровень для получения двухуровневого чернобелого изображения и может также дифференцировать изображения для выделения контуров объектов.
Семистепенная шарнирная рука робота «Хивип» с параллельными захватывающими губками управляется одновременно семью независимыми сервосистемами, в каждой из которых используются сельсин, разлагающий сигнал на составляющие для определения положения, и серводвигатель постоянного тока с тиристорным управлением.
Выданный роботу чертеж трех проекций сканируется телевизионной камерой и используется для получения в ЭВМ списка точек, линий и контуров. Исходя из этого перечня определяется трехмерная конфигурация объекта сборки, причем обычные проблемы, связанные с невидимыми линиями, исключаются в ЭВМ программным путем. Затем структура объекта сборки вычисляется программой и разбивается на подмножества составляющих ее частей, необходимых для сборки.
Отдельные детали, находящиеся на столе, обнаруживаются при сканировании телевизионной камерой, и эта информация, закодированная пятью битами, поступает в ЭВМ. Цвет объектов в описываемой работе не рассматривался. ЭВМ определяет и запоминает положение каждого из объектов на столе и выбирает детали, необходимые для требуемого процесса сборки. Последова — 134 тельносіь сборки вычисляется как процесс, обратный такому процессу разборки, который потребует минимального количества сборочных движений. Затем выбираются две параллельные поверхности на объекте, удобные для захвата пальцами робота. В ЭВМ вычисляются необходимые для сборки траектории и движения кисти, а также углы в каждом из сочленений, после чего семь движений одновременно и независимо управляются ЭВМ и таким образом реализуется движение по непрерывной траектории.
Программное обеспечение для этого робота составляет более 400 ООО слов; программа хранится на магнитном барабане емкостью 512 000 слов. Для программирования использовался язык Фортран. На обработку изображения затрачивалось до 240 с: 20 с шло на чтение чертежа, 50 с — на распознавание каждого объекта, 10 с — на принятие решение и в среднем 180 с — на движения руки при сборке. Полагают, что для подобных целей необходимы новые более быстродействующие процессоры, в которых будет применяться распараллеливание операций.
Стэнфордский проект [53, 112—115, 126]. В проекте по искусственному интеллекту Стэнфордского университета механическая рука использовалась для складывания кубиков, местонахождение которых определялось программой прослеживания контура. В первых экспериментах [51, 52, 54] программа обнаруживала и выделяла только контуры хорошо освещенных белых кубиков, лежащих на черном столе; однако исследование последнего времени было посвящено обнаружению контура в условиях, к которым предъявлялись менее жесткие требования.
Сканирующая телевизионная трубка видикон дает множество из 333×256 отсчетов яркости изображения 60 раз в секунду. Яркость каждого отсчета кодируется четырьмя битами информации (16 уровней яркости). Для получения оптимальных результатов эффективная ширина этого окна в 16 уровней квантования яркости регулируется за 1 мкс путем варьирования динамического диапазона и разрешающей способности. Для получения максимальной разрешающей способности 16 уровней квантования укладываются в пределах 1/8 В при полном рабочем диапазоне видеоусилителя 1 В, в то время как для получения максимального динамического диапазона 16 уровней развернуты на весь диапазон в 1 В.
Получаемая таким образом эффективная разрешающая способность возрастает и становится эквивалентной 128 уровням (семь бит). Информация вводится в машину через высокоскоростной цифровой канал с пропускной способностью 24 млн. бит/с.
ЭВМ PDP6 управляет наклоном и поворотом передающей телевизионной камеры, фокусным расстоянием линз объективов, поворотом объективов турели, цветными светофильтрами, фокусировкой и потенциалом мишени видикона. Ирисовая диафрагма в настоящее время устанавливается вручную. На диске, помещенном
между турелью и видиконом, установлены три цветных фильтра и один нейтральный, выбираемые за 0,2 с.
Программа ЭВМ выбирает одно из 64 значений потенциала мишени в диапазоне от 0 до 50 В, правда, для стабилизации изображения после изменения потенциала мишени требуется около 10 телевизионных кадров. Не допускается превышение этим потенциалом величины, создающей максимально допустимую величину среднего тока сигнала.
В первых экспериментах в Стэнфорде нужно было настраивать камеру вручную, чтобы выделить те детали сцены, которые необходимы для выполнения конкретного задания, и, кроме того, программа прослеживания контура могла оперировать только простыми замкнутыми контурами. Для обнаружения контуров использовался простой градиентный оператор размером З X 3. В дальнейшей работе использовался локальный оператор, описанный Хукелем [55], который охватывает от 32 до 177 точек растра. Этот оператор может обнаруживать малоконтрастные изображения в значительной области, несмотря на наличие шумов. Нет необходимости, чтобы все контуры прослеживались за один раз, поскольку программа предусматривает соединение конечных точек линий всякий раз, когда достигается ранее встречавшаяся точка. Постепенно, при помощи различных надежных процедур, составляющих программу, в памяти ЭВМ выстраивается законченная картина контуров сканируемых объектов.
Эта процедура в том виде, в каком она описана Пинглом и Те — ненбаумом [56], действительно имеет преимущество перед некоторыми ранее применявшимися методами, состоящее в том, что благодаря обратной связи процесс сканирования изображения адаптируется к недостаткам рассматриваемой сцены, в результате чего возможно получение оптимальных результатов. Фальк описал методы получения информации от неполных контурных рисунков объектов [57, 125].
Опубликован ряд статей, описывающих программы, языки программирования и системы разделения времени, используемые в Стэнфорде [51—54, 58].
В некоторых экспериментах в Стэнфорде использовалась механическая рука, которая представляет собой протез, изготовленный в госпитале «Ранчо Лос Амигос» под Лос-Анджелесом [59, 64]. В каждом из шести суставов этой руки установлен потенциометр для создания позиционной обратной связи; скорость движения руки управлялась изменением ширины управляющих импульсов. Кисть руки выполнена в виде захвата с двумя параллельно расположенными пальцами. Для целей управления ЦВМ PDP6 и PDP10 были объединены в комплекс, имеющий магнитную память в 128 ООО бит и систему разделения времени для PDP10. Для программирования использовался алголоподобный язык SAIL. Демонстрация этой системы показала, что она может сложить четыре кубика с разноцветно окрашенными гранями в башню, 136 причем каждая сторона башни будет окрашена в четыре разных цвета.
Стэнфордский робот программировался таким образом, что мог установить наклонную плоскость, по которой затем вкатывался на платформу, чтобы забрать коробку, лежащую на этой приподнятой платформе [75]. Роботу требовалось около 30 мин на выполнение задания, из них 20 мин затрачивалось на вычисления в ЭВМ SDS940 с разделением времени и 10 мин на выполнение необходимых физических движений. Следует отметить, что потребовалось около года кропотливой подготовительной работы. прежде чем ЭВМ смогла выполнить такое задание.
Последние достижения в Стэнфорде производят глубокое впечатление, но нужно помнить, что они потребовали огромной емкости машинной памяти. Тем не менее исследования подобного рода дают направление будущим работам не только по линии упрощения процедур и программ и усовершенствования методов зрительного обнаружения объектов, но также и по созданию методов использования параллельной обработки информации для ее ускорения и одновременного выполнения нескольких операций.