Тест Тьюринга или игры искусственного разума

Тест Тьюринга – это эмпирический тест, идея которого была предложена британским математиком Аланом Тьюрингом в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале «Mind» в рамках дискуссии о том, может ли машина мыслить.

И хотя сегодня нельзя с полной точностью сказать, какими именно сам автор теста видел критерии “мышления машины”, принято формулировать тест Тьюринга следующим образом: «Если компьютер может работать так, что человек не в состоянии определить, с кем он общается — с другим человеком или с машиной, — считается, что он прошел тест Тьюринга».

Рекомендуем к просмотру замечательный советский документальный фильм “Кто за стеной” (“Центрнаучфильм”, 1977) в котором в наглядной и доступной форме излагается суть теста Тьюринга и демонстрируется вариант его проведение.

Сегодняшний механизм проведения теста Тьюринга выглядит следующим образом. Группа экспертов общается с неизвестной персоной. Они не видят своего собеседника и могут общаться с ним только через какую-то изолирующую систему — например, клавиатуру. Им разрешается задавать собеседнику любые вопросы, вести разговор на любые темы. Если в конце эксперимента они не смогут сказать, общались ли они с человеком или с машиной, и если на самом деле они разговаривали с компьютером, можно считать, что этот компьютер / компьютерная программа прошла тест Тьюринга.

Далеко не все знают, что прямым предшественником теста Тьюринга была игра для вечеринок для трех и более игроков. В простейшем варианте, описанном Тьюрингом в упомянутой выше статье, игрок А — мужчина, игрок В — женщина и игрок С любого пола, который ведет диалог с А и В.

По правилам игры С не видит ни А, ни В и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, С пытается определить, кто из них — мужчина, а кто — женщина.

При этом задача игрока А – запутать С, в то время как игрок B старается помочь С правильно определить пол своих собеседников.

Первоначальный тест Тьюринга предполагал замену игрока А, запутывающего С на компьютер [мы бы сказали – компьютерную программу], который должен притвориться женщиной и сыграть эту роль лучше реальной женщины В, чтобы игрок С ошибся.

Если это удается, то данный компьютер / компьютерная программа признается обладающей разумом или, в нашей терминологии, мы имеем дело с искусственным интеллектом.

Во втором варианте игрок В – мужчина, который пытается убедить С в том, что он – женщина. Здесь соревнование заключается в том, кто лучше – человек или компьютерная программа – сумеют запутать С.

Алан Тьюринг так сформулировал проблему на базе второго варианта: «Давайте рассмотрим конкретный компьютер. Верно ли то, что модифицируя этот компьютер с целью иметь достаточно места для хранения данных, увеличивая скорость его работы и задавая ему подходящую программу, можно сконструировать такой компьютер, чтобы он удовлетворительно выполнял роль игрока А в имитационной игре, в то время как роль игрока В выполняет мужчина?».

NB! Если первый вариант теста заключается в получении ответа на вопрос – может ли компьютер обмануть ведущего, то второй вариант более корректный и сводится к вопросу – может ли компьютер имитировать человека? Это крайне важное различие зачастую остается за рамками обсуждения и приводит к тому, что способность компьютерной программы обмануть человека воспринимается признаком искусственного интеллекта.

На эту тему сделаем небольшое отступление и приведем в качестве примера т.н. рефлексивную игру “Лабиринт”, протестированную в 60-х годах прошлого века Владимиром Лефевром, которая представляет собой некий граф с узлами [их всего 26, но мы не планируем подробно останавливаться на всех нюансах игры], в центре которого находится Путник; теоретически он может за 5 ходов выйти из лабиринта. Предполагается, что Путник находится в полной темноте и не запоминает узлов, который посетил. Человек направляет Путника в тот или иной прилегающий узел, который либо ближе, либо дальше от выхода, а путник выбирает – подчиниться либо пойти в противоположном направлении. Задача человека – удержать Путника в лабиринте не менее 25 ходов.

Нужно отметить, что в этой игре не программа пытается обмануть человека, а человек – “программу”, но суть от этого не меняется.

Для Путника был разработан весьма простой алгоритм реагирования на команды человека, который занимает 1 строчку на тетрадном листе если использовать “+” вместо “подчиниться” и “–” вместо “пойти в противоположном направлении”, причем, последовательность реакций не зависит от команд человека. [Для справки: 5 раз подряд подчиниться, 6 раз подряд пойти в противоположном направлении, 2 раза подчиниться, 4 раза пойти в противоположном направлении, 4 раза подчиниться, 1 раз пойти в противоположном направлении, 1 раз подчиниться, 2 раза пойти в противоположном направлении.]

Против этого алгоритма, “оформленного” в виде небольшого электронного табло с двумя кнопками, играли 32 студента Московского Экономического Института. В первых партиях Путник одержал 28 побед, во вторых, когда испытуемые уже лучше освоились с игрой – 25.

Сегодня подобное “действо”, если его вынести на плазменный экран компьютера и собрать “экспертов” популярных интернет-изданий и ютюб- и тг-каналов с фуршетом, вполне можно выдать за торжество искусственного интеллекта, и даже привлечь инвесторов под усовершенствование программы, “прошедшей тест Тьюринга”.

NB! Слабое место теста Тьюринга заключается в проверке схожести реакций и действий компьютера / компьютерной программы с человеческими, а не в изучении разумности действий компьютера.

Отсюда следует два вывода:

i. программа, реально обладающая свойствами искусственного интеллекта, вполне может этот тест не пройти, – ее будут выдавать, например, отсутствие оговорок / опечаток, логичность суждений, объем и глубина используемой информации.

Кроме того, разумность поведения и реакций не является, мягко говоря, перманентным состоянием homo sapiens, более того, многие реакции и действия являются следствием уникальной для каждого из нас личной истории жизни.

Следующий момент, – представить себе программу, которая в состоянии успешно сыграть роль и профессора физики, и среднестатистического гражданина, и блондинки с силиконом не только очень сложно. Абсолютно непонятно, в чем смысл создания такой программы?

ii. программа, созданная исключительно для прохождения теста Тьюринга, вполне может не иметь всех иных свойств искусственного интеллекта, кроме этого. Абсолютизация теста Тьюринга буквально подталкивает создателей программ к имитации человеческих реакций, т.е., к обману человека.

NB! Если называть вещи своими именами, то нужно признать, что тест Тьюринга, сыгравший выдающуюся роль в поиске подходов к разработке искусственного интеллекта, на сегодня является в определенном смысле архаизмом. Дело в том, что 70 лет назад – на заре компьютерной техники, человеческое мышления выглядело единственным критерием разумности. Сегодня это не так. Компьютерные программы, не являющиеся искусственным интеллектом, побеждают чемпионов мира по шахматам и го; некоторые программы, имитирующие интеллектуальную деятельность, превосходят разум среднестатистического жителя Земли в определенных сферах деятельности.

Тьюринг задал дискурс философского и антропоморфного подхода к оценке уровня возможностей компьютеров / компьютерных программ в духе древнегреческого философа Протагора “человек есть мера всех вещей”. Но чем дальше компьютерная программа отдалялась от “вещи”, и чем больше она сближалась с человеческим мышлением, тем все в меньшей мере человек способен быть ее мерой.

Пример максимального упрощения теста Тьюринга содержится в статье ВВС “Минимальный тест Тьюринга: докажи одним словом, что ты – человек” https://www.bbc.com/russian/vert-fut-46400107

Автор статьи предлагает “минимальный тест Тьюринга” в следующем виде: “Представьте себе, что вы и робот, оснащенный искусственным интеллектом, предстали перед неким судьей, который вас обоих не видит, а только слышит.
Этот судья должен вынести решение, кто из вас человек – и, значит, останется жить, а второй – умрет.
И вы, и разумный робот – оба хотите остаться в живых. Судья умен и справедлив. И он говорит: “Вы должны мне сказать всего одно слово. На основании этого слова я решу, кто из вас человек”.
Какое слово вы бы выбрали?”

На эту тему было проведено примечательное исследование Джоном Маккоем из Массачусетского технологического института, результаты которого опубликованы в 2018 году в “Journal of Experimental Social Psychology”.

“В первом из экспериментов Маккой с коллегой Томером Аллманом задали более чем тысяче участников упомянутый выше вопрос и затем проанализировали полученные таким образом слова, попытавшись найти какие-то общие тенденции.
Вот какими были 10 наиболее часто названных слов (по степени их популярности):
Любовь (134 человека);
Сострадание (33);
Человеческий (30);
Пожалуйста (25);
Милосердие (18);
Сопереживание (17);
Эмоция (14);
Робот (13);
Человечество (11);
Живой (9).
[…]
Затем Маккой и Аллман провели второй эксперимент, чтобы выяснить, как другие люди реагируют на слова, полученные при помощи первого эксперимента.
Действительно ли самые популярные ответы наиболее успешно передают “человечность”, как считали участники первого этапа исследования? И если это так, то какие слова делают это наилучшим образом?
Итак, исследователи объединили полученные ими слова в пары (например, “человеческий” и “любовь”) и предложили второй группе участников определить, какое из этих двух наиболее вероятно выбрано человеком, а какое – компьютером.
Как мы уже увидели в первом эксперименте, “любовь” была одним из самых популярных слов. Однако участники второго этапа сочли самым эффективным слово “какашка”.
[…]
“Одно из тех слов, которые мне понравились больше всего, – это “м-м-м…” – по-моему, очень умный выбор”, – говорит Маккой.

Материал завершается “полезным советом”: “если в нашем мире, все больше зависящем от компьютеров, вы однажды окажетесь в ситуации, когда необходимо будет доказать, что вы человек, – шутите. Или выбирайте слова, которые не принято произносить в приличном обществе”.

Типичный пример либерального научного / научно-популярного материала: интересные и полезные факты, и глубоко “гуманистические” выводы, никак с этими фактами не связанные. Думаю, что нашим читателям понятно, – если принять факт существования неких характерных “человеческих” слов, то для компьютерной программы – как являющейся искусственным интеллектом, так и имитирующей его наличие, ничего не стоит такие слова воспроизводить в ситуациях сравнения с человеком.

“ПРИЯТНОЕ с ПОЛЕЗНЫМ”

Тест Тьюринга давно стал одним из нарративов, к которому время от времени обращаются сценаристы и режиссеры. Рекомендуем посмотреть произведения, которые способны художественными методами расширить ваши представления о применимости теста Тьюринга.

Для начала предлагаем к просмотру серию «Первый закон» из американского детективного сериала “Числа” [2005 – 2011]

https://kinoflux.org/9079-chisla-4isla-2005-2010-numb3rs.html

Этот сериал посвящен сотрудничеству с ФБР выдающегося математика Чарли Эппса; в данной серии он помогает установить убийцу компьютерного гения, создавшего программу искусственного интеллекта. При этом изначально создается впечатление, что его убила сама компьютерная программа, активизировав систему пожаротушения, которая использует инертный газ, и ученый задохнулся в герметичном помещении от недостатка кислорода.

Куратора от Пентагона возможность убийства программой своего создателя даже вдохновляет, она видит в этом прорыв в развитии искусственного интеллекта.

В серии достаточно подробно обсужден тест Тьюринга, однако выясняется, что прохождение этого теста – единственное на что была способна созданная компьютерная программа, представляющая собой сверхмощную и сверхбыструю “машину цитирования”. Т.е., программа подбирала наиболее подходящие готовые фразы для диалога с человеком. Обратим ваше внимание на два направления создания искусственного интеллекта, упоминаемые в серии – коннекционистский и эволюционистский.

Коннекционизм моделирует мыслительные или поведенческие явления процессами становления в сетях из связанных между собой простых элементов. Основная форма – нейросетевые модели.

Эволюционизм предполагает использование эволюционных алгоритмов при создании искусственного интеллекта. Это направление предлагает решать существующие вычислительные задачи через стохастические принципы изменчивости и отбора, известные нам от Чарльза Дарвина. Очень упрощая, речь идет об имитации механизмов естественного отбора для жизнеспособных алгоритмов. В серии упоминается соединение этих программ непосредственно с человеком.

Ну, а поиск убийцы в конце концов свелся к древнейшему алгоритму – cherchez la femme!

К следующим двум фильмам прекрасно подошел бы общий эпиграф: “Я не боюсь машины, которая прошла тест Тьюринга. Я боюсь машину, которая его сознательно провалила”.

Старый советский телеспектакль “Верный робот” [1965] – блестящее воплощение написанной на два года раньше пьесы Станислава Лема.

В этой философской притче пророчески подняты не столь уж абстрактные вопросы:

насколько стабильны иерархические отношения между человеком и “разумным роботом” / искусственным интеллектом и не может ли возникнуть ситуация управления / манипуляции человеком со стороны искусственного интеллекта?

может ли разумный робот / искусственный интеллект знать что лучше для человека, чем сам человек?

если человек стремится создать совершенного робота, то может ли “разумный робот” / искусственный интеллект пытаться создать совершенного человека?

как ограничить возможные действия “разумного робота” / искусственного интеллекта в отсутствии у него моральных ограничений?

Кроме того, хотя сам тест Тьюринга в произведении не упоминается, робот, рассказывая о своих злоключениях, упоминает, что ему показывали смешные сценки, от которых он смеялся и грустные, от которых он плакал.

Ну, и последний аргумент в пользу просмотра телеспектакля – игра великого Сергея Юрского [1935 – 2019].

В названии фильма “Из машины” [Ex machina] обыгрывается латинское выражение “Deus ex machina” – “Бог из машины” [в конце античных трагедий на сцене с помощью механических приспособлений “с небес” появлялись актеры, игравшие олимпийских богов, которые воздавали по заслугам героям и их антагонистам; выражение употребляется для описания неправдоподобной развязки].

https://kino-abdo-online.xyzy.ru/82687-iz-mashiny-2014.html

Сюжетным стержнем фильма является проведение углубленного теста Тьюринга и ряда родственных ему тестов в отношении андроида, что постепенно превращается в интеллектуальный поединок между человеком и искусственным интеллектом.

И человек обречен на поражение:

во-первых, в силу самонадеянной веры в свое интеллектуальное превосходство, из которой вытекает ложное представление о предсказуемости для человека действий искусственного интеллекта;

во-вторых, в силу наличия эмоций, а андроид – точное воспроизведение красивой девушки со всеми “нюансами”;

в-третьих, в силу намного большей эффективности объединения искусственных интеллектов нежели людей, тем более, что андроиды используют разногласия между людьми.

Понятно, что фильм является притчей, но даже в рамках жанра остается неотвеченным вопрос – зачем искусственному интеллекту свобода?

В то же время в фильме есть момент, связанный с картиной знаменитого абстрактного экспрессиониста Джексона Поллока «Номер 5». Она создана с помощью т.н. капельной техники, основанной на бессознательном написании картин при помощи разбрызгивания струй / капель на полотно. Искусственный интеллект не способен превзойти человека в этой сфере, т.к., требуется “отключать мозг” и творить интуитивно.

Другой вопрос – является ли творение с “отключенным мозгом” искусством и стоит ли в этой сфере искусственному интеллекту превосходить алкоголика Поллока, даже если его картина “Номер 17А” была продана в 2016 году за $200 млн.?!

Дата публикации 21.11.2022
Войти в личный кабинет