Тест тьюринга на русском языке. Пройти тест тьюринга. Обратный тест Тьюринга

Когда начинается Вторая мировая война, ученый устремляется в Блетчли-Парк - в Правительственную школу кодов и шифров. Там он присоединяется к специалистам, работающим над расшифровкой посланий, созданных с помощью легендарной немецкой машины Энигма . Ее секретные обозначения нацисты использовали для своих радиограмм. В стенах школы Тьюринг пр идумывает уникальную установку - Turing Bombe.

Махина три метра длиной и весом в две с половиной тонны расправлялась с кодами за считанные минуты. А британская власть получала точную информацию о передвижениях противника. Хотя лента была признана критиками весьма удачной, тем не менее она не раскрывает все научные достижения Алана Тьюринга. А жаль… Этот талантливый профессор долгое время занимался морфогенезом и даже описал математически процесс с амоорганизации материи. Кроме этого, Тьюринг - автор абстрактного вычислительного аппарата, прадедушки современной ЭВМ. А еще ученый - один из первых, кто серьезно задумался о взаимодействии синтетического и живого разумов.

В 1950 году, когда в лабораториях многих стран пытались разработать первые компьютерные программамы , он привлек внимание мирового сообщества своей статьей «Вычислительные машины и разум», которая вышла на страницах журнала Mind. Суть материала сводилась к следующему. Британец предложил заменить вопрос «Думают ли машины » на эквивалентный «Могут ли машины выполнять то, что выполняем мы». В этом случае, как утверждал Тьюринг, возникала бы четкая граница между интеллектуальными и физическими возможностями. В качестве примера Алан привел простой тест. Испытуемый должен общаться параллельно с человеком и с ПК. Беседа ведется не устно с глазу на глаз, а письменно, вслепую, при помощи клавиатуры. Во времена математика ЭВМ не были еще столь быстрыми и мощными. Поэтому переговоры шли с определенными временными интервалами. Паузы снижали скорость реакции, и понять кто есть кто в данной ситуации становилось чрезвычайно затруднительным. Тест сч итался пройденным, если установку принимали за живого субъекта.

Многие полагали, что Тьюринг, осуществляя свое исследование, был настроен жутко пессимистично и перспектива прихода к власти машин его нисколько не радовала. Есть, однако, свидетельства, которые указывают на обратное. Например, друг ученого Робин Ганди частенько припоминал, что когда Тьюринг в сотый раз перелистывал пассажи своей работы, то и дело улыбался и даже хихикал. Как бы то ни было, его поиски стали важной вехой на пути сближения компьютера и человека. И по сути , пробным анализом этой сферы. Позже специалисты пойдут экспериментировать дальше и придумают различные способы, как электронный мыслитель может обвести человека вокруг пальца.

Так, в 1966 году американский ученый Джозеф Вейценбаум (Joseph Weizenbaum) объявил о создании виртуального собеседника - компьютерной программы «Элиза». Она должна была имитировать знатного психотерапевта. Почему Вейценбаум остановился именно на этой медицинской области? Именно здесь можно запросто ответить вопросом на вопрос . К тому же их смысловая нагрузка относительно невелика, нет пространных предложений, а мысли легко структурируются в единую систему. Давая консультацию, «Элиза» не философствовала, а просто перефразировала речь собеседника. Выглядело это примерно так:

Испытуемый: У меня болит голова.

Элиза: Почему вы говорите, что у вас болит голова?

Подчас тестируемые попадали в ловушку и беззаветно верили, что разговаривают с реальным врачом. Но были и курьезные моменты. Периодически в ходе эксперимента люди осознавали, что электронный доктор не понимает сути вопросов. Не находя правильных вариантов ответа, «Элиза» обычно заключала: I see… И переводила диалог на другую тему. Джозеф Вейценбаум писал о своей программе в книге «Возможности вычислительных машин и человеческий разум. От суждений к вычислениям»:

В некотором смысле «Элиза» являлась актрисой, обладавшей определенной техникой, но сказать самой ей было нечего. Сценарий, в свою очередь, представлял собой некоторый набор правил, позволявший актеру импровизировать на любом имевшемся у него материале.

Восемью годами позже, в 1972 году, еще один американец Кеннет Колби (Kenneth Colby) выпускает в свет похожую программу PARRY, призванную копировать поведение параноидального шизофреника.Для того чтобы проверить новое изобретение на эффективность, Колби провел забавный эксперимент. Он предложил профессиональным психиатрам протестировать две группы больных - реальных пациентов и виртуальных, сгенерированных программой PARRY. Общение велось при помощи телетайпа. Позже другой команде психиатров продемонстрировали стенограммы речей. Затем два медицинских коллектива определяли, кто из испытуемых был человеком, а кто аппаратом. В результате верное решение было вынесено лишь в 48% случаев. А это означало, что машине удалось-таки обмануть врачей. Примечательно, что Элизе и PARRY было суждено встретиться друг с другом. Rendez-vous организовали через сеть ARPANET. Диалог электронных доктора и больного длился несколько минут.

Теперь перенесемся в другую сферу, скажем, в музыкальную. Это вам не математика, геометрия и физика, где все подчиняется сухим числам. Здесь нужен полет фантазии, талант и, главное, вдохновение. Без этих трех составляющих появление на свет хорошего произведения, того, что проникает глубоко в душу, невозможно. Точнее, было невозможно до того момента, пока в южно-испанском университете Малага дотошные волхвы не изобрели музыкальный компьютер Iamus. Названный в честь сына Апполона, он пишет ритмичные партитуры, по сложности сравнимые разве что с Гершвином или Орфом . Сначала ПК генерирует простые, короткие ритмические фразы - «геномы». Потом они начинают эволюционировать и постепенно обретают форму полномасштабного академического сочинения. Разработчики на основе теста Тьюринга проверили работу своего агрегата на профессиональных музыкантах. Авторы Iamus`а дали прослушать артистам несколько вариантов опусов: сотворенных компьютером и подлинными композиторами. Позже знатокам предстояло установить: кто есть кто . Самое интересное, что опрашиваемых тест завел в тупик. Произведение, составленное синтетическим разумом, практически не отличалось от рукотворного.

Загвоздка заключалась в том, что сочинения Iamus`а вызывали те же самые эмоции: грусть, радость, смех, слезы. Поэтому большинство испытуемых так и не смогло определиться и дать точный ответ. Обычно они говорили, что не знают.

Подобная реплика от тестируемых ждала и специалистов Кембриджского университета. В стенах своей альма-матер британские лингвисты и программисты попытались научить компьютер сочинять японское хокку . Скажите теперь: как можно поверить в то, что это машина, если она способна создать такое?

Вчера все в порядке,

А сейчас все накрылось -

В этом суть Windows.

Разрабатывая свой тест, Алан Тьюринг утверждал, что если ученые изобретут искусственную кожу и наделят ею машины, то это вряд ли сделает их человечнее. Компьютер есть компьютер , мыслящий папками и файлами. Тем не менее специалисты уже давно трудятся в этом направлении. Например, инженер-механик Джон-Джон Кабибихан из Университета Катара придумал мягкий силиконовый полимер, который при нагреве до 36.6 градусов напоминает настоящий кожный покров.Специалист напечатал на 3D-принтере искусственную руку и обернул ее новым материалом. Далее провел простой тест. Кабибихан посадил участников спиной к себе и стал касаться их плеча то своей рукой, то искусственной моделью. Респонденты не сумели провести четких различий.

Впрочем, несмотря на множественные изыскания и попытки приблизить компьютер к человеку, официально тест Т ьюринга был пройден лишь в 2014 году. Это стало возможным благодаря программе Eugene Goostman, исполненной выходцем из России Владимиром Веселовым и представителем Украины Евгением Демченко.Эксперимент св одился к серии коротких диалогов с пятью ЭВМ. В ходе них жюри предстояло догадаться, ведут их автоматы или всамделишные люди. Тест сч итался пройденным, если компьютер морочил ареопагу голову в течение трети от от веденного времени. Собственно, детищу Веселова-Демченко это как раз удалось. Показатель оказался даже на несколько десятых выше - 33%. Искусственный интеллект активно объяснялся от имени вымышленного тринадцатилетнего подростка из Одессы Жени Густмана , который «претендует на то, что знает всё на свете, но в силу своего возраста не знает ничего». Его-то и признали живым человеком. Скептики, однако, тут же назвали прохождение теста Тьюринга сомнительным. Ведь Женя Густман являлся лишь чат-ботом . Поэтому , по их мнению, ответ на вопрос, могут ли машины выполнять то, что выполняем мы, остается открытым. Впрочем, решение можно попытаться найти, пообщавшись с программами-роботами в интернете. Сегодня на просторах всемирной паутины их видимо-невидимо: от онлайн-игр до социальных сетей. Если бы Алан Тьюринг оказался в XXI веке, он бы обязательно организовал подобный наглядный опыт.

Наверное, сегодня не такого человека, который хотя бы раз не слышал о таком понятии, как тест Алана Тьюринга. Вероятно, большинство, в общем, далеко от понимания, что собой представляет такая система тестирования. Потому остановимся на ней несколько подробнее.

Что такое тест Тьюринга: основная концепция

Еще в конце 40-х годов прошлого столетия очень многие ученые умы занимались проблемами первых компьютерных разработок. Именно тогда один из членов некой негосударственной группы Ratio Club, занимавшейся исследованиями в области кибернетики, задался совершенно логичным вопросом: можно ли создать машину, которая бы думала, как человек, или, по крайней мере, имитировала его поведение?

Нужно ли говорить, кто придумал тест Тьюринга? По всей видимости, нет. За первоначальную основу всей концепции, которая и сейчас актуальна, был взят следующий принцип: сможет ли человек в течение некоторого времени общения с неким невидимым собеседником на совершенно разные произвольные темы определить, кто перед ним - реальный человек или машина? Иными словами, вопрос заключается не только в том, чтобы сымитировать машиной поведение реального человека, но и выяснить, может ли она думать самостоятельно. до сих пор этот вопрос остается спорным.

История создания

Вообще, если рассматривать тест Тьюринга как некую эмпирическую систему определения «человеческих» возможностей компьютера, стоит сказать, что косвенной основой для его создания послужили любопытные высказывания философа Альфреда Айера, которые он сформулировал еще в 1936 году.

Сам Айер сравнивал, так сказать, жизненный опыт разных людей, и на основе этого выразил мнение, что бездушная машина не сможет пройти ни один тест, поскольку мыслить не умеет. В лучшем случае это будет чистой воды имитация.

В принципе, так оно и есть. Для создания мыслящей машины одной имитации мало. Очень многие ученые в качестве примера приводят братьев Райт, которые построили первый самолет, отказавшись от тенденции имитировать птиц, которая, кстати сказать, была свойственна еще такому гению, как Леонардо да Винчи.

Истрия умалчивает, знал ли сам (1912-1954) об этих постулатах, тем не менее в 1950 году он составил целую систему вопросов, которая могла бы определить степень «очеловеченности» машины. И надо сказать, эта разработка и сейчас является одной из основополагающих, правда, уже при тестировании, например, компьютерных ботов и т. д. В реальности же принцип оказался таковы, что пройти тест Тьюринга удалось лишь нескольким программам. И то, «пройти» - сказано с большой натяжкой, поскольку результат тестирования никогда не имел показателя 100 процентов, в лучшем случае - чуть более 50.

В самом же начале своих исследований ученый использовал собственное изобретение. Оно получило название «тест-машина Тьюринга». Поскольку все беседы предполагалось ввести исключительно в печатном виде, ученый задал несколько основных директив по написанию ответов, таких как перемещение печатной ленты влево или вправо, печать определенного символа и т. д.

Программы ELIZA и PARRY

Со временем программы стали усложняться, а две из них в ситуациях, когда применялся тест Тьюринга, показали ошеломляющие на то время результаты. Таковыми стали ELIZA и PARRY.

Что касается «Элизы», созданной в 1960 году: исходя из вопроса, машина должна была определить ключевое слово и на его основе составить обратный ответ. Именно это позволяло обманывать реальных людей. Если такого слова не оказывалось, машина возвращала обобщенный ответ или повторяла один из предыдущих. Однако прохождение теста «Элизой» до сих пор остается под сомнением, поскольку реальных людей, которые общались с программой, изначально подготавливали психологически таким образом, чтобы они заранее думали, что разговаривают с человеком, а не с машиной.

Программа PARRY несколько похожа на «Элизу», но была создана для имитации общения параноика. Что самое интересное, для ее тестирования были использованы настоящие пациенты клиник. После записи стенограмм бесед в режиме телетайпа их оценивали профессиональные психиатры. Лишь в 48 процентах случаев они смогли правильно оценить, где человек, а где машина.

Кроме того, практически все тогдашние программы работали с учетом определенного промежутка времени, поскольку человек в те времена соображал намного быстрее машины. Сейчас - наоборот.

Суперкомпьютеры Deep Blue и Watson

Достаточно интересными выглядели разработки корпорации IBM, которые не то чтобы мыслили, но обладали невероятной вычислительной мощностью.

Наверное, многие помнят, как в 1997 году суперкомпьютер Deep Blue выиграл 6 партий в шахматы у тогдашнего действующего чемпиона мира Гарри Каспарова. Собственно, тест Тьюринга применим к этой машине весьма условно. Все дело в том, что в нее изначально было заложено множество шаблонов партий с невероятным количеством интерпретации развития событий. Машина могла оценивать порядка 200 миллионов позиций фигур на доске в секунду!

Компьютер Watson, состоявший из 360 процессоров и 90 серверов, выиграл американскую телевикторину, обойдя по всем параметрам двух других участников, за что, собственно, и получил 1 миллион долларов премии. Опять же, вопрос спорный, поскольку в машину были заложены невероятные объемы энциклопедических данных, а машина просто анализировала вопрос на предмет наличия ключевого слова, синонимов или обобщенных совпадений, после чего давала правильный ответ.

Эмулятор Eugene Goostman

Одним из самых интересных событий в этой области стала программа одессита Евгения Густмана и российского инженера Владимира Веселова, ныне проживающего в США, которая имитировала личность 13-летнего мальчика.

7 июня 2014 года программа Eugene показала свои возможности в полном объеме. Интересно, что в тестировании приняли участие 5 ботов и 30 реальных людей. Только в 33% случаев из ста жюри смогло определить, что это компьютер. Дело тут в том, что задача осложнялась тем, что у ребенка интеллект ниже, чем у взрослого человека, да и знаний поменьше.

Вопросы теста Тьюринга были самыми общими, правда, для Юджина (Euegene) были и некоторые конкретизированные вопросы о событиях в Одессе, которые не могли остаться незамеченными ни одним жителем. Но ответы все равно заставляли думать, что перед жюри ребенок. Так, например, на вопрос о местожительстве программа ответила сразу. Кода был задан вопрос, находился ли собеседник такого-то числа в городе, программа заявила, что не хочет об этом говорить. Когда собеседник попытался настаивать на разговоре в русле того, что именно произошло в этот день, Юджин открестился тем, что заявил, мол, вы и сами должны знать, чего ж его-то спрашивать? В общем, эмулятор ребенка оказался на редкость удачным.

Тем не менее это все-таки эмулятор, а не мыслящее существо. Так что восстание машин не состоится еще очень долго.

Обратная сторона медали

Напоследок остается добавить, что пока предпосылок для создания мыслящих машин в ближайшем будущем нет. Тем не менее если раньше вопросы распознавания относились именно к машинам, теперь то, что ты не машина, приходится доказывать практически каждому из нас. Посмотрите хотя бы на ввод капчи в Интернете для получения доступа к какому-то действию. Пока считается, что еще не создано ни одно электронное устройство, способное распознать искореженный текст или набор символов, кроме человека. Но кто знает, все возможно…

Тест Тьюринга - эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. Computing Machinery and Intelligence), опубликованной в 1950 году в философском журнале «Mind». Тьюринг задался целью определить, может ли машина мыслить.

Стандартная интерпретация этого теста звучит следующим образом:

«Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы - ввести человека в заблуждение, заставив сделать неверный выбор».

Все участники теста не видят друг друга. Если судья не может сказать определенно, кто из собеседников является человеком, то считается, что машина прошла тест. Чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь, беседа ведется в режиме «только текст», например, с помощью клавиатуры и экрана (компьютера-посредника). Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило необходимо, потому что они реагируют гораздо быстрее, чем человек.

По состоянию на 2009 год ни одна из существующих компьютерных систем не приблизилась к прохождению теста.

Компьютерная программа, имитирующая психотерапевта

Из книги Роджера Пенроуза «Новый ум короля»

…Наиболее созвучна тесту Тьюринга компьютерная программа, разработанная К. М. Колби в середине 1960-х годов, которая имитирует психотерапевта - настолько успешно, что некоторые пациенты обнаружили готовность отдать ей предпочтение перед терапевтом-человеком и рассказать о себе больше, чем при общении с живым врачом. В качестве примера такого общения между компьютерным «психотерапевтом» и пациентом приведем следующий отрывок из диалога (который велся посредством телетайпа):

Терапевт: Чем я могу помочь вам?

Пациент: Я не знаю…

Терапевт: Попробуйте рассказать что-нибудь об этом.

Пациент: Нет.

Терапевт: Можно узнать причину?

Пациент: Я сегодня устал и неважно себя чувствую.

Терапевт: Почему? Есть у вас на этот счет какие-нибудь предположения?

Пациент: Да… Я стар.

Терапевт: Пожалуйста, продолжайте.

Пациент: Мне кажется, что я потерял интерес ко всему происходящему.

Терапевт: Расскажите мне подробнее о ваших ощущениях.

Пациент: У меня есть кое-какие соображения по этому поводу…

Терапевт: У вас есть соображения.

Пациент: Я думаю, что мне недостает семьи.

Терапевт: Что заставляет вас переживать из-за того, что вам недостает семьи?

Пациент: В этом есть какой-то вызов…

Терапевт: Почему это так важно для вас?

Хотя этот диалог может вызвать странное ощущение понимания проблемы пациента компьютером, ничего подобного на самом деле нет: компьютер просто следует довольно простым механическим правилам. (Есть также и «обратная» ситуация, реализованная в системе, где компьютер, имитирующий страдающего шизофренией человека, дает хрестоматийные ответы и симулирует соответствующие симптомы, способные одурачить некоторых студентов-медиков и заставить их поверить в то, что с ними беседует настоящий живой пациент!)

Текст
Артём Лучко

Британский университет Рединга с большой помпой объявил, что миновала «важная веха в истории вычислительной техники» и компьютер впервые прошёл корректно поставленный тест Тьюринга, введя в заблуждение судей, которые поверили, что общаются с 13-летним украинским мальчиком. Look At Me разобрался в том, что кроется на самом деле за этим событием.

Что собой представлял эксперимент


Университет Рединга, специалисты которого провели первый успешный тест Тьюринга

Тестирование чат-ботов было организовано Школой системной инженерии при университете Рединга к 60-летию кончины Алана Тьюринга. Эксперты общались одновременно с живым человеком и с программой, находясь в разных комнатах. По окончании теста каждый из судей должен заявить, кто из двух его собеседников - человек, а кто - программа. Для чистоты эксперимента были задействованы пять компьютеров и 30 судей, каждый из которых провёл серию из 10 письменных диалогов длительностью по 5 минут. Хотя обычно в ежегодном конкурсе программ искусственного интеллекта на премию Лёбнера (в котором программы соревнуются в прохождении теста Тьюринга за приз $2000) принимают участие всего 4 чат-бота и 4 человека. В результате эксперимента программа Eugene Goostman сумела убедить 33 % состава жюри в своей «человечности», что произошло первый раз в истории. Роберт Луэллин, один из судей, британский актёр и любитель технологий сказал:

Тест Тьюринга был удивительным. Состоялись 10 сеансов по 5 минут, 2 экрана, 1 человек и 1 машина. Я угадал правильно только 4 раза. Этот робот оказался умным малым...

Чат-бот Eugene Goostman был разработан выходцем из России Владимиром Веселовым (сейчас он проживает в США) и украинцем Евгением Демченко, живущим в России. Первая версия появилась ещё в 2001 году. Возраст подростка был выбран неслучайно: в 13 лет ребёнок уже многое знает, но далеко не всё, что усложняет задачу судей. В 2012 году чат-бот уже подобрался довольно близко к успеху: тогда в «человечность» украинского школьника поверили 29 % из числа судей. В ходе последних доработок программистам удалось подготовить виртуального собеседника ко всем возможным вопросам и даже обучить его подбирать примеры ответов в «Твиттере».

Что такое тест Тьюринга,
и в чём его недостатки


Алан Тьюринг в возрасте 16 лет

Тест Тьюринга был впервые предложен британским математиком Аланом Тьюрингом в статье «Вычислительная техника и интеллект», опубликованной в журнале Mind в 1950 году. В ней учёный задался простым вопросом: «Может ли машина мыслить». В своей самой простой форме тест заключается в следующем: человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы - ввести человека в заблуждение, заставив сделать неверный выбор. Тест подразумевает пятиминутный текстовый диалог, в ходе которого минимум 30 % судей должны поверить, что они имеют дело с человеком, а не машиной. При этом, разумеется, все участники теста не видят друг друга.


Джон Серл, американский философ

Есть много различных версий этого испытания (в некоторых вариациях судья знает, что одним из проверяемых собеседников является компьютер, в других - не знает об этом), но многие учёные и философы критикуют его по сей день. В своё время американский философ Джон Серл бросил тесту вызов своим мысленным экспериментом, известным как «Китайская комната». Он позволил себе предположить, что способность компьютера вести разговор и убедительно отвечать на вопросы - далеко не то же самое, что иметь разум и мыслить, как человек. «Предположим, что меня заперли в комнате и [...] что я не знаю ни одного китайского слова, ни письменно, ни устно», - пишет Серл в 1980 году. Он представил, что получал вопросы, написанные на китайском языке через щель в стене. Он не был в состоянии прочитать эти символы, но имел набор инструкций на английском, которые позволяли ему реагировать на «один набор формальных символов другим набором формальных символов». Таким образом, Серл теоретически смог бы отвечать на вопросы, просто следуя правилам английского и выбирая правильные китайские иероглифы. И его собеседники были бы убеждены, что он может говорить по-китайски.

Большинство критиков теста Тьюринга как способа оценки искусственного интеллекта придерживаются аналогичного мнения. Они утверждают, что компьютеры могут только использовать наборы правил и огромные базы данных, запрограммированных для ответов на вопросы, чтобы лишь казаться разумными.

Как программа обманула жюри


Профессор университета Рединга Кевин Уорвик

У Eugene Goostman имеется два фактора, которые помогли ему пройти тест. Во-первых, грамматические и стилистические ошибки, которые допускает машина в подражание письму подростка, а во-вторых, отсутствие знаний о специфических культурных и исторических фактах, которое также может быть списано на возраст школьника.

В процессе разработки искусственного интеллекта нет более знакового и противоречивого этапа, чем прохождение теста Тьюринга

«Успех программы, скорее всего, пробудит некоторые опасения по поводу будущего информационных технологий, - заявил профессор университета Рединга Кевин Уорвик. - В процессе разработки искусственного интеллекта нет более знакового и противоречивого этапа, чем прохождение теста Тьюринга, когда компьютер убеждает достаточное количество судей полагать, что с ними общается не машина, а человек. Само существование компьютера, который может обмануть человека, заставив его думать, что он - это человек, является тревожным сигналом, связанным с киберпреступностью». Тест Тьюринга по сей день является важным инструментом в борьбе с этой угрозой. И теперь специалистам предстоит более полно разобраться, как появление подобных продвинутых чат-ботов может повлиять на онлайн-общение в интернете.

Судя по логам, которые можно найти в Сети (опробовать бот самостоятельно пока не получается, вероятно, из-за ажиотажа сайт не выдержал трафика и «упал»), чат-бот довольно-таки примитивен и, как кажется на первый взгляд, не сильно отличается от похожих разработок, которые можно найти в интернете. Один из любопытных диалогов с «Евгением» представил журналист Леонид Бершидский, который задавал ему неудобные вопросы о громком событии, которое не могло пройти мимо юного одессита.

Даже учитывая проработанный характер и биографию, ошибки и опечатки, которые может допускать реальный подросток, убедительность бота вызывает сомнения. По сути, он также реагирует на ключевые слова, а когда его ставят в тупик, он выдает заранее заготовленные и не самые оригинальные ответы-заглушки. Если бы программа имела возможность использовать поисковые системы, чтобы находиться в контексте текущей ситуации в мире, мы могли бы видеть гораздо более впечатляющий результат. Вероятно, на это нужно время. Ранее известный футуролог Реймонд Курцвейл, занимающий должность технического директора Google, заявлял , что компьютеры смогут с лёгкостью проходить тест Тьюринга к 2029 году. По его предположениям, к этому времени они смогут освоить человеческий язык и превзойти интеллектом людей.

7 суперкомпьютеров, способных обхитрить человека

ELIZA


ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

Тест Тьюринга известен каждому человеку, интересующемуся искусственным интеллектом. Его сформулировал в 1938 г. Алан Тьюринг в статье “Может ли машина мыслить?”. Тест заключается в следующем. Экспериментатор общается с собеседником, не видя его (например, по компьютерной сети), набирая фразы на клавиатуре и получая текстовый ответ на мониторе. Затем он пытается определить, с кем вел разговор. Если экспериментатор принимает компьютерную программу за человека, значит, она прошла тест Тьюринга и может считаться интеллектуальной.

Золотую медаль получит все же человек

Наиболее известной программой, еще в 60-х годах показавшей реальную возможность прохождения этого теста, стала легендарная ELIZA. Она была создана в 1966 г. учеными Виноградом, Вейценбаумом и Колби. ELIZA находила в фразе ключевые слова (например, “мать”) и выдавала шаблонную просьбу, механически на эти слова реагируя (“Расскажите побольше о вашей матери”). В дальнейшем Тодди Виноград на основе ELIZA создал более совершенный вариант “Психотерапевт”. Появление ELIZA вошло в историю искусственного интеллекта наряду с такими событиями, как выпуск первого промышленного робота в 1962 г. или начало финансирования Пентагоном разработок в области распознавания образов и речи в 1975-1976 гг.

В 1991 г. впервые состоялся частный, но весьма солидный турнир по прохождению теста Тьюринга, на который были приглашены авторы подходящих компьютерных программ (называемых ботами). Этот турнир основал Хью Лебнер (www.loebner.net/Prizef/loebner-prize.html). За победу в нем полагались приз в размере 100 тыс. долл. и золотая медаль.

Пока главный приз не достался никому. Однако в 1994 г. Лебнер внес серьезные изменения в правила, потребовав, чтобы программа общалась с судьей не только в текстовом формате, но и путем генерации изображения виртуального человека. Она также должна уметь синтезировать и распознавать речевую информацию. Эти условия многие сочли крайне трудными, и до сих пор претендентов на главный приз по новым правилам не появилось. А за победу в старом, “текстовом” режиме теперь обещаны 25 тыс. долл. и серебряная медаль. Надо отметить, что вероятность субъективной ошибки судьи при общении с программой по старым правилам достаточно высока. Кроме того, боты совершенствуются довольно-таки быстро, и мы наверняка дождемся в ближайшие годы победителя в тесте Тьюринга.

Судейство на конкурсе очень строгое. Эксперты заранее готовятся к турниру и подбирают весьма заковыристые вопросы, чтобы понять, с кем же они общаются. Их разговор с программами напоминает допрос следователя. Судьи любят, например, повторять некоторые вопросы через определенное время, так как слабые боты не умеют следить за историей диалога и их можно поймать на однообразных ответах.

Но и разработчики не теряют времени даром, настраивая своих виртуальных подопечных таким образом, чтобы на провокационные вопросы типа “вы машина или человек?” программа весьма убедительно отвечала: “Конечно, человек!”.

8 ноября 1991 г. в Бостонском компьютерном музее восемь программ вступили в схватку с живыми экспертами. Результат был ошеломляющим. Пять из десяти судей решили, что под псевдонимом Whimsical Conversation скрывается человек. На самом деле это была программа Therapist, работавшая под управлением IBM PC 386 и созданная в 1986 г. на основе легендарной ELIZA Джозефом Вейнтраубом, специалистом по психологии. Впрочем, такой результат во многом связан со скептицизмом и предубеждением экспертов, считавших, что программы общаются на гораздо более примитивном уровне, чем это было в реальности. В дальнейшем судьи освоились с компьютерной манерой общения, и столь успешного результата ботам с тех пор достичь не удалось.

Первоначально Therapist состояла из семи модулей, написанных на Си, Turbo-Prolog и QuickBasic. Позже она была дополнена системой синтеза речи и базой знаний. Программа использует словарь из 70 000 слов и запоминает все, что ей рассказывают, используя эту информацию в следующих диалогах и подстраиваясь под интересы конкретного собеседника. Therapist выигрывала приз Лебнера еще в 1992, 1993 и 1995 гг. Затем она была усилена специализированными модулями, способными поддерживать разговоры на темы “мужчина против женщины” и “либералы против консерваторов”.

Вот пример из одного ее победного диалога:

Судья: Do you think that American soldiers should go to Bosnia?

Therapist: I think that what clinton has done in sending 20,000 peacekeepers to bosnia will ensure a lasting peace.

Судья: Do you think most Americans feel the way you do?

Therapist: What did you mean when you said do you think that american soldiers should go to bosnia? Did anyone ever tell you that you think too much? Oh, I think most americans feel the way i do?

В 1994 г. победу в турнире одержал Томас Вайлен, доктор экспериментальной психологии, специализирующийся на изучении естественных языков. Его программа TIPS была обучена хранить и анализировать фразы (в базе их было несколько тысяч) и выполнять поиск по лексическим шаблонам.

В 1996 г. бронзовую медаль получил Джейсон Хатченс и его бот SEPO, который общался примерно так:

Судья: I think. I do research. I write. I love. I Live.

SEPO: I wonder whether you think sometimes! I am feeling like the judge here!

В 1997 г. чемпионом стал Дэвид Леви с ботом Converse. В 1998-м и 1999-м победы добивался Робби Гарнет, считающий, что прохождение теста Тьюринга не требует реального интеллекта. Интересно, что почти все авторы, упоминая о научных подходах к обучению (нейронные сети, генетические алгоритмы), обходились в своих решениях достаточно простыми эвристическими методами.

Гарнет выставил на состязание программу Computational Behaviorist, основанную на принципе “стимул - реакция”, схожем с тем, что заложен в TIPS и ELIZA. Только его бот искал не одно, а до трех ключевых слов в фразе. В то же время, понимая, что от программы требуется нечто большее, чем однообразный ответ на вопросы, он встроил в нее ряд дополнительных эвристических алгоритмов, создававших более полную иллюзию общения с человеком.

В ходе разработки Behaviorist возникли технические трудности, связанные со сложностью реализации поиска знаний в крупных по тем временам базах, что приводило к заметным временны’м задержкам в общении, сразу выдававшим компьютерного собеседника. Поэтому Гарнет объединил два общедоступных бота - Albert, написанный на С++, и одну из Паскаль-версий ELIZA и реализовал их в среде разработки Visual DataFlex, позволявшей пользоваться стандартными алгоритмами запросов к БД.

В 2000-м и 2001 г. малый приз доставался программе ALICE Ричарда Уоллеса. Сегодня на базе ALICE организован фонд ALICE AI Foundation (http://alice.sunlitsurf.com/), занимающийся стандартизацией деятельности по созданию ботов. В частности, ALICE дополнена средствами поддержки БД в формате AIML (Artificial Intelligence Markup Language) - подмножестве XML, нацеленном на формализацию представления ключевых фраз и ответов. Теперь любой желающий, незнакомый с программированием, может взять базовый вариант ALICE и наполнить его собственной базой знаний на любом языке, используя обычный редактор.

К сожалению, летом этого года, как сообщило издание Wired, у г-на Уоллеса начались проблемы с психикой (он угрожал одному из своих коллег-профессоров физической расправой, утверждая, что в ряде американских университетов процветает коррупция и в отношении Уоллеса преподавательским составом задуман масштабный заговор). Пока ученый находится под следствием.

Одним из наиболее вероятных претендентов на победу в текущем году (турнир пройдет в октябре) считается Смит Джошуа, автор программы Anna (AIML-расширение ALICE, свободно доступное на сайте http://annabot.sourceforge.net/). Г-н Джошуа отмечает, что в отличие от своих коллег он с самого начала создавал бот, выдающий себя в процессе общения за человека. Anna действительно считает себя живым существом, обладает набором индивидуальных качеств и достаточно бойко ведет разговор.

Есть ли подобные российские разработки - боты, способные общаться на русском языке? Редакция PC Week/RE готова провести российский конкурс на прохождение теста Тьюринга. Напишите автору по адресу: [email protected].