Он тьюринга должен определить может ли машина мыслить как человек
ДИЛЕМА ТЕСТ ТЬЮРИНГА: СПОСОБНА ЛИ МАШИНА МЫСЛИТЬ?
В данной статье рассматривается два популярных мнения в области искусственного интеллекта, посредством анализа аргументов сторонников и противников идей А.Тьюринга.
Ключевые слова: тест Тьюринга, сторонники, противники, игра в имитацию, аргументы.
This article examines two popular opinions in the field of artificial intelligence, by analyzing the arguments of supporters and opponents of the ideas of A. Turing.
Keywords: Turing test, supporters, opponents, imitation game, arguments.
Идея создания искусственного интеллекта берет своё начало ещё с древних времен, так как человек всегда стремился облегчить свою жизнь, переложив часть своих обязанностей на специальные автоматизированные инструменты.
Актуальность создания и использование искусственного интеллекта в наши дни связана с рядом непростых проблем, которые приходится решать современному человечеству.
На сегодняшний день, благодаря науке, создание искусственного интеллекта стало возможным. Однако мнения ученых касаемо искусственного интеллекта разделились, т.к. ещё существует ряд проблем, решение которых пока невозможно найти научным путём. Ответ на вопрос «Способен ли искусственный интеллект мыслить подобно человеку?» остается открытым.
Рисунок 1 – Процесс поиска док-в идеи теста Тьюринга
Далее было принято решение декомпозировать модель для более точного описания процесса поиска доказательств. Декомпозиция представлена на рисунке 2.
Рисунок 2 – Декомпозиция процесса поиска док-в идей теста Тьюринга
В результате декомпозиции было выделено 2 блока процесса – непосредственно сам анализ теста Тьюринга для поиска аргументов в защиту теста и подведение итогов выполненной работы. Для детального рассмотрения анализа была выполнена ещё одна декомпозиция соответствующего блока, которая представлена на рисунке 3.
Рисунок 3 – Декомпозиция процесса анализа теста Тьюринга
Сам анализ теста Тьюринга производился в 4 этапа.
Было проведено обращение к различным ресурсам, определяющим детальное понятие теста Тьюринга и его понятия «игра в имитацию». В ходе понятия теста были определены следующие сопутствующие понятия, необходимы для полного понимая концепции теста:
Цель теста: определение возможности искусственного мышления, близкого к человеческому. Самый общий подход предполагает, что ИИ будет способен проявлять поведение, не отличающееся от человеческого, причём в нормальных ситуациях. Эта идея является обобщением подхода теста Тьюринга, который утверждает, что машина станет разумной тогда, когда будет способна поддерживать разговор с обычным человеком, и тот не сможет понять, что говорит с машиной (разговор идёт по переписке).
Понятие ИИ – свойство интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека. Задачи ИИ: использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Примеры: распознавание образов, голосов, лица.
Понятие ИИС – комплекс программных, лингвистических и логико-математических средств для реализации основной задачи – осуществления поддержки деятельности человека и поиска информации в режиме продвинутого диалога на естественном языке [1].
После ознакомления и определения понятия теста Тьюринга, было принято решение приступить к определению достоинств и недостатков теста.
Определение достоинств и недостатков теста Тьюринга
Были выявлены следующие достоинства :
Ширина темы. Сильной стороной теста Тьюринга является то, что можно разговаривать о чём угодно. Тьюринг писал, что «метод вопросов и ответов кажется подходящим для обсуждения почти любой из сфер человеческих интересов, которую мы хотим обсудить». Джон Хогеленд добавил, что «одного понимания слов недостаточно; вам также необходимо разбираться в теме разговора». Чтобы пройти хорошо поставленный тест Тьюринга, машина должна использовать естественный язык, рассуждать, иметь познания и обучаться. Тест можно усложнить, включив ввод с помощью видео, или, например, оборудовав шлюз для передачи предметов: машине придётся продемонстрировать способность к зрению и робототехнике. Все эти задачи вместе отражают основные проблемы, стоящие перед теорией об искусственном интеллекте.
Уступчивость и простота. Сила и привлекательность теста Тьюринга исходит из его простоты. Философы сознания, психологии в современной неврологии не способны дать определения «интеллект» и «мышление», насколько они являются достаточно точными и вообще применимы к машинам. Без такого определения, в центральных вопросах философии об искусственном интеллекте не может быть ответа. Тест Тьюринга, даже если и несовершенен, но по крайней мере, обеспечивает то, что это действительно может быть измерено. Как таковой, это является прагматическим решением трудных философских вопросов. Стоит отметить, что в советской психологии Выготский Л. С. и Лурия А. Р. дали вполне чёткие определения «интеллекта» и «мышления».
Были выявлены следующие недостатки:
Поведение человека и разумное поведение. Направленность теста Тьюринга ярко выражена в сторону человека. Проверяется только способность машины походить на человека, а не разумность машины вообще. Тест неспособен оценить общий интеллект машины по двум причинам: иногда поведение человека не поддаётся разумному толкованию; Некоторое разумное поведение не присуще человеку. По сути, тест требует, чтобы машина обманывала: какой бы умной ни была машина, она должна притворяться не слишком умной, чтобы пройти тест. Если же машина способна быстро решить некую вычислительную задачу, непосильную для человека, она по определению провалит тест.
Реальный интеллект и имитируемый интеллект
Таким образом после выявления достоинств и недостатков было принято решение, приступить к 4 этапу – аргументации в защиту и против экспериментов теста Тьюринга.
Аргументы в защиту Теста:
Для начала, стоит определиться с тем, что такое мышление. Как человек мыслит? Физический и химический процесс? Что вкладывается в это понятие. Мыслить – рассуждать над решением возникшей проблемы/задачи исходя из наших базовых знаний, опыта и полученных данных в ходе постановки задачи. Если это так, то машина определенно может мыслить.
В основе творчества тоже лежат знания об определенной области. Человек думает, что создает нечто принципиально новое, но так или иначе продукт его творчества базируется на тех знаниях и опыте, которые были в него «заложены».
Машины неспособны испытывать эмоции, но и человек не всегда способен на это (например, люди с синдромом деперсонализации). В этом случае человек более-менее успешно имитирует их, принимая во внимание реакции окружающих людей. То есть внешне отображает эмоции, но не испытывает их.
Ассоциативное мышление тоже не проблема для современных машин. Ассоциативное поле машина строит, как и человек, основываясь на «прочитанном» и собственной жизни (лог-файлы).
Желания человека, что как не цель? Машины умеют ставить перед собой цели, даже если это не явно прописано в коде. Например, при игре в шахматы, анализируя сыгранные партии, машина может определить, что некоторая расстановка фигур на поле быстрее приводит к победе. В таком случае машина стремиться привести игру к такой расстановке.
Аргументы против эксперимента Тьюринга
Машина не имеет сознания. Это возражение особенно ярко выражено в выступлении профессора Джефферсона на Листеровских чтениях за 1949 год. «До тех пор, пока машина не сможет написать сонет или сочинить музыкальное произведение, побуждаемая к тому собственными мыслями и эмоциями, а не за счет случайного совпадения символов, мы не можем согласиться с тем, что она равносильна мозгу, т. е. что она может не только написать эти вещи, ной понять то, что ею написано. Ни один механизм не может чувствовать (а не просто искусственно сигналить, для чего требуется достаточно несложное устройство) радость от своих успехов, горе от постигших неудач, удовольствие от лести, огорчение из-за совершенной ошибки, не может быть очарованным противоположным полом, не может сердиться или быть удрученным, если ему не удается добиться желаемого».
Возражения, исходящие из того, что машина не все может выполнить. Машины безобразны, каждая из них создана для того, чтобы выполнять весьма ограниченные задачи, и если необходимо сделать нечто иное, они бесполезны, вариации их поведения крайне незначительны и т. д. и т. п. Естественно, человек делает вывод, что все это является необходимыми особенностями всех машин в целом. Многие из этих ограничений связаны с очень маленькой емкостью памяти большинства машин.
Машина не способна создать новые знание. Наиболее подробные сведения, берутся из воспоминаний леди Лавлейс. В них она высказывает такую мысль: «Аналитическая машина не претендует на то, чтобы создавать что-то действительно новое. Машина может выполнить все то, что мы умеем ей предписать». Один из вариантов аргумента госпожи Лавлейс — это утверждение, гласящее, что машина «никогда не может создать ничего подлинно нового» [2].
Возражение с точки зрения неформальности поведения человека. Невозможно выработать правила, предписывающие, что именно должен делать человек во всех случаях, при всех возможных обстоятельствах. Например, пусть имеется правило, согласно которому человеку следует остановиться, если включен красный свет светофора, и продолжать движение, если свет зеленый; но как быть, если по ошибке оба световых сигнала появятся одновременно? По-видимому, безопаснее всего остановиться, или пойти, или перейти дорогу в другом месте. Данное поведение человека обусловлено его неформальностью. При подобной ситуации машина будет действовать согласно написанному алгоритму, ее действия будут предопределены.
Возражение с точки зрения сверхчувственного восприятия. Телепатия, ясновидение, способность к прорицанию и психокинезис. Данные сверхчувствительные восприятия способны испытывать только люди. Исходя из истории данные состояния не были изучены до конца, но было установлено что некоторые происходят из-за изменений в головном мозге. Данные чувства никак не способна чувствовать машина, т.к сверхчувствительное восприятие не является алгоритмом или сбоем системы, это то что происходит на подсознательном уровне человека.
Интеллектуальные информационные системы и технологии: Монография / А.В. Остроух, Н.Е. Суркова. – Красноярск: Научно-инновационный центр, 2015. – 370 с.
Тест Тьюринга глазами очевидца
В истории науки об управлении и связи в живом организме и машине — кибернетики — 7 июня 2014 года произошло эпохальное событие: тест для определения искусственного интеллекта, придуманный британским математиком Аланом Тьюрингом 64 года назад, был пройден.
Участники ТТ 07.06.2014, организованного британским Университетом Рединга. Фото: Альберт Ефимов
Важность этого события трудно переоценить, несмотря на то, что преодоление этого важного рубежа мало кем было замечено. Прежде, чем перейти непосредственно к событию, давайте я немного расскажу о развитии исследований интеллекта и о том, что есть тест Тьюринга.
Отгремела последняя мировая война. В пекле этой войны родились все великие инновации 20 века, которые определили дальнейший ход развития технологий: реактивный полет, космические ракеты, атомная энергия, радиолокация, компьютеры.
Алан Тьюринг, математик, был одним из разработчиков первых ЭВМ. Именно с помощью этих электронных вычислителей союзники читали немецкую шифрованную переписку как открытую книгу. Важность таких разработок стала очевидна в то время.
Задумавшись о развитии этих машин, Тьюринг поставил важнейший вопрос: может ли машина мыслить? Затем этот общий вопрос он свел к другому, более простому: можно ли сделать так, что мышление машины (и речь, как отражение мышления) стало невозможно отличить от мышления (и речи) человека? Может ли человек спутать, с кем он говорит — с машиной или с человеком?
Алан Тьюринг был странным и необычным математиком. Его статья «Computing machinery and intelligence», написанная в 1950 году, не утратила актуальности и по сей день: мы так же постоянно спорим о том, имеет ли машина мышление?
Стандартная интерпретация теста Тьюринга (ТТ), согласно «Википедии», звучит так: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».
Тьюринг посчитал, что к 2000 году машины будут способны ввести в заблуждение 30% собеседников при условии длительности беседы не более 5 минут.
Желающие получить подробное представление о философии, которая лежит за этим тестом могут посмотретьзамечательный фильм, снятый в СССР, на эту тему.
C того времени предпринималось множество попыток преодолеть ТТ. Первая важнейшая веха была пройдена компьютерной программой ЭЛИЗА, созданной Джозефом Вейценбаумом.
Опять же, был снят гениальный документальный фильм Plug and Pray, который неоднократно демонстрировался на наших мероприятиях Открытым Университетом Сколково.
Прогресс в области изучения естественных языков и повышение мощности компьютеров привел к тому, что возможности для выполнения ТТ пришли с самого неожиданного направления — со стороны чатботов. Чатботы — это компьютерные программы, специально разработанные для моделирования диалога на естественном языке. Покупка и последующее превращение программы SRI в Siri (ПО, установленное в iPhone) — помогло развитию индустрии искусственных помощников. Сейчас активно развиваются приложения для диалога компьютера и человека: для развлечения, обучения, маркетинга и прочие. В «Сколково» есть пара многообещающих проектов на эту тему — «Наносемантика» и «Спиктуит».
Но основная цель, заданная Тьюрингом, до последнего времени оставалась недостижимой: чатботы были скучны и совершено банально демонстрировали машинный интеллект, отдающий жаром процессора и машинным маслом. До 7 июня 2014 года.
Снимок экрана домашней страницы чатбота «Евгений Густман».
В этот день рубеж был преодолен. Чатбот, созданный под руководством российского программиста Владимира Веселова, живущего и работающего в США, сумел преодолеть 30% барьер, установленный Тьюрингом более полувека назад.
Сам Владимир рассказал про себя, команду и свой чатбот следующее:
«Чатбот «Евгений Густман» был создан командой энтузаистов в 2001 году. В 2001 мы попали в финал Loebner Prize, где поделили 2-3 место с Эллой.
В состав команды входили: Евгений Демченко, Сергей Уласень, Михаил Гершкович, Джон Деннинг, Андрей Адащик, Игорь Быковских, Селена Семушкина. Графический образ создан Лореном Алкир (Laurent Alquier). Основная часть команды находится в Санкт Петербурге.
После этого программа и база знаний дорабатывались, исправлялись недостатки. В 2012-м году Густман победил в соревнованиях, посвященных 100-летию со дня рождения Алана Тьюринга, предсказавшего в 1950 году что к 2000-му году компьютеры смогут имитировать человека так, что средний собеседник с вероятностью более 30% будет принимать робота за человека в течение пяти минут диалога. В 2012 результат был 29.2 %, в 2014 — 33.3%.
Программа «Евгений Густман» состоит из базы знаний, которая имеет около трех тысяч шаблонов распознавания фраз пользователя. Это довольно немного, по сравнению с другими чатботами. Мы использовали также различные методы управления диалогом, которые позволяют имитировать именно человека, а не поисковую машину. Евгений старается направить беседу в нужное ему русло, стараясь создавать такие ситуации, когда его фраза выглядят человекоподобно. При короткой продолжительности беседы — 5 минут — такой подход часто срабатывает».
Владимир Веселов закочнил Военный Инженерно-Космический Институт им. А.Ф. Можайского, служил на Байконуре, закончил адъюнктуру ВИКА им. А.Ф. Можайского, работал программистом, научным сотрудником. В данный момент является разрабочиком программного обеспечения в компании Amazon Web Services.
ТТ проходил следующим образом: команда ученых-организаторов теста под руководством профессора Кевина Варвика и его ассистента Хумы Шан собрала судей (30 человек, поделенных на 4 смены) и «скрытых людей», которые должны были вести диалог. В тесте участвовало также пять чатботов, которые общались на английском языке.
Тест Тьюринга. Иллюстрация: сайт Университета Рединга
Каждый судья имел перед собой экран монитора, разделенный на две части. Судья должен был вести диалог одновременно с двумя «сущностями». При этом было неизвестно, кто из них компьютер, а кто — человек. Ровно, как в классическом тесте. Через пять минут окна отключались. Судья заполнял анкету и потом приступал к оценке следующей пары. Основная задача — определить, с кем шел диалог: с машиной или же с человеком.
Программа, созданная Владимиром Веселовым и его коллегами, смогла ввести в заблуждение ровно треть всех судей, присутствовавших на мероприятии. Поверьте, большей концентрации профессоров кибернетики я видел только на собраниях академии наук.
Подошли к концу четыре смены оценки, оргкомитет принялся подсчитывать бюллетени.
После всех церемоний я подошел к профессору и уточнил: действительно ли произошедшее означает, что ТТ окончательно пройден? «Да, — ответил профессор Варвик. — Мы специально пригласили судей и независимых наблюдателей — уважаемых ученых, чтобы все было сделано правильно и никаких сомнений не оставалось. Именно так: тест Тьюринга, пройден. Причем с оценкой значительно превосходящей — на 10% — оценку, данную самим Тьюрингом».
В целом, можно сказать, что для оценки искусственного интеллекта теперь надо придумывать другие тесты.
Скажу еще несколько слов о значении этого события для будущего. Прежде всего, это означает, что проникновение информационных систем в межчеловеческое общение ускоряется. Через пять лет уже невозможно будет сказать, общаетесь вы с живым оператором контактного центра или с машиной. Разницу будет можно почувствовать лишь через 5 минут общения. Второе — срочно необходимо решать вопрос с проведением ТТ на русском языке. Сейчас мы явно отстаем от зарубежных коллег, ведущих исследования ИИ на английском языке. Соревновательный подход, практикуемый на родине спорта — Британии — явно показал свою эффективность. Может быть, нам в Сколково стоит взять инициативу в свои руки и впервые провести ТТ на русском языке?
Тест Тьюринга
Что такое Тест Тьюринга?
Тест Тьюринга – обманчиво простой метод определения того, может ли машина продемонстрировать человеческий интеллект: если машина может вступать в разговор с человеком, не будучи обнаруженной как машина, она продемонстрировала человеческий интеллект.
Тест Тьюринга был предложен в статье, опубликованной в 1950 году математиком и пионером вычислительной техники Аланом Тьюрингом. Он стал фундаментальным мотиватором в теории и развитии искусственного интеллекта (ИИ).
Ключевые моменты
Как работает тест Тьюринга
Быстрый прогресс в области вычислений теперь заметен во многих аспектах нашей жизни. У нас есть программы, которые переводят один язык на другой в мгновение ока; роботы, убирающие весь дом за считанные минуты; финансовые роботы, которые создают персонализированные пенсионные портфели, и носимые устройства, отслеживающие уровень нашего здоровья и физической формы.
Все это стало относительно обыденным. В авангарде прорывных технологий сейчас находятся пионеры в разработке искусственного интеллекта.
«Могут ли компьютеры думать?»
Алан Тьюринг добрался до них раньше. Этот британский математик разработал некоторые из основных концепций информатики в поисках более эффективного метода взлома закодированных немецких сообщений во время Второй мировой войны. После войны он начал думать об искусственном интеллекте.
В своей статье 1950 года Тьюринг начал с вопроса: «Могут ли машины думать?» Затем он предложил тест, который призван помочь людям ответить на этот вопрос.
Тест проводится в комнате для допросов, которую ведет судья. Испытуемые, человек и компьютерная программа, скрыты от глаз. Судья беседует с обеими сторонами и пытается определить, кто из них – человек, а какой – компьютер, исходя из качества их разговора.
Тьюринг приходит к выводу, что, если судья не может отличить, значит, компьютеру удалось продемонстрировать человеческий интеллект. То есть может думать.
Тест Тьюринга сегодня
У теста Тьюринга есть противники, но он остается мерой успеха проектов искусственного интеллекта.
В обновленной версии теста Тьюринга более одного человека-судьи допрашивают и болтают с обоими объектами. Проект считается успешным, если более 30% судей после пяти минут разговора приходят к выводу, что компьютер – это человек.
Премия Лебнера – это ежегодное соревнование по тесту Тьюринга, которое было объявлено в 1991 году Хью Лебнером, американским изобретателем и активистом. Лебнер создал дополнительные правила, требующие от человека и компьютерной программы 25-минутного разговора с каждым из четырех судей.
Краткая справка
Некоторые считают, что чат-бот Юджин Густман первым прошел тест Тьюринга в 2014 году.
Победителем становится компьютер, программа которого получила наибольшее количество голосов и высшую оценку судей.
Беседа с Евгением
Алан Тьюринг предсказал, что машина пройдет тест Тьюринга к 2000 году. Он был близок к этому.
В 2014 году Кевин Уорвик из Университета Рединга организовал соревнование по тесту Тьюринга в ознаменование 60-й годовщины смерти Алана Тьюринга. Компьютерный чат-бот по имени Юджин Густман, имевший образ 13-летнего мальчика, успешно прошел тест Тьюринга. За него проголосовали 33% судей, которые были уверены, что он человек.
Голосование, что неудивительно, вызывает споры. Не все принимают достижение Юджина Густмана.
Критики теста Тьюринга
Критики теста Тьюринга утверждают, что можно создать компьютер, обладающий способностью мыслить, но не обладающий собственным разумом. Они считают, что сложность мыслительного процесса человека невозможно закодировать.
Несмотря на различия во мнениях, тест Тьюринга, возможно, открыл двери для новых инноваций в сфере технологий.
Что такое тест Тьюринга?
Тест Тьюринга — тест, предложенный Аланом Тьюрингом в 1950 г. в статье «Вычислительные машины и разум» (Computing machinery and intelligence) для проверки, является ли компьютер разумным в человеческом смысле слова. Тьюринг предложил тест, чтобы заменить бессмысленный, по его мнению, вопрос «может ли машина мыслить? » на более определенный.
Тест должен проводиться следующим образом. Судья (человек) переписывается на естественном языке с двумя собеседниками, один из которых — человек, другой — компьютер. Если судья не может надежно определить, кто есть кто, считается, что компьютер прошел тест. Предполагается, что каждый из собеседников стремится, чтобы человеком признали его. Чтобы сделать тест простым и универсальным, переписка сводится к обмену текстовыми сообщениями.
Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения исходя из скорости ответов. (Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило необходимо, потому что они реагируют гораздо быстрее, чем человек. )
Тест был инспирирован салонной игрой, в ходе которой гости пытались угадать пол человека, находящегося в другой комнате, путем написания вопросов и чтения ответов. В оригинальной формулировке Тьюринга человек должен был притворяться человеком противоположного пола, а тест длился 5 минут. Сейчас эти правила не считаются необходимыми и не входят в спецификацию теста.
Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лёбнера (Loebner). Есть также дополнительный приз для программы, которая, по мнению судей, пройдет тест Тьюринга. Этот приз еще не присуждался. Самый лучший результат показала программа A.L.I.C.E. выиграв приз Лёбнера 3 раза (в 2000, 2001 и 2004).
С момента зарождения современной вычислительной техники умы людей занимал вопрос: можно ли построить машину, которая могла бы в чем-то заменить человека. Попыткой создать твердую эмпирическую почву для решения этого вопроса и стал тест, разработанный Аланом Тьюрингом.
Первый вариант теста, опубликованный в 1950 году, была несколько запутанным. Современная версия теста Тьюринга представляет собой следующее задание. Группа экспертов общается с неизвестным существом. Они не видят своего собеседника и могут общаться с ним только через какую-то изолирующую систему — например, клавиатуру. Им разрешается задавать собеседнику любые вопросы, вести разговор на любые темы. Если в конце эксперимента они не смогут сказать, общались ли они с человеком или с машиной, и если на самом деле они разговаривали с машиной, можно считать, что эта машина прошла тест Тьюринга.
Нет нужды говорить, что сегодня ни одна машина не может даже близко подойти к тому, что пройти тест Тьюринга, хотя некоторые из них весьма неплохо работают в очень ограниченной области. Предположим, тем не менее, что в один прекрасный день машина все-таки сможет пройти этот тест. Будет ли это означать, что она разумна и обладает интеллектом?