18 Октября 2023
Поделиться:

Может ли ChatGPT обрести сознание? 5 вопросов о нейросетях

Современные нейросети пишут романы и доказывают теоремы, копируют стиль знаменитых художников и генерируют фотографии людей, которых никогда не существовало. Как они изменили нашу жизнь и могут ли самообучающиеся модели обладать сознанием? Об этом рассказывает Варвара Любова, творческий директор Креативного Бюро «Глазами инженера», экскурсовод Музея криптографии и автор телеграм-канала о цифровизированном искусстве. Публикуем фрагмент ее выступления в Переделкине в рамках празднования 15-летия издательства «Альпина нон-фикшн».

 

Все живое имеет сознание?

Последние пару лет мы переживаем бум искусственных нейросетей. Все большее количество людей задаются вопросом: а появится ли универсальный искусственный интеллект, который нас всех еще и поработит? Считается, что универсальный ИИ возникнет, когда нечто синтетическое сможет себя осознать. То есть не просто обретет сознание, но и поймет это.

Вполне справедливо возникает вопрос: что же такое сознание и как его измерить? Это не температура, чтобы мы могли подключить датчики и снять показания.

Книга Анила Сета «Быть собой: Новая теория сознания» рассказывает о теориях сознания, способах его измерения и о том поле, где оно располагается. Связано ли напрямую сознание с жизнью? Анил Сет отвечает, что все осознанное живое, но не все живое осознанно. 

Кто обучает беспилотные автомобили

Когда мы говорим об искусственном интеллекте (корректнее  — artificial intelligence, AI,  «искусственном распознавании»), то чаще всего подразумеваем алгоритмы, которые принимают решения, например распознают или обучаются.

Самое большое поле для искусственного интеллекта — это машины без водителя. Некое транспортное средство, которое теоретически может попасть на дорогу и принимать решения, что это — знак, это — куст, а это — другая машина.

И все мы принимаем участие в обучении беспилотных автомобилей. Каждый хотя бы раз проходил капчу — CAPTCHA (публичный тест Тьюринга) — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. В этом тесте часто используются изображения то велосипедов, то гидрантов, то светофоров. Все потому, что пользователи формируют тренировочное множество для тех самых автомобилей. Обучает программу человек. Чем больше таких спорных фотографий вы промаркируете, тем больше их можно загрузить в условный искусственный интеллект и тем лучше обучится беспилотная машина.

Когда появились капчи? В нулевые. В 2014 году был их расцвет. Именно в то время началось активное обучение алгоритмов: «Хочешь файл скачать? Поработай немного на благо машин». Все мы связаны с этой областью. Но в последние три года наблюдается взрывной рост.

Может ли ChatGPT стать разумным

Каждому из нас доступны программы, которые генерируют либо изображения, либо тексты по текстовому запросу. Интерфейс выглядит как строка поиска, в которую вы вводите свой запрос, а нейросеть генерирует картинку или текст специально под ваш запрос.

В чем здесь магия? Из текста впервые генерируют изображения. Алгоритмов, которые из одного текста делают другой, и раньше было много. Но мы перешли на новый уровень. <...> Графика, сгенерированная нейросетями, похожа на фотографию, иллюстрацию, гравюру — любой жанр, который вы можете назвать.

В марте 2023 года Microsoft заявил, что ChatGPT — текстовая модель глубинного обучения — показывает проблески сознания. И 30 топовых компаний подписали соглашение о том, что замедлят развитие этой области, ограничат тренировочные множества, чтобы «как бы чего не вышло». 

Но означает ли это, что у нейросетей может быть сознание? Думаю, что нет.

Статистическая модель глубинного обучения выдает вам будто бы осознанный ответ на ваш вопрос. Но этот текст, который не существовал, был собран из компонентов, которые уже есть в цифровом мире.

ChatGPT обучался на корпусе текста, который есть в интернете, и вот вся «Википедия» — 0,006% от того, что есть в его распоряжении. Представьте, какие это мощности, какие мышцы цифровые! Алгоритмы работают на законах, зашитых в структуру естественной речи. И это выглядит, действительно, очень убедительно.

Образы роботов кажутся нам милыми, как будто они домашние животные. И сразу хочется про них сказать: «Конечно, он осознанный, личность свою имеет». Но если добавить роботу больше человеческих черт — достаточно, чтобы он был антропоморфным, но недостаточно, чтобы казался живым, — он будет нас пугать. Это называют эффектом «долины ужасов». 

Как вы думаете, в чем они живут? В наших смартфонах, ноутбуках и тому подобном. Нет антропоморфного робота, в которого они вписаны. Пока, во всяком случае. 

В 2015 году зародилась тенденция, что условный искусственный интеллект, имеющий сознание, не должен быть к чему-то привязан физически. Это может быть нечто облачное, живущее в вычислительных мирах. А мы будем носить ретранслятор у себя на руке, в голове, ухе. Анил Сет тоже об этом пишет. Антропоморфные роботы уже нас пугают. Нам достаточно, чтобы мы получали ответы от чего-то, как будто за этим есть личность.

Форма сознания может быть очень разной. Но каждый раз мы должны убедиться, что это не просто имитация личного опыта или его переноса. Многие говорят о том, что когда алгоритм научится здравый смысл производить, тогда это будет сознание.

Теоретически ChatGPT может вам ответить, как будто это некий компетентный человек. И мы спрашиваем: «Цветку возле окна хорошо или плохо?» Он зависает, отвечает: «Фотосинтез, свет. Да, наверное, хорошо. С вероятностью 90%, если окно чистое». Уточняем запрос: «Если поставить цветок подальше от окна, ему будет хорошо или плохо?» И тут алгоритм говорит: «50 на 50». Хотя если мы с вами спросим человека: «Если цветок от окна отодвинуть, цветку хуже или лучше будет?» — то получим ответ: «Вообще-то похуже, потому что света меньше». Логично. У нас, людей, есть связка образов и перенос опыта, у алгоритма — нет. Но он имитирует логику блестяще. 

Как нейросети генерируют изображения

Что нас приводит к идее сознания в искусственных нейросетях? То, как они устроены. DALL-E, Midjourney либо Kandinsky генерируют изображения из текста. Обсудим, как они это делают.

У нас есть запрос: «Нарисуй котика». Внутри происходит диффузия, похожая на белый шум, будто телевизор плохо работает. Мы загружаем в нейросеть тренировочное множество, это промаркированные картинки, как те промаркированные гидранты, которые вы отмечали, условно говоря. После этого изображения раскладываются на пиксели, на биты (бит — это самый маленький неделимый объем информации). Представьте, что у вас есть некая сетка, огромная, как футбольное поле. И она работает как ортопедический матрас — если одна часть провисает, другая остается на прежнем уровне. После этого на сетку мы кладем шум из пикселей. 

После этого приходит нейросеть и говорит: «Ага, нам нужен котик. Хорошо, те пиксели, которые потемнее, пусть будут потяжелее». Берет веса, вешает с обратной стороны каждого темного пикселя. Помним, что у нас ортопедическая сетка, эта гирька оттягивает плитку на разные уровни. И вы понимаете, что те плитки, которые остались наверху, будут складываться в некий силуэт?

После этого нейросеть берет шаблон — это может быть квадрат, куб, силуэт котика — и ведет по тем пикселям, которые выступают, они более контрастны. «О, шаблон сошелся. Два треугольника похожи на ушки. Котик». И она оставляет этот кусочек активным. После того как этот кусочек она промаркировала как котика, открывает ярлык. Помните, у нас человек промаркировал изображение? А там написано: «Не котик — ежик. Вообще ничего не вышло».

После этого нейросеть возвращается и начинает веса калибровать. То есть вешает не 105 граммов, а 107,4 грамма. То есть действует более мягко. У нас другие пиксели вышли, на другой уровень на том же изображении. Опять открывает ярлык, и так 10 миллионов раз, пока этого котика не сформирует. То есть это все время калибровка шума. <...>

Что общего у нейронных сетей и человеческого сознания

Математическая модель работает по тому же принципу, что и наше сознание. Мы также воспринимаем образы — назначаем тому или иному объекту некую идентификацию. Скорее всего, вы уже видели достаточно женщин с микрофоном в своей жизни, поэтому, смотря на меня, вы идентифицируете меня легко. Если бы я к вам вышла в костюме гориллы, то вы бы фокусировались чуть дольше.

В чем магия нашего восприятия? Что когда мы наблюдаем объект или целый калейдоскоп объектов, то каждый раз применяем к тому, что мы видим, чувствуем, слышим, некую вероятность. То есть мы уже имеем палитру опыта в нашем сознании, а он у нас субъективный. Я понимаю, что в руках у меня книга. Но это происходит не сразу. В доли секунды идет определенная калибровка.

Если вы посмотрите на объект через мутное стекло, то его опознание произойдет в несколько итераций, в несколько слоев. Ровно так же, как у нейросети. Помните про калибровку? Пришли, повесили веса. Совпало, не совпало? В нашем сознании происходит то же самое. И это один из признаков, что у нас есть самосознание. Потому что это и опыт, и наш оптический аппарат. 

Но в 2023 году нам уже неважно, как машина будет генерировать текст или изображения. Больше волнует, что именно мы хотим получить. Это новые взаимоотношения между нами и искусственными нейросетями.

Сейчас можно услышать много спекуляций: «Это занимает всего 20 секунд: вы зашли, вбили свой запрос, машина сгенерировала и — о чудо! — можно больше ничего не рисовать». Но это не так. У журнала Cosmopolitan в июне 2022 года вышла обложка, полностью сгенерированная алгоритмом. Это звучало так: «Всё, нам не нужны фотографы, мы сгенерировали!» Потом в соцсетях редакция опубликовала видео, как они 10 часов пытались найти запрос, который был нужен. Проще было сфотографировать. 

Любые цифровые технологии, которыми мы пользуемся, — это зеркало, в котором мы можем увидеть самих себя. Взрыв интереса к алгоритмам, которые генерируют изображения и тексты, говорит о том, что мы хотим понять: что же делает нас людьми? Что делает наше сознание непрерывным, а опыт — субъективным, личным и ценным? Возможно, взаимодействие с искусственными нейросетями позволит нам лучше это понять.

Книги

Рубрики

Серии

Разделы

Издательство