Экспертный клуб

Искусственный интеллект уже среди нас, чего ждать - эксперт

ChatGPT

Индустрия искусственного интеллекта стремительно развивается, в том числе и в принятии технологии среди простых пользователей. Инструменты типа ChatGPT, Stable Diffusion и ElevenLabs позволили миллионам людей во всем мире взаимодействовать с II.

Обнаруживает ли ChatGPT интеллект? Оставит ли технология людей без работы? Этично ли использовать ИИ на войне? Об этом и не только ForkLog пообщался с основателем стартапа по цифровому клонированию человека Pheon, а в прошлом – владельцем аутсорсинговой компании Hey Machine Learning Юрой Фицджеральдом из Харькова.

О ChatGPT

ChatGPT. О нем говорят буквально все. Что ты думаешь об этой технологии?

Я думаю, это отличная технология. Она появилась не вчера, до этого долго шли. Эволюция заняла лет пять [с момента появления первой версии GPT]. И сейчас мы в точке, когда есть ChatGPT, GPT 3.5, а вскоре и четвертая версия выйдет.

Google также проводит некоторые опыты со своей языковой моделью. Они, скорее всего, используют ЛаМДА. Один из удачных экспериментов – применение языковой модели в функции планирования.

То есть, на языковую модель подается задача, например, «мне нужно принести бутылку пива». Затем языковая модель генерирует алгоритм действия: «подъехать к холодильнику – поднять руку – открыть дверь – взять бутылку – закрыть дверь – развернуться – привезти бутылку».

Далее этот алгоритм парится и выполняется. Результаты получились хорошие.

Это можно назвать проявлением интеллекта?

Языковые модели, в частности GPT, это уже хорошее проявление интеллекта. Лет пять назад, когда II выполнял узкоспециализированные задачи, я говорил: «люди поймут, что искусственный интеллект уже пришел, когда алгоритмы будут выполнять более широкий спектр задач, если не лучше человека, то хотя бы на уровне».

ChatGPT и GPT в частности – огромный шаг в этом направлении. По сути, это одна модель, хорошо решающая множество задач, даже тех, которые не имелись в виду.

Это такая мультизадачная штука, которая будет развиваться в сторону мультимодальности, то есть будет совмещать разные алгоритмы в единые системы. Точнее, это уже происходит. Видели сериал Nothing Forever на Twitch? Где объединили генератор картинок и текстовую модель, которые непрерывно создают сценарий и рисуют изображения.

Если эти модели существуют давно, в чем секрет успеха ChatGPT?

На мой взгляд, удачным шагом очень удобный интерфейс для взаимодействия. Это как с [протоколом] HTTP. Его удобно смотреть и отлаживать, уже потом на него наградили знакомый всем нам интернет.

OpenAI примечательна тем, что они, по сути, монополисты. Как пионеры технологии, у них отличная команда и практически неограниченные ресурсы от Microsoft. сделке на $10 млрд].

Я уверен, что там не вся сущность в деньгах. Очень многое решает сервис Azure и их серверы, к которым OpenAI имеет безлимитный доступ.

Сейчас это особенно ценно, потому что банально не хватает вычислительных мощностей. У Amazon и Google их нет в достаточном количестве. Даже мы как небольшой стартап – нам много серверов не нужно – регулярно сталкиваемся с проблемами. Мол, вот наши деньги, но их не могут взять, потому что у них нет доступных ресурсов.

И сейчас рядовому стартапу очень сложно конкурировать в фундаментальном направлении диалоговых моделей. Натренировать модельку с нуля – это дорого, очень дорого, и таких ресурсов у стартовых стартовых строчек нет.

Поэтому ChatGPT – очень мощная монополия.

О синтетических людях

Если уж разговор зашел о вашем стартапе, Pheon, расскажи о нем подробнее .

Это digital-cloning стартап. Технология клонирования людей; создание цифровых копий. По сути, сгенерированное видео, на котором человек выглядит и звучит так же, как в жизни, говорит примерно то же, что и оригинал.

Допустим, клон Илона Маска. На вопрос «где ты работаешь» он ответит: «я являюсь CEO Tesla Motors, SpaceX, Neuralink, Twitter», и что там у него еще есть.

Как у вас родилась подобная идея?

Начиналось все с поиска. На этом этапе мы перебирали все возможные варианты II-продуктов с новыми и перспективными технологиями. Собрали много вариантов, из которых выбрали пять лучших и презентовали профильным инвесторам.

Идея с цифровыми людьми вызвала наибольший интерес, потому решили на ней сфокусироваться.

Кроме этого, о ней давно уже говорят, снимают сериалы типа «Черного зеркала». К нам [в Hey Machine Learning] приходил заказчик, который хотел что-то подобное сделать – оживить покойного дедушку. Мы изучили возможности, и тогда все было плохо.

Пока вопрос технологического риска не стоит. В том или ином виде они существуют.

Синтетические люди – перспективная ниша?

Это как GPS, когда перестала быть чисто военной системой и ушла в народ. На ее основе появились сервисы типа Uber, Glovo, Google Maps, получила развитие отрасль дронов.

Так и с цифровыми людьми – фундаментальная технология, поверх которой можно строить много разных применений. Можно оцифровывать знаменитости и связать с образовательными курсами, изучением языков. Например, изучить испанский из Бейонсе.

Это может быть консалтинговая история. Многие юридические кейс вроде открытия компании по законам штата Делавер, представление налоговой декларации и составление отчетов подвергаются формализации. С таким объемом работы, который человек не потянет легко справится цифровой юрист.

Еще пример — коуч-мотиватор, помогающий добиваться цели вроде регулярного посещения спортзала. Он сможет напоминать о необходимости ходить на тренировку, контролировать выполнение упражнений на разные части тела, спорить о чем-то.

Есть много применений, о которых мы и не догадываемся. Эта индустрия только начинает появляться. Мы сейчас в поиске большого рынка под эту историю.

Как происходит процесс цифрового клонирования? Предположим, я селебрита и хочу создать свою копию. Что мне нужно для этого сделать?

У нас уже есть решение для селф-онбординга, где можно создать клон. Сейчас это в простом варианте, где ты описываешь краткую биографию человека, важные факты о нем, характере. И скачиваешь видео, снятое хоть с селфи-камеры смартфона, где он что-то говорит.

Эти данные используются нейросетями для того, чтобы сгенерировать персональные видеоответы.

Как-то звучит просто. Помню кейс, когда оцифровали словацкого баскетболиста Луку Дончича. Его долго фотографировали в студии под разными углами, записывали образцы голоса и т.д. Ваш подход сильно страдает качеством результата?

В начале мы также имели высокие требования к контенту. Для этого нужно было арендовать студию, что в Америке не дешево. Оплатить работу оператора, продюсера, несколько часов снимать контент, заботиться об идеальном свете, положение головы в кадре.

Впоследствии требования к контенту значительно снизились. К селфи-видео на пять секунд.

Есть ли у вас защита от недобросовестного использования? Чтобы не создавали клонов звезд и не распространяли с их помощью токсичный контент?

Конечно. Наши нейросети отфильтровывают контент. Есть модель, которая тренируется на таких датасетах, чтобы минимизировать количество непристойного, грубого или токсичного контента. Это касается текстовых запросов.

В плане видео все это может решаться водяными знаками, дисклеймерами в самом приложении.

Но пока у технологии генерирования есть ряд ограничений. Иногда в каких-то кадрах могут проскочить артефакты, разрешение картинки также ограничено. То есть по таким маркерам можно определить реальный ли контент.

Но это вопрос времени, когда технология в 99% случаев будет отлична от видео, записанного на камеру.

Вы фиксировали попытки сгенерировать что-нибудь неприемлемое? Замечали ли ошибки самой программы?

Нередкий случай, когда приходит человек создавать двойника, но вместо своего селфи загружает видео с утятами какими-то. Или записывает YouTube вместе с интерфейсом.

Хотя мы упростили порог входа, для большого количества пользователей снять качественный контент – это не простой процесс. По ряду технических и психологических обстоятельств.

Если кто-то скопирует образ, скажем, Ким Кардашьян без разрешения. Кто отвечает за это?

Если ты делаешь свою программу и генерируешь контент, то права на использование образа имеешь.

У нас была ситуация с AppStore, когда мы собрали приложение под одного селебрита. Apple отклонила заявку и запросила документы, подтверждающие право использования образа.

Мы им направили соответствующие бумаги и, в результате, приложение допустили к публикации.

на UGC-площадках ответственность за контент ложится на пользователей. Платформа должна только модерироваться. При возникновении спорных ситуаций необходимо разбираться, нарушены права или нет.

О войне

Основная часть команды у вас была сосредоточена в Харькове. Как начало широкомасштабного вторжения повлияло на работу?

Это риторический вопрос для всех, кто в начале войны был в Украине. Конечно, на нас это повлияло негативно. Поднялись процессы, на первый план вышли вопросы безопасности. Из Харькова пришлось эвакуироваться.

Часть людей разъехалась. А я большой противник удаленной работы: считаю, что команда должна работать вместе, потому что скорость коммуникации и общение очень много решают.

Очень много крутых идей появляется в случайных диалогах. Да и банально что-то объяснить, показать, проговорить рабочие вещи – это скорее делать в формате с глазу на глаз.

Вам удалось сберечь состав команды?

У нас один человек пошел воевать. Остальные команды сохранились.

Спустя почти год вам удалось вернуть прежний темп работы?

Да, перфоманс вернулся к довоенному уровню. Трудно было первые несколько месяцев.

Говоря о войне, как ты считаешь, насколько нравственно использовать ИИ на поле боя?

Совершенно допустим, почему нет? Почему природный интеллект нравственно использовать, а искусственный — нет? Их отличие только в том, что естественный родился, а искусственный собрали.

И если роботы смогут воевать друг с другом, люди перестанут страдать. Но такая утопия малореалистична.

Об общем искусственный интеллект

Сейчас II стал массовым явлением, хотя еще совсем недавно он был более интересен гикам и целевому сообществу. Что изменилось в последние годы?

Лет 5 назад я выступал с презентацией о ІІ в Харьковском национальном университете радиоэлектроники. Впрочем, с тех пор она не утратила актуальность. Появились какие-то новые наработки, те же Diffusion или ChatGPT.

Предшественником этого стало железо, доступность вычислительных мощностей. Органически растет сообщество, появляется больше специалистов, «звезд» отрасли. Соответственно это сообщество и делает больше исследований, больше хороших новых инструментов.

Больше становится данных, их стало проще хранить и подешевле обрабатывать. То есть предпосылка – это экономика.

По-твоему, не было какого-то переломного момента, а все развивалось в свою очередь?

А что такое переломный момент?

Случилось нечто такое, что разделило на «до» и «после».

А что такое «до» и что такое «после»?

К примеру, когда вышла DALL-E и оказалось, что изображение можно генерировать по текстовому запросу.

DALL-E далеко не первый, было много других решений. Они были хуже качества, генерировали более «ЛСД-шние» картинки.

Конечно DALL-E, GPT – это майлстоуны. В известной степени это все переломные моменты. Но для меня это одна естественная непрерывная эволюция.

Года пять назад мы обсуждали чат-ботов и говорили, что эта технология уже отходит на задний план. Ты мог тогда предположить, что в 2023 году чат-бот будет столь популярен и востребован?

Я тогда не думал, что чат-бот – это удобный интерфейс для искусственного интеллекта.

Но и сейчас есть небольшое различие между тем, что человек общается с другим человеком или ботом. Даже очень умным роботом.

Здесь уже больший барьер в психологии. Дружба это не просто переписка. Это длительный процесс выстраивания отношений, наличие общих моментов, воспоминаний, увлечений.

Общение в формате переписки – одна из составляющих дружбы. И чат-боты ее не заменяют.

Но даже в текущем виде они могут создавать определенную привязанность. Особенно это заметно среди одиноких людей, ищущих поддержку.

Но и все это будет эволюционировать, обрастать психологическими факторами. Таким образом, работы будут восприниматься более живыми.

А если не как общение, а обслуживание. Если бы тебе подавал блюда в ресторане робот, ты себя комфортно чувствовал бы?

Конечно, есть потребность в человеческом общении, но и нет претензий к ботам. Я недавно заходил в кафешку, где готовят машины. Там работает всего один человек, который устанавливает капсулы с макаронами и соусами в этих роботов. Они все это смешивают, подогревают, готовят, а ты наблюдаешь за процессом и через 15 минут у тебя готовый заказ.

Еда по вкусу ничем не отличается от блюд шеф-повара. Это, конечно, не «мишлен», скорее ближе к домашним макарошкам. Но это обычная, съедобная еда.

Изысканная кухня тоже может прийти к этому в процессе естественной эволюции.

Да, приятно, когда приходит официант, заботится о комфорте гостя. Машины пока не могут их заменить, потому что нет таких технологий. Если вместо человека будет приходить робот – так это здорово.

Какие сектора II ты считаешь наиболее перспективными?

И вообще II очень перспективная отрасль. Как сказал Эндрю Ин, Искусственный интеллект – это новое электричество.

Что будет развиваться? Из того, что сейчас в тренде собственно языковые модели. Они станут фундаментом для ІІ. Если говорить о векторе развития – мультимодальность.

Поверх моделей будут добавляться новые интерфейсы, кроме текстовых. Это могут быть системы принятия решений для роботов, генераторы сценариев для видео, военные технологии.

Как сильно автоматизация повлияет на рынок труда? Останутся ли люди без работы?

Без дела люди не останутся. А работу можно придумать по любой деятельности. Можно переквалифицироваться в другую профессию.

Какие-то области начнут трансформироваться. С очевидного – копирайтинг.

Несмотря на то что алгоритмы могут создать большие объемы изображений, дизайнеров они не заменят. Они трансформируют ремесло.

С тем же GPT запрос необходимо правильно сформировать. Так что может появиться такая работа – промпт-инжиниринг. Специалист, который будет формировать правильную задачу для ІІ.

На данный момент у человека большое преимущество. С него можно спросить, когда что-то пошло не так. С чат-бота ты не спросишь. Это еще одна причина, почему люди не скоро останутся без работы.

Мне недавно картинка попала в интернете, где в магазине с работами-пылесосами уборщица моет полы. Ее всегда вспоминаю, когда говорят, что люди останутся без работы.

В магазине с работами-пылесосами уборщица моет полы

Что на счет общего ІІ, как скоро он наступит? И нужен ли он нам вообще?

Он уже явился. Такой же GPT.

На тему «что такое общий ИИ» можно спекулировать, потому что нет единого мнения. В моем понимании это одна система, один мозг, архитектура, которая может решать широкий спектр задач.

ChatGPT такова. Она решает широкий спектр задач, которым даже не училась. И эта способность будет становиться сильнее и сильнее.

В теории ChatGPT смог бы пройти тест Тьюринга, и обычный человек не догадался бы с кем общается?

Даже у нас люди, общающиеся с клоном, спрашивают: Ты живой человек? Давай позвоним пообщаемся». И сбрасывают в чат номер телефона.

Есть у людей зерно сомнений. Так что тест Тьюринга на этом этапе пройден.

Лет пять назад AGI был очень глупо. Да и сейчас ему далеко до человека. Но пройдет какое-то время и II сравнится с людьми. Это отлично, это продвинутое развитие.

Сейчас исследователи и математики очень ограничены в когнитивных возможностях. У нас есть барьер: размер мозга, количество нейронов. И мы не можем его преодолеть.

А у продвинутого интеллекта будет преимущество, он сможет находить какие-то более глубокие закономерности, о которых мы даже не подозреваем. Сочинять новые смыслы, недоступные человеческому разуму.

AGI сможет создавать какие-нибудь новые приборы, генерировать новые понятия, и всем от этого будет хорошо.

Если работы, конечно, нас всех не уничтожат. Но хорошая новость в том, что это вряд ли произойдет в нашей жизни.

Чтобы всегда быть в курсе самого важного, читайте нас в Telegram

Комментарии

Сообщение от

Актуальные новости и аналитические материалы, эксклюзивные интервью с элитой Украины и мира, анализ политических, экономических и общественных процессов в стране и за рубежом.

Мы на карте

Контакты

01011, г. Киев, ул. Рыболовная, 2

Телефон: +38-093-928-22-37

Copyright © 2020. ELITEXPERT GROUP

К началу