Все про искусственный интеллект
В гостях:
  • Константин Воронцов
    профессор Российской академии наук, доктор физико-математических наук, доцент кафедры ВМК МГУ, один из ведущих российских специалистов в области искусственного интеллекта, руководитель лаборатории машинного интеллекта МФТИ
    Константин окончил МФТИ, был экспертом Яндекса и Сбербанка. Он специализируется в науке о данных (Data Science), интеллектуальном анализе данных (Data Money) и машинном обучении (Machine Learning)
АН: Добрый день, дамы и господа. Я рад приветствовать вас сегодня на нашем канале Nadmitov Live. Сегодня у нас в гостях Константин Вячеславович Воронцов, один из ведущих российских специалистов в области искусственного интеллекта, профессор Российской академии наук, доктор физико-математических наук. Кратко о нашем госте: Константин Воронцов окончил МФТИ, сейчас является руководителем лаборатории машинного интеллекта МФТИ, доцентом кафедры ВМК МГУ, ранее был экспертом Яндекса и Сбербанка. Специализируется в науке о данных (Data Science), интеллектуальном анализе данных (Data Money) и машинном обучении. Сегодня мы будем обсуждать вопросы искусственного интеллекта. Как считается, четвертая технологическая революция базируется на мобильном интернете, искусственном интеллекте и машинном обучении. Константин Вячеславович, скажите, искусственный интеллект или все-таки его имитация?

КВ: Моя позиция такова, что это все-таки имитация. Я люблю повторять, что нет ничего искусственного, чтобы мы могли назвать интеллектом. Это ничего больше, чем просто набор функций, которым люди занимаются уже двести лет, начиная с Гаусса. Просто стали более сложные данные, более сложные модели, более быстрые вычислители, и постепенно, как говорится, количество переходит в качество. Мы действительно наблюдаем такие вещи, которые нас очень сильно впечатляют, и компьютерное зрение позволяет лучше решать задачи распознавания человека. Анализ текстов, синтез текстов, распознавание, синтез речи – такие вещи, которые двадцать лет назад казались фантастикой, даже десять лет назад. Тем не менее все это никакого отношения не имеет к интеллекту, хотя вообще трудно определить понятие философское – точного определения нет, что такое интеллект. Но все эти книжки, устройства, которые мы сегодня называем искусственным интеллектом, – это просто функции, которые умеют обучаться по данным. Короткое математическое определение, давайте его популяризируем.

АН: В чем разница между наукой о данных (Data Science), интеллектуальным анализом данных и машинном обучением?

КВ: Data Science – это все-таки такой зонтичный термин, как мы говорим. Он более широкий. Машинное обучение внутри – это ядро искусственного интеллекта, хотя под искусственным интеллектом понимается чуть более широкая область исследований. Эти слова возникли в 1950-е годы, их придумали американские ученые, и следует воспринимать эти слова как мечту. Мы хотели бы искусственный интеллект, но это не означает, что мы сейчас владеем и умеем его делать. Мы на пути к этому. Техник сразу развилось очень много, начиная с «давайте мы исследуем, как люди играют в шашки или шахматы, заложим эти правила в программу компьютерную». Это то, с чего начинался искусственный интеллект. «Давайте в компьютер заложим правила, с помощью которых люди решают те или иные сложные профессиональные задачи». Экспертная система, как называли мы. Сейчас этого все меньше и меньше, потому что машинное обучение делает чуть больше, оно само обучается на основе опыта и данных – не берет готовые правила у людей, которые сами обучились как-то, обобщили этот опыт, а пытается опыт непосредственно обобщать. Это более широкая постановка задач, шаг вперед, и машинное обучение где-то до 2010-х годов развивалось в русле такой классической математической статистики. Решались задачи прогнозирования и принятия решений. Так это в те годы называлось. Прорыв произошел где-то в последние десятилетия, когда нейронные сети оказались способными обрабатывать данные гораздо более сложной структуры: изображения, речь, тексты, графы – взаимодействия какие-то сложные. Дальше искусственный интеллект будет развиваться в сторону того, что все более и более сложные, как мы говорим, «сырые данные», данные, которые идут от каких-то устройств, от датчиков каких-то – откуда угодно – могут быть очень разнородными. Весь этот массив данных «перелопачивается» для того, чтобы принимать какие-то решения, делать прогнозы, управлять какими-то очень сложными процессами. Вот поэтому машинное обучение потихоньку переросло в то, что называется наукой о данных. Прежде чем, собственно, заниматься этими алгоритмами сложными, которые имитируют интеллект, сначала надо данные для них подготовить, это тоже отдельная наука. Есть Data Science, а есть Data Engineering. Вот Engineering – это более рутинная работа, она более техническая, более инженерная: как данные подготовить, чтобы потом можно было на них обучать искусственный интеллект – машинное обучение. Я уже отказался от слов «искусственный интеллект» и тут же начинаю по привычке говорить. Это нормально. Мы все в таком лингвистическом поле живем, мы пользуемся словами, но они не всегда в точности означают то, как они воспринимаются неспециалистами.

АН: С чем связано бурное развитие искусственного интеллекта в последние годы?

КВ: Наверное, прорыв произошел где-то в начале 2010-х годов, именно в компьютерах. Все началось с того, что в 2009 году стартовал конкурс ImageNet – это огромный массив размеченных изображений. Люди в режиме краудсорсинга размечают, что они видят на фотографии (фотографии из интернета просто), какие объекты они там видят. Начали с миллиона размеченных изображений. Надо себе представить, какой огромный это человеческий труд был. Была создана специальная платформа для этой работы. Сейчас это уже почти пятнадцать миллионов размеченных изображений, такой огромный датасет. Идея была замечательная в основе, кажется, из соображений нейрофизиологии, что ребенок за первые пару лет своей жизни видит примерно порядка миллиона слепков реальности и образует понятия: это мама, это папа, это игрушка, это котик, собачка и так далее. Он начинает ориентироваться в трехмерном пространстве, в окружающем мире, в социуме. Кажется, что миллионы – это примерная оценка количества таких изображений. Ученым хотелось проверить эту гипотезу: «Можем ли мы искусственную нейронную сеть натренировать так, чтобы она с высоким качеством распознавала изображения по обучающей выборке из миллионов размеченных фото?». Оказалось, да, возможно. Где-то в 2011-2012 году, когда впервые возникли такие модели, которые назвали глубокими нейронными сетями, они сделали революцию в компьютерном мире. Уровень ошибок был 25%, потом его снизили вдвое, потом еще вдвое, потом дошли до человеческого уровня – это около 5%, а теперь там где-то 2,5%. Нейронные сети решают задачи распознавания изображений лучше, чем это делают люди. Это значит, что можно распознавать лица, номера автомобилей, гражданскую от военной техники отличать с беспилотниками – кучу разных задач можно решать полностью автоматически, без участия людей. Дальше, раз компьютерное зрение получилось, давайте попробуем с текстами поработать, с речью поработать (распознавание речи, синтез речи), дальше это уже стало распространяться на другие типы данных, сложных данных, потому что картинка или видеоряд – это сложноустроенные данные.

АН: Я слышал, начинали тренироваться на котах.

КВ: Да, это была одна из задач, причем она не первая была. Начиналось все-таки с ImageNet. Это Google придумал конкурс: «Давайте мы будем выявлять из видеоряда фотографии, на которых присутствуют коты, видеокадры с котами». Это такое вот рекламное приложение, конечно, но понятно, что если вы научились котов отличать от всего остального, то гаубицу противника вы тоже научитесь отличать.

АН: Что такое искусственные нейронные сети?

КВ: Большая тема.

АН: Вкратце.

КВ: Если попытаться объяснить, то это какая-то натяжка, модель, попытка сымитировать функционирование естественной нейронной сети, начиная с того, как работают отдельные нейроны. Этим занимались в середине XX века: где-то в 1943 году возникла математическая модель, начиная с которой можно было развивать алгоритмы, полностью оторвав это от структуры биологической и поместив в электронно-вычислительную машину. Это модель МакКаллока-Питтса. 1943 год – такой большой шаг. Потом было еще несколько удачных попыток сделать такого сорта алгоритмы, которые умеют обучаться по данным, а структура их несколько напоминает то, что у нас в мозгах, устройство мозга. Каждая нервная клетка соединена примерно с 10 000 в среднем другими клетками, и всего таких примерно 80 миллиардов в человеческом мозге. Мы еще не дошли до таких масштабов и еще будем пару десятилетий добираться до этого. Есть закон экспоненциального возрастания вычислительных мощностей, согласно которому где-то там лет через двадцать мы, наверное, сравняемся по возможностям с человеческим мозгом. Пока мы находимся где-то на уровне даже не кошечки, а мышечки, может быть, или чего-то еще более примитивного. Но, если мы посмотрим на то, как комар летает, это же фантастика. Наши нейронные сети пока еще не умеют ничего такого делать, как управлять, да еще быстро махать крылышками и лететь туда, куда надо, светлые и темные пятна отличать, и это все упаковано в таком мизерном объеме. Природа далеко впереди нас пока. Мы догоним, я думаю. Что тогда произойдет, когда мы догоним? Сингулярность наступит, или еще что-то такое произойдет.

АН: Чем глубокие нейронные сети отличаются от обычных?

КВ: Здесь тоже мы имеем переход количества в качество. Начиналось все с простых экспериментов. Где-то в 1950 – начале 1960-х годов Фрэнк Розенблатт придумал устройство полуаналоговое, которое распознавало цифры рукописные на основе изображения, там была двухслойная нейронная сеть. Потом была знаменитая книга Мински и Паперта «Персептроны», в которой практически математически доказывались ограничения. Ученые несколько разочаровались после этих отрицательных результатов, дескать, не все может нейронная сеть. Наступала зима искусственного интеллекта, несколько зим, несколько волн разочарований. На очередной волне энтузиазма люди начинали думать: «Вот сейчас наступит роботизированное будущее», потом оказывалось, что это были перегретые ожидания, и снова наступала зима искусственного интеллекта. Таких зим было несколько. Очередное лето, и теперь, кажется, надолго, может быть, навсегда наступило как раз в 2010-е годы, когда ImageNet создал компьютерное зрение и именно глубокую нейронную сеть (семь или восемь слоев – знаменитая сеть AlexNet), потом число слоев постепенно увеличивалось, и было показано, что с увеличением числа слоев мы все более сложные задачи способны решать. Потом появился ResNet, там 150 с чем-то, потом еще. Оказалось, что нет ограничений – этих слоев уже больше, чем в мозге человека. Такая простая нейрофизиологическая оценка, реакция меньше секунды – больно, горячо, холодно, отдергивать руку – меньше, чем секунда реакция. Это от датчиков прошел сигнал, переработал с мозгом, и сигнал пошел на мышцу в руку. Меньше секунды прошло. Мы знаем, как сигнал проходит по отдельному нейрону, за какое время, и делить одно время на другое получается – грубая оценка – примерно 15-20 слоев прошел этот сигнал от начала до конца. Мы уже строим глубокие нейронные, где 200 и больше этих слоев. Мы уже в принципе по числу слоев далеко превзошли те естественные нейронные сети, которые есть у высших животных, но по объему пока не дотягиваем на несколько порядков. Математически уже в последние годы все больше появляется всяких разных обоснований и результатов строго доказанных, как теоремы, которые говорят о том, что лучше глубина, чем ширина. Если увеличивать количество параметров сети, то лучше наращивать глубину, чем количество нейронов в каждом слое. Это уже практически строго доказанный результат.

АН: Развитие и доступность вычислительных мощностей сыграли свою роль в развитии?

КВ: Несомненно. Называют три главных предпосылки этого прорыва в искусственных нейронных сетях. Первое – появились большие и открытые доступные данные, конкурс ImageNet – один из примеров. Второе – это разработаны алгоритмы оптимизации сложных многопараметрических функций. Этих всех параметров миллионы, а в последних моделях – миллиарды числовых параметров, которые надо настроить так, чтобы на огромной выборке решалась какая-то очень сложная задача. Такие методы оптимизации как раз вот-вот были разработаны к этому времени. Это математические результаты, вычислительная математика. И, наконец, – вычислительная техника, графические карты, пример – прорыв AlexNet в конкурсе ImageNet. Джеффри Хинтон со своими аспирантами – это человек, который стоял рядом или сам сделал практически основные прорывы в области нейронных сетей, один из топовых ученых в этой области. По рассказам (это уже такие, что называется, легенды ходят в профессиональном сообществе, как дело было), его аспиранты занимались программированием игр на графических картах. Он тогда сказал: «Ну вот, кажется, что это хорошее устройство для распараллеливания вычислений нейронной сети. Попробуйте это сделать, я за вас статью напишу, вы только сделайте». Это может быть байка, может быть нет. Идеи Джеффри Хинтона были исполнены хорошими, грамотными инженерами, которые научились с помощью техники, предназначенной для быстрой отрисовки пейзажей трехмерных в играх на графических картах. Оказалось, что эта вычислительная техника может быть адаптирована для обучения нейронных сетей. Высокая степень параллелизма. Очень простые вычисления, очень специфичные, но очень сильно распараллеленные. Оказалось, можно реализовать. Потом начался бум специализированных графических карт, которые заточены не только на то, чтобы быструю отрисовку сцен в играх делать, но и на то, чтобы нейронные сети обучать. Отсюда Nvidia и прочие гиганты этого рынка. Можно так сказать, сообщество герцметров покупали, инвестировали практически, вложили ресурс в то, чтобы были создана вычислительная техника для обучения нейронных сетей.

АН: Попутно еще криптовалюту изобрели. Согласны ли Вы с тем, что в искусственном интеллекте самую важную роль играет вычислительная мощность?

КВ: Она, естественно, играет важную роль, строит сложные сети на огромном количестве таких вычислителей, там и уже тысячи. Если посчитать, сколько стоит это вычислительное время, энергия, время, амортизация оборудования, – это какие-то баснословные суммы, совершенно не подъемные для простых научных коллективов, а Google или Facebook могут себе такие вещи позволить. Они находятся на передней грани этих прорывов. Они могут настроить нейронную сеть на полтерабайта текстов для того, чтобы эта сеть могла отвечать на вопросы или генерировать тексты, трудно отличимые от текстов, написанных людьми. Такие задачи сейчас тоже решаются, и вычислительный ресурс, который был необходим для построения таких моделей, гигантский, он стоит больших денег.

АН: Я читал, что в Facebook система рекомендации публикаций занимает безумную вычислительную мощность.

КВ: Хард – это одно, это железо, но нужно еще научиться на них эти алгоритмы запускать так, чтобы они сумели воспользоваться этими возможностями распараллеленными.

АН: То есть для того чтобы эффективно заниматься искусственным интеллектом, нужно иметь доступ к суперкомпьютеру?

КВ: Вообще говоря, да. Чтобы решать задачи по обучению таких моделей, где миллиарды параметров, это возможно только на таких ресурсах, где вы имеете под рукой несколько десятков тысяч вычислительных устройств и много времен вычислительного.

АН: Кто сейчас глобальный дилер в области искусственного интеллекта?

КВ: Эти названные – Google, Facebook, Amazon – те, кто сам имеет такие вычислительные мощности и способен их еще предоставлять. Через облачный сервис вы можете, заплатив совсем немного, несопоставимо мало по сравнению с тем, если бы у вас под столом стоял этот сервер, провести какой-то действительно сложный эксперимент. Это не очень дорого стоит. Как только вы увеличиваете объемы этих самых терабайтов, это вылетает в огромную копеечку и не каждый себе может это позволить. Google может.

АН: Я читал, стартап вылетел в трубу: они допустили ошибку, и он начал вычислять бесконтрольно, и у него бюджет сразу улетел в облака. Я читал, что в феврале этого года перед комитетом Сената США выступал Шмидт – это бывший председатель совета директоров Google. Он сообщил, что в течение следующего десятилетия Китай может обойти Штаты в области искусственного интеллекта и искусственный интеллект является стержнем технологической конкуренции. Как Вы считаете, это возможно?

КВ: Да, возможно. Здесь все определяется тем, как концентрируются ресурсы. Чудес на свете не бывает. За все надо заплатить, если мы хотим развивать науку или если хотим развивать технологии. Это все денег стоит больших, в это надо вкладывать. Если мы не осознаем, что у нас наука недофинансирована не просто на проценты, не просто в разы, но порядком, она не может конкурировать с Китаем или США просто потому, что нет ресурса. Людям надо деньги платить, оборудование надо покупать – все денег стоит. Мы рискуем проиграть эту гонку или же, где-то на повороте срезав угол, обойти где-то в узких направлениях. Да, можно получить прорывы в узких направлениях, сэкономив деньги, но есть риск, что мы полностью останемся за бортом всего этого направления. В это надо вкладывать деньги, чтобы быть конкурентоспособными. Чудес на свете не бывает.

АН: Считается, что в мире есть всего три страны с суверенным интернетом – это США, Россия и Китай. Я так понимаю, что именно российская математическая школа обеспечивает суверенитет. Согласны ли вы с этим утверждением?

КВ: Насчет суверенитета не очень согласен. Можно понимать это по-разному.

АН: То, что у России есть по крайней мере свой поисковик.

КВ: Вот, это важно. Да, у России есть Яндекс, совершенно замечательная компания и замечательное явление. Яндекс сделан людьми, которые понимают в математике, понимают в технологиях и понимают в бизнесе. Это, конечно, не только математика – все остальные компоненты очень важны. Было миллион возможностей загубить все это дело, приняв какие-то неверные бизнес-решения и уйти с рынка, где есть Рамблер и другие поисковики. Было огромное количество поначалу, но потом остались те, которые смогли создать инфраструктуру, экосистему. Выживают те, которые распространяют свой бизнес с узкого направления. Исходно поисковые системы – узкое направление. Исходно никто не понимал, как монетизировать. Google придумал, что можно слова продавать, Яндекс быстро начал делать то же самое, и это позволило им сконцентрировать капитал и развиваться. Это замечательно, что в России есть такая компания, и, конечно, это крупный концентрат всего хорошего, но этого недостаточно для суверенитета.

АН: Чтобы развивать искусственный интеллект, что нам нужно – больше математиков или инженеров?

КВ: Интересный вопрос. Когда я приходил в профессию, это было начало 1990-х годов, я был студентом физтеха. Тогда мы уже обсуждали с моими научными руководителями и коллегами, что наша профессия просто обречена на успех, и тогда было понятно, что проникновение вычислительной техники во все сферы жизни идет, компьютеры дешевеют, данные дешевеют, данных много и эти данные надо использовать для автоматизации, для принятия решений прогнозирования и так далее. То, что мы имеем сегодня, нам было совершенно очевидно в 1990-е годы. Мы пытались развивать компанию, которая занимается внедрением этой науки, но рынок пока не созрел, социум пока не созрел, нам казалось, что вот-вот это все наступит, через год или два, а наступило через двадцать лет. Так долго созревает общество и отношение общества ко всему этому. Ты приходишь, говоришь: «Мы понимаем, что это должно работать так-то и так-то», тебе говорят: «Это в наш бизнес не вписывается, и через пять лет не впишется, и через десять лет». Обидно. Можно было бы сегодня сделать какие-нибудь замечательные вещи, что-то такое круто автоматизировать. Люди не понимали этих возможностей двадцать лет назад. Откосность мышления остается, пока не подняли хайп «строим цифровую экономику, потому что все вокруг уже строят». Это можно было бы и двадцать лет назад начинать делать. Наш голос тихо звучал.

АН: Константин Вячеславович, как Вы считаете, в отличие от Восточной Европы, которая довольно сильно пострадала от утечки мозгов, в России все-таки сохранился жизненно необходимый слой людей, который обеспечивал преемственность, что позволило успешно работать в этой области?

КВ: Конечно, мало нас. Уезжает все же большое количество специалистов. Я сам лично страдаю от того, что мои лучшие ученики уезжают за рубеж, и не только мои. Я считаю, что это не совсем правильно, но каждый для себя эту мораль решает. Ты здесь вырос, в этом сообществе, получил бесплатное образование в России, даже и учителя не очень плохие, но все равно ты едешь куда-то в поисках лучшей жизни, где люди веками трудились и создали комфортный для жизни социум. А ты туда едешь на готовенькое. Я не буду это называть изменой Родины – слишком громко было бы. Что-то меня в этом коробит, и, наверное, это причина, по которой я сам не уехал. Я считаю, что более честно и правильно не ехать на готовенькое куда-то, где уже жизнь хорошая, где жизнь уже наладили предыдущие поколения тех людей, которые жили там. Ты к ним не имеешь никакого отношения. Ты это не заработал, твои отцы и деды это не заработали, ты туда поехал на готовенькое. Да, конечно, твои таланты силы там, быть может, найдут лучшее применение, потому что там более комфортные условия для науки. Если так посчитать, мир уже глобальный, и каждый человек сам для себя выбирает, где лучше условия для жизни и работы. С этой позиции все окей. Если посмотреть на это с другой стороны, везде ли в мире окей? Например, наша страна, где недостаточно еще этого уровня развития, этого уровня прогресса и той же самой науки, и технологий, и комфортной жизни для людей. Если лучшие умы будут из той страны уезжать, здесь будет все хуже и хуже. Нам надо здесь, наоборот, оставаться, консолидироваться и строить эту жизнь для себя и для наших детей. Когда мы теряем лучших, мы теряем шансы на то, что нам удастся здесь собрать сопоставимое по качеству общество, страну, построить, отстроить здесь все. Нам людей не хватает очень сильно, чтобы отстраивать, ресурсов не хватает – денег и людей. Надо здесь как-то концентрироваться, чтобы не только там было хорошо. Если в одно место съедутся все лучшие, все самые умные и самые классные со всей Земли, то в этом месте что-то такое-то прекрасное может быть создано. А как в остальных местах? Что там останется? Мне кажется, нужно это разнообразие мест и культур, где люди по-разному пытаются построить свое счастье, свою комфортную среду для того, чтобы жить, творить и создавать. Я считаю, что важно, чтобы мы эту среду сами здесь создавали. За нас это никто не сделает, потому всегда обидно терять лучших, которые уезжают. Они говорят: «Я уеду, но мы же с Вами в хороших отношениях, мы с Вами продолжаем контакт». Это все лукавство, потому что человек уезжает и он там будет работать на работодателя. Все измеряется временем человеческой жизни. Это единственный ресурс, который у нас есть вообще в жизни. Но ты там уже. У тебя там круг общения, у тебя там интересная работа, ты туда едешь и думаешь, что сохранишь связи со своим сообществом здесь, в России, с научным руководителем, с научной группой, но опыт показывает, что эти связи рвутся.

АН: Я слышал, у китайцев другая модель. Они, наоборот, отправляют, чтобы там они обучились, набрались опыта и вернулись уже с накопленным багажом.

КВ: Другой менталитет, другой социум. Они там могут заставить своих граждан так делать, а мы люди более свободолюбивые, больше индивидуалисты. Я не могу своего ученика заставить поехать туда, набраться опыта, сказав: «Но ты обязательно приезжай через два года, чтобы ты приехал и здесь курс отчитал. Ты здесь у нас статьи будешь писать, сидеть в моей лаборатории». Я так не могу сказать, и наше государство так тоже не может сказать. У нас культура другая, и люди нас не поймут, если мы так скажем.

АН: Я надеюсь, что рано или поздно кто-то вернется и в России будет создана такая среда, которая будет благоприятствовать.

КВ: Эту среду надо создавать. Надо создавать привлекательную среду, чтобы к нам ехали, а не от нас. Это очень важно. Если мы не создадим, мы постепенно будем в год по несколько десятков тысяч самых лучших людей терять.
АН: Я хотел вернуться к искусственному интеллекту. Согласны ли Вы со следующей формулой превосходства в искусственном интеллекте: собрать как можно данных, создать как можно более сложную модель и обучить модель как можно быстрее?

КВ: В целом, наверное, да. Очень важно понимать, какие задачи мы хотим решить, определиться с приоритетами, где мы хотим эти прорывы. Цифровая экономика? Окей. Огромное количество задач в самых разных отраслях, где эти методы и технологии могут прийти и сделать революцию в автоматизации, в сокращении расходов, в том числе некоторые процессы будут происходить практически без участия человека. Это будет дешево, высвободит рабочие места. Все боятся, что искусственный интеллект придет и лишит нас работы. Мне кажется, наоборот. Всегда такие опасения были по отношению к технологиям, но история показывает, что все происходит в точности наоборот. Любая новая технология создаёт новые профессии, мы просто подумать о них не можем. Что это значит? Люди, которые будут учить роботов. Нужны миллионы таких людей. Сейчас прообразом этих новых профессий является краудсорсинг. Яндекс стал одной из платформ, где люди зарабатывают копеечку за счет того, что они оценивают качество поиска. Сходил в своем родном городе, прошёлся, погулял, пофотографировал малый бизнес, витрины магазинов сфотографировал, загрузил, и тебе за каждую какая-то копеечка капнула. Такими вещами можно заниматься, и люди пока не осознали, что это монетизируется, трансформируется в деньги. Вот это все мы будем делать – оцифровывать окружающий нас мир, а нам за это будут чуть-чуть платить. Может, это станет такой профессией и можно будет на этом жить вообще.

АН: Работа своего рода разносчиком искусственного интеллекта.

КВ: Да, такая низкоквалифицированная работа. Все время боятся, что придет автоматизация и эти низкоквалифицированные люди уйдут, люмпенизируются, собьются в банды и так далее, много всяких разных страхов. Конечно, придется переквалифицироваться. В современном мире это неизбежно – настолько сильно и быстро все развивается, что многим людям приходится по жизни менять профессию, переквалифицироваться, искать, какая профессия сейчас более перспективная, где больше денег заработать, может быть, думать о том, чтобы уехать из депрессивного региона туда, где можно легче заработать. Наоборот, появятся новые возможности, новые технологии, всегда создается много новых возможностей, просто мы их пока не видим, догадаться иногда не можем, какие новые профессии возникнут, поэтому нам страшно.

АН: Был юристом, стал лигалтех-офицером или специалистом. В чем разница между информационным инженером, data scientist и менеджером в области data science?

КВ: Очень простая разница на самом деле. Data engineer – это люди, которые делают более инженерную рутинную работу, менее творческую, но не менее нужную. Это тоже высококвалифицированные специалисты. Они должны понимать, как устроены данные, они, может быть, даже лучше должны чувствовать связь с бизнесом, общаться с теми людьми, которые понимают, как эти данные были собраны, какие у них могут быть недостатки. Самая большая проблема – это так называемая грязь в данных. Грязь появляется от людей (человеческий фактор начинает портить данные), либо от каких-то процессов, которые еще недостаточно устоялись, либо технические сбои могут происходить, либо опять-таки тот же самый человеческий фактор. Эти грязи в данных лет пять–десять назад были не столь важны, не влияли на бизнес-процесс критическим образом. Если в бизнес-процесс начинает встраиваться data scientist, ему на входе нужны чистые данные, иначе автоматизация принятия решений будет буксовать, будет слишком много ошибок, они отразятся на бизнесе неправильно. Построить хорошую автоматизацию можно только на основе хороших данных. Профессия data engineer – это тот человек, который понимает, как устроены данные. Он консолидирует эти данные, он следит за чистой этих данных, он понимает структуру этих данных, их смыслы на уровне бизнеса. Это такая достаточно серьёзная, очень важная профессия, без нее ничего не получится. Data scientist немного витает в облаках, потому что он строит модели: готовые данные ему пришли, он нейронные сети строит. Какая-то более поэтизированная, так скажем, деятельность. Тем не менее это тоже инженер. Ему редко, когда нужно будет погрузиться в математику и разработать новую свою технологию, мы об этом уже поговорили. Это еще один клан людей, которые создают новые технологии. Их не так много нужно, но они суперуровня. Project-менеджеры – это те люди, которые управляют процессом внедрения этих технологий в бизнесы, где люди, во-первых, хорошо должны разбираться в бизнесе, они должны понимать, как ставить задачи, как их формализовывать, как перевести желания, потребности бенефициаров, или владельцев бизнеса, или управленцев бизнеса перевести на язык формальный, на язык математики, моделей и инжирных решений. Эти люди еще должны уметь распоряжаться кадрами, то есть команды подбирать. Это другие навыки, они должны тоже понимать, что такое Data Science, как строить модели и, главное, отличать квалифицированного специалиста от недоученного. Там свои скиллы. В этих трех профессиях, о которых Вы сказали, разные требования, разная суть работы и разные скиллы.

АН: Получается, data scientist должен знать, что под капотом, быть математиком?

КВ: Да. Все-таки больше инженером, чем математиком, но математику он должен знать.

АН: Data engineer – это практически рядовой в области разработки.

КВ: Да, можно и так сказать. Он выполняет очень важную работу.

АН: Проектный менеджер – это, по сути, владелец продукта?

КВ: Да. Product owner – тоже очень важная роль в любом проекте по внедрению технологий искусственного интеллекта.

АН: У меня вопрос – почему суперкомпьютер DeepMind обыграл чемпиона по игре в го лишь в 2016 году, в то время как Deep Blue обыграл Каспарова двадцатью годами ранее, еще в 1997 году? С чем это связано?

КВ: Го – это все-таки игра в некотором смысле более сложная, более интуитивная, более творческая. Когда были прорывы именно в игре в шахматы, тогда многие говорили, что искусственный интеллект никогда не научится играть в го. Научился. Эти ожидания оказались пессимистически заниженными, когда подошли новые технологии и те же самые глубокие сети. Без революции в компьютерном зрении невозможно было бы сделать революцию в го. Казалось бы, как связаны эти вещи? И там, и там глубокие нейронные сети. Сначала они показали свою работоспособность в более простой, более органичной для них задаче, потом научились их внедрять в другие изначально менее приспособленные задачи, но приспособили, научились. В го без того прорыва в глубоких нейронных сетях было бы невозможно выиграть.

АН: Получается, нужно моделировать человеческую интуицию?

КВ: Отчасти, но на самом деле компьютер учится играть в такие сложные игры совершенно по-своему. Это не человеческая интуиция, это просто обучение на основе автоматического проигрывания большого количества игр. Правила игры искусственные, и можно заставить компьютер поиграть с самим собой. Два алгоритма играют друг с другом, соревнуются, выигравший получает приоритет, чтобы далее на его основе какой-то еще более успешный алгоритм конструировать, и это все автоматически. Это все в некотором смысле моделирует эволюцию. Не готовый человеческий мозг моделируется, а моделируется прямо-таки эволюция, которая просто выживают за счет того, что они более успешны. Фактически это модель дарвиновской эволюции на алгоритмах.

АН: Константин Вячеславович, скажите, когда, на Ваш взгляд, искусственный интеллект достигнет уровня человеческого разума, как в фантастических фильмах?

КВ: Это вопрос, конечно, очень многогранный, и в нем много этически моментов. Нужен ли вообще нам искусственный разум, который будет сопоставим с нашим? Я считаю, что вообще не нужен. Нам не нужен конкурент, особенно, не дай Бог, если искусственный интеллект наделят в какой-то степени автономностью и, совсем не дай Бог, если он научит себя реплицировать. Фильм «Матрица» про это. Нам туда не надо. Мы строим нашу человеческую цивилизацию, и мы, конечно же, не хотим сами создать себе такого конкурента, который нас вытеснит из нашей экологической ниши на планете Земля. Это ужасная перспектива, но она в принципе реализуема, потому что технократы говорят, что, как только технология становится доступной, обязательно найдется кто-то, кто это реализует просто потому, что это возможно. Да, это самоуничтожение, но все равно найдется безумец, который это реализует. Поэтому тут без юридических ограничений не обойтись. Мы владеем массой технологий, которые мы как-то ограничиваем, вплоть до полного запрета, их развитие. Уже десять или пятнадцать лет назад можно было бы сделать беспилотный летальный аппарат с автоматом Калашникова, который умеет летать и расстреливать людей. Но нельзя такие вещи делать. Нельзя такие вещи выпускать наружу, в общество, за пределы чистого военных предложений. Урегулировали этот вопрос? Да, вплоть до того, что вообще беспилотниками нельзя пользоваться в некоторых странах. Может, это даже правильно. Когда технологии действительно грозят вырваться из-под контроля, их надо чисто юридическими мерами, очень грамотно отстроенными, ограничивать. Может быть, не запрещать, потому что тогда это запрет развития – мы должны развивать эти технологии, но очень четко регламентировать. Потенциально мы можем создать себе конкурента, если мы поставим задачу перед собой сделать искусственное существо, которое будет обладать искусственным интеллектом, эквивалентным человеческому. Человеческий интеллект как обучается? В социуме. Его обучают учителя. Если мы создадим робота, которого мы также наравне с людьми будем обучать (некий аналог школы, детского сада и так далее), и это все будет жить с нами, вместе с людьми, то это очень опасный путь. Правильный путь, на мой взгляд, – это когда мы имеем конкретные задачи по автоматизации и не выращиваем себе заменителя. Экскаваторы копают землю лучше, чем люди; подводные лодки плавают лучше, чем люди; самолеты летают лучше, чем люди, – люди вообще не летают. Это примеры технологий, которые по каким-то параметрам превосходят человека на много порядков. Тем не менее ничего страшного в этом нет. Мы ими пользуемся, они наши рабы. Нужно, чтобы искусственный интеллект оставался нашим послушным рабом, ни в коем случае никакой автономности.

АН: На уровне домашнего животного?

КВ: Нет, интеллектуальный уровень, вычислительный уровень неизбежно станет выше, чем у человека. Но ему нельзя давать автономность. Он не должен сам принимать решения, он не должен сам заниматься целеполаганием, у него не должно быть инстинкта выживания. Мы наделим его автономностью рано или поздно, потому что технократы не понимают, что нельзя создавать бочку с порохом, садиться на нее и поджигать, чтобы узнать, в какую сторону полетишь. Это технократическое мышление. Нам не хватает мышления гуманитарного, системы ценностей, может быть, некой идеологии правильной, позитивной, цивилизационной – можно по-разному называть – которая эти сдерживающие факторы образует у технократов, чтобы они не стремились к самоликвидации. «Я это сделал, потому что мог» – это не позиция цивилизованного человека, homo sapiens. Человек разумный может так говорить, но мы переходим уже к другому уровню развития – человек цивилизованный, человек, у которого есть некие моральные и этические нормы, который следует не из каких-то там исторически сложившихся мифологических или религиозных представлений, а из того, что он четко понимает, что, если мы создадим вот это и вот это, есть верный путь к самоуничтожению. Это произойдет вот так-то и так-то. Наука может очень четко спрогнозировать, поэтому мы этого не делаем. Мы вводим юридические нормы, мы ставим запреты определенные, но не запреты на развитие технологий, а запреты на их применение. Куда-то идти нельзя. Запретили же биологическое и химическое оружие, взяли под контроль ядерное оружие, но тем не менее оно есть. Здесь нужно выработать систему сдержек противовесов. Искусственный интеллект – это тоже потенциально опасная технология, которая в принципе грозит уничтожением человечества точно так же, как и ядерное оружие, значит, надо придумать способы правильного развития и правильного сдерживания.

АН: Константин Вячеславович, я считаю, что Вы подняли очень важную тему этического регулирования искусственного интеллекта, я думаю, это может быть темой для отдельной дискуссии. Хотел бы поблагодарить Вас за очень интересную дискуссию.

КВ: Спасибо, что пригласили.

АН: Надеюсь, что Вы к нам еще придете.

КВ: С удовольствием.

АН: Очень много областей, которые можно обсудить. Хотел еще раз поблагодарить Константина Вячеславовича Воронцова, одного из ведущих российских специалистов в области искусственного интеллекта, за очень интересную дискуссию. До новых встреч.

КВ: До новых встреч.
YouTube канал:

Аудио подкасты:
Made on
Tilda