Заходят как-то программист, юрист и просто хороший парень из Яндекса на IT-конференцию... / Новостная / "P.S.

Принято считать, что искусственный интеллект — это далёкие грёзы писателей-фантастов, которые войдут в наш быт когда-нибудь через пару десятков лет. Однако «когда-нибудь» уже наступило. От «Алисы» и беспилотников «Uber» до «писем счастья» и боевых роботов. Системы на основе машинного обучения прочно укоренились и продолжают совершенствоваться. О задачах, которые они могут решать, проблемах современного ИИ, тенденциях развития и «отношениях» с законом рассказали спикеры «machine learning meetup» конференции «meta/conf» 25 мая на Центральной EVENT площадке Воронежа.

Двери лифта открываются, и участники попадают в дивный футуристичный мир: кристально белый зал, огромный балкон с деревянным полом и видом на весь Никитинский сквер. Пока люди разбредаются в разные стороны и рассматривают свои отражения на полу, я пробираюсь к стойке регистрации. Внимание притягивают огромные плакаты встречи в hi-tech стиле с механизированными руками и клавиатурой Apple на бирюзовом фоне.

Зарегистрировавшись, подхожу к столам организаторов. Девушки с улыбками на лицах предлагают участникам конференции перейти на сайт для проверки своих навыков и знаний в IT-сфере, фильмах, комиксах и видеоиграх. Тут же можно пройти тесты разговорного английского и английского для IT-специалистов в твёрдой форме. За прохождение участники получали стикеры от DataArt.

В попытках пройти к балкону едва не сбиваю с ног официантку и вспоминаю о том, что в расписании звучала «пицца»:

10:00 — 11:00 Регистрация участников, приветственный кофе

11:00 — 11:45 Алексей Шаграев — руководитель службы разработки Яндекс.Поиск
Искусственный интеллект: ретроспектива и будущее

11:45 — 12:30 Дмитрий Соболев — Senior Developer DataArt
Как проверять решения искусственного интеллекта

12:30 — 13:15 Александр Мазалов — Управляющий партнер «Мазалов, Хромова и партнеры»
Право автономных умных систем. Как общество регулирует беспилотную экономику.

13:15 — 13:45 Pizza time

13:45 — 14:30 Станислав Протасов — Заместитель заведующего кафедрой теоретической и прикладной информатики МФТИ
Машинное обучение не…

14:30 — 15:15 Антон Долгих — Head of AI, Healthcare and Life Sciences, DataArt
Нейросетевая вероятностная модель естественного языка

Сейчас «фаза приветственного кофе», а значит, исполняя свой журналистский долг, я обязан продегустировать меню. Гостям предлагалось два вида пиццы, щедро посыпанные зеленью: с салями и грибами, слоёные и бисквитные мини-тортики, печенье с малиной и трубочки с заварным кремом. Напитки: вода с лимоном и восемь видов кофе (среди которых так и не встретился русиано).

На часах 11:10, камеры и свет выставлены, микрофоны настроены, аудитория заняла места в отдельной секции зала и Алексей Шаграев начинает доклад о разнице современных и старых методов обучения машин:

— Мощь современных методов в том, что модель просто получает картинку, набор пикселей и потом с этим уже работает. Раньше вот машина обыграла человека в шахматы, но это было не очень интересно, потому что там было очень мало интеллекта и очень много чисто дробления. Три года назад человек проиграл в "го". А сейчас ИИ уже побеждает в StarCraft. Суть примерно такая, что раньше машинки выигрывали за счёт огромного числа операций: если профессионал делает 300 кликов в минуту, то она, ну, скажем, 10 тысяч. Тут сделали классно, машинка не делает больше действий чем человек, но выигрывает. Пока игрок просто смотрит, как войска рубятся, она успевает экономику развивать, юнитов подвигать. И поэтому задача предсказания по набору пикселей — совершенно другая по сложности.

Это то, что называется reinforcement learning, он сейчас всех буквально разрывает, потому что эти примеры очень крутые, и машины нас побеждают там, где, как казалось когда-то, человека никогда не подвинуть, у нас же есть интуиция, дух, нас никогда не победить, но нет. Вся сложность reinforcement learning-а в том, чтобы в процессе порождать огромное количество партий в шахматы, StarCraft и смотреть-смотреть, чтобы получать более обширную выборку. Такая вот работа будущего — учить машину делать то, что делаю я. Однако из за требования огромных кластеров с видеокартами и другого железа это пока экономически не очень выгодно.

Что у ИИ пока что не получается:

Понимать тексты
Понимать людей
Взаимодействовать с физическим миром
Генерировать обучающие наборы
Применять модели эффективно

В первые годы после рождения человек воспринимает невероятно много информации и невероятно быстро учится, например распознавать и воспроизводить речь, машинку пока что так учить мы не умеем. И люди сейчас заняты тем, чтобы понять, как человек это делает, благодаря чему лучше учить ИИ. И в результате так получается, что обучение ИИ помогает нам лучше понять самих себя.

За лекцией последовали вопросы:

— Вы упомянули пока что недоступные для машин задачи, есть ли прогнозы, когда их можно будет реализовать?
— Прогнозов много, но это не важно, слишком много неопределённостей. Сейчас роботам ходить сложно, а раньше думали, что они не смогут в StarCraft играть.

— Если дата-центры генерируют много тепла, а у нас в Пензе довольно холодно, может дата-центр под котельную построить и за коммуналку меньше платить?
— Почему бы и нет? А идея классная, свежая, можно пробовать. Не просто так найти дата-центр в Финляндии, проще чем в Сахаре.

Следующий спикер занимает сцену практически мгновенно. Слушатели готовятся узнать о принципе выбора решений ИИ:

— Недавно исследователи Google напечатали трёхмерную черепашку, и вот система компьютерного зрения её распознаёт со всех ракурсов как ружьё. То есть машину нужно проверять и понимать, почему она сделала такой выбор, особенно, например, в медицине, чтобы избежать ошибки и последующего ущерба. Была такая история когда-то на заре времён: к учёным пришли военные, принесли картинки и попросили сделать систему, способную отличать на фотографиях танки и не танки. Те сделали, военные проверили — всё супер. Но в полевых условиях классификатор тесты завалил, оказалось, что на картинках с танками внизу стоял крестик. Поэтому машина различала танки и крестик вместо первоначальной задачи. Одним из решений сейчас является система для довольно простых примеров — она просто берёт и показывает важность входных параметров, например, первые 10 вносят наибольший вклад в решение. Другие берут модель, берут какое-то решение и для этого решения строят объяснения.

В небольшом окне между докладами успеваю поговорить с одиноко сидящим на полу «Алексеем из Яндекса»:

— Я учился в энергетическом университете, не самый лучший университет Москвы. Я чуял, что что-то не так идёт, и мне было интересно, что ещё можно поделать. И так, среди прочего, нашёл Школу анализа данных в Яндексе. Там же классные чуваки, я тоже хочу быть классным, пошёл в Школу на курс machine learning. Сначала думал, что это какая-то астрология, так не бывает, потом оказалось — работает. Вот, после ШАДа пошёл работать в Яндекс.Новости. Четыре года там пробыл, затем в Яндекс.Поиск, занимался новостями в поиске, и как-то нормально всё начало получаться, ну, вот я и тут.

В Яндексе мне нравятся две вещи, — продолжает Алексей. — Первое: это некое локальное российское «сборище» очень умных людей и это позволяет другим очень умным людям чувствовать себя востребованными в России, есть смысл быть умными и учить математику. Другое: благодаря тому, что есть Яндекс, существует много сервисов, которые конкурируют с какими-то другими, а из-за конкуренции сервисы становятся очень хорошими. Например, Uber в Стокгольме или Google Карты в Лондоне — это кошмар какой-то, потому что они там представлены в единственном числе. Они не работают, но ими пользуются. Здесь конкуренция очень высокая, и это улучшает уровень жизни. Воронеж, вот, отсюда Берлин напоминает.

Новая тема стала «передышкой» между сложными техническими понятиями и формулами благодаря своей близости к более приземлённым соц-экономическим процессам:

— В 66 году в США была введена система, которая в режиме реального времени отслеживала налоговые поступления и налоговые потоки. Это привело к появлению вопросов о том, что компания-разработчик этого ПО создала его таким образом, что система делала исключения для компаний-дочек этого разработчика. Однако программный комплекс был настолько сложен, что в принципе работать с ним могла только эта компания. То есть во всех этих решениях есть одно «но»: мы всегда говорим о том, что первый порог сначала заложен в людях, когда мы говорим о регулировании ИИ, речь идёт не о регулировании роботом — речь всегда идёт о регулировании поведения людей.

В чём опасность этих компьютерных систем. Во-первых, мы не совсем правильно понимаем термин «автономность». Нам кажется, что есть какая-то большая база данных, мы её анализируем и если принимаем какие-то решения, то все они обязательно объективны. Но эта объективность в принципе обманчива и ведёт к гипертрофированному доверию к этим системам. Например, есть реальное судебное решение, которое в качестве доказательства использует не факты, а подозрения системы, о том, что юридическое лицо совершило правонарушение. То есть ВЫ должны доказывать, что система ошиблась.

Есть ещё одна история, завершилась она в досудебном порядке. Один человек обнаружил, что в одном из банков чёрным дают меньше кредитов, чем белым. Он решил это проверить и записывал два параметра: уровень доходов и цвет кожи. Оказалось, что у людей с одним и тем же доходом, если они чёрные, банк не одабривал кредит. Он обратился в досудебную инстанцию и проиграл, потому что разработчик ему объяснил, что такого параметра как цвет кожи в системе нет.

Ещё один пример: система, которая установлена в судах штата Калифорния определяет, давать вам УДО или нет. Осуждённому во второй раз за вооружённый грабёж белому парню система дала слабый риск рецидива. А чернокожей женщине, которая пьяная села на чужой велосипед и отъехала от магазина, присвоили высокий риск опасности. Как вы думаете, почему? В этой системе нет параметра «цвет кожи», он угадывается из других параметров. Расистская ли эта система? Безусловно. Объективная ли она? Я не знаю. Должны ли такие вещи регулироваться законодательно? Да, должны.

Что касается автономных военных систем: ни одно из государств не признаётся, что они существуют. Так как автономные летальные боевые системы запрещены, а полуавтономные нет, весь рынок этих роботов умещается в узенькое поле полуавтономных боевых систем. В чём проблема: любой выпускник второго курса экономического факультета Занзибара объяснит вам, почему Терминатор — это полуавтономная боевая система. Большинство НПА не дают исчерпывающих определений того, является ли система автономной или полуавтономной. И даже если у
оператора есть кнопка включения машины — это полуавтономная система, так как существует обратная связь. Оператор может следить за сотней беспилотников и обратная связь у него на уровне «abort operation».

Но из-за когнитивных особенностей человеческого организма мы понимаем, что на самом деле ни за чем он не следит. Понятно, что эти системы, которые вроде как законодательно неавтономные, сейчас уже довольно самостоятельны. С этим связан достаточно высокий уровень ложного срабатывания, когда беспилотник думает, что у людей в руках оружие и считается, что оператор принял решение атаковать. Скорее всего оператор принял решение тем, что он не отменил эту операцию. И это очень опасно, так как на уровне НПА это не регулируется.

Настало долгожданное pizza time. Участники конференции спешат обновить стаканчики кофе и один за другим обнаруживают уже образовавшуюся очередь. Взглянув на белоснежные скатерти столов, удостоверился, что пиццы не осталось.

— Площадка и третья лекция классные, видно, что мужик шарит, обширно и доступно рассказывает, важные проблемы затронул. Вообще хорошо, что у нас в Воронеже это начинает развиваться, потому что в СПБ и Москве всё на совсем другом уровне, — рассказывает Александр ПАХОМОВ, начинающий JAVA-разработчик

Последние доклады были похожи на концентрированную смесь математических понятий, сложных формулировок и вообще слабо связанных с «нашей» реальностью вещей. Поэтому сейчас самые важные моменты из них(~~ну или те, которые я хотя бы понял~~):

— Машинное обучение не понимает людей. Вы, кстати, тоже не понимаете людей. Предположим, что вы запускаете сервис и вам нужно обучить модельку, предсказывать курс валют, рекомендовать что-то, неважно. И вот раз — вы нашли данные, которые вам подходят, это значит вашу задачу кто-то уже решил. А вы, скорее всего, хотели бы чего-то отличного от других. Легко заметить, что если вы делаете несущественные изменения в функционале, то возможно и данные очень сильно поменяются. К примеру: у меня в VK, Instagram и Facebook почти идентичные списки друзей. И вот я открываю Instagram: у меня поля, еда красивая. Открываю VK: у меня ад какой-то, репосты, поздравления, мудрые высказывания несуществующих людей. А Facebook: там всё социально важное — люди борются за мусорки, ночлежку, социальная движуха. Одни и те же люди в соцсети, где можно лайкать, постить картиночки и текст, делают совершенно разные вещи. Если я рекомендательную модель VK применю к Facebook, получится не то, что надо, так как они имеют разное назначение, хотя у них в общем-то одинаковый способ взаимодействия.

— Огромный текст информации, который мы получили в этом мире, лежит за пределами текстов, которые мы прочитали. В нейронной сити, которую мы учим не будет нашего невербального опыта, в ней не будет даже некоторого вербального опыта.

После конференции люди (кто-то устало, кто-то восторженно делясь впечатлениями) органичной массой двигались к лифтам. Неизменно активным и бодрым был co-founder Evrone Юрий ГУРЖИЙ:

— У нас за плечами уже более 40 мероприятий. Среди них Ruby Russia 2019 — крупнейшая конференция по Ruby в России, на которую приедет его создатель. Самым сложным в Воронеже было «достать» программистов из их уютных гнёздышек и «притащить» на мероприятие. Здесь просто нет такой традиции, как в Москве: когда каждые выходные ты можешь сходить куда-то, да ещё будет из чего выбирать. Организация такой встречи стоит порядка 200 тысяч рублей. Так как язык программирования Ruby последние 10 лет является топовым для стартапов, а мы на рынке лидируем: спонсора найти не проблема — мы просто всех знаем.

Спонсором конференции выступил «Ростелеком».

Организаторы:
DataArt — проектирует, разрабатывает, модернизирует и поддерживает IT-решения в области финансов, здравоохранения, туризма, медиа и интернета
Evrone — создание и эксплуатация высоконагруженных и технически сложных проектов на языке Ruby.

Следующая встреча, главной темой которой будет язык программирования JAVA, пройдёт в сентябре.

Евгений СТРЕКАЛОВ
Картинки взяты из группы встречи Вконтакте.