Что скрывает искусственный интеллект?

Всем привет!

По мнению участников курса “Анализ данных и машинное обучение в гидрологии” наиболее интересной и привлекательной темой для изучения является именно машинное обучение.

Всем интересно знать, что на самом деле представляют модели машинного обучения, насколько они интерпретируемы и применимы для решения задач в области гидрометеорологии.

Не будем мучить участников лишней болтовней на лекциях и ответим на все вопросы прямо сейчас.

Что представляют собой модели машинного обучения?

Можно выделить два основных типа моделей:

Обучение моделей заключается в том, что на известной выборке “вход – выход” (обучающее множество) ищется оптимальная структура моделей, позволяющая минимизировать ошибку моделирования, т.е. решается стандартная задача оптимизации. Для нейронных сетей мы оптимизируем веса, с которыми происходит суммирование сигналов в нейронах, а для ансамблей деревьев – набор дискриминирующих правил (каждое такое правило последовательно разбивает нашу подвыборку на максимально однородные группы). Математики придумали кучу методов и эвристик, позволяющих обучать модели машинного обучения быстро и качественно.

Насколько модели машинного обучения интерпретируемы?

В общем случае работает правило: простые модели (одиночное решающее дерево или нейронная сеть с одним скрытым слоем из пары-тройки нейронов) – интерпретируемы, сложные – нет.

Вопрос интерпретации моделей машинного обучения на данный момент является самым обсуждаемым и важным для будущего развития области:

  • Nature задается вопросом можем ли мы заглянуть в “черный ящик” искусственного интеллекта, понять, принять и доверять его решениям и как это будет сказываться на качестве нашей жизни;
  • Исследователи из MIT представили простенькую нейронную сеть, способную объяснять свои решения;
  • Команда Google Brain научила две сети общаться между собой так, чтобы их не понимала третья;
  • Яндекс научил свои нейронные сети искать ответы на поисковые запросы, руководствуясь смыслом, но как именно это происходит на нижних уровнях сети никто вам рассказать не возьмется.

Где и как можно применять модели машинного обучения в гидрометеорологии?

  • Когда вы выжали все соки из своих физически обоснованных моделей (формирования стока, снежного покрова, экстремальных осадков), но полученной эффективности вам мало;
  • Когда вы хотите найти в ваших данных структуру (или паттерны), не идентифицируюмую(емые) стандартными средствами географического анализа (в народе “здесь этого больше, потому что того меньше”);
  • Вас непреодолимо тянет все классифицировать на черное и белое, опасное и безопасное, теплое и мягкое, но на диаграммах рассеивания все очень неопределенно.

Резюме

Машинное обучение не является панацеей для решения задач в области гидрометеорологии. По крайней мере пока. Все может измениться в тот момент, когда в нашей области появятся действительно большие данные – миллиарды примеров реализации процессов (читай измерений) – а это произойдет не скоро. Наверное.

Если после прочтения этого поста вам стало интересно разобраться в теме, то буду рад ответить на ваши вопросы в комментариях или в моих соц.сетях.

Курс “Анализ данных и машинное обучение в гидрологии” является открытым для посещения и бесплатным – у вас есть возможность приходить на занятия к нам в ИВП РАН, а также удаленно следить за материалами курса на github. Ближайшее занятие пройдет 14 ноября – на нем мы постараемся разобраться с git и начать программировать на python.

Advertisements

One thought on “Что скрывает искусственный интеллект?

  1. Pingback: Кто финансирует ИВП РАН? | Georgy Ayzel procrastination history

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s