Извлечение данных для бизнес-анализа
На этот раз речь пойдет о курсе в бизнес-школе Wharton, который называется Data Mining for Business Intelligence. Его ведет ассистант-профессор Shawndra Hill. На русский язык название курса можно перевести как «Извлечение данных для бизнес-анализа». Причем, именно «извлечение», «добыча» данных, а не «сбор», как может показаться на первый взгляд. Это становится понятным после ознакомления с содержанием курса. Если в двух словах, то в мире компании собирают огромное количество самой разнообразной информации, например, от пользователей в социальных сетях, ведут всевозможные базы данных и т.п. В этих массивах данных есть много скрытой информации стратегического значения. При помощи специального программного обеспечения (например, Weka) из этих массивов данных извлекается что-то новое, полезное, например, определенные взаимосвязи, которые сразу не видны. При этом используются специальные алгоритмы типа нейронных сетей, генетических алгоритмов, деревьев решений, технологии OLAP и т.п. В силлабусе к курсу есть ссылка на учебник «Introduction to Data Mining and Knowledge Discovery», в котором достаточно понятным и не очень сложным для восприятия языком описывается суть предмета.
В ходе занятий студенты, помимо прочего, объединяются в группы и работают над проектами, используя специальные методы и технологии извлечения данных для решения тех или иных бизнес-проблем. С первого же дня им приходится думать над тем, что означает «новшество» в той области, где они трудятся, над чем работают. Вот лишь некоторые задачи, которые решают студенты: предсказание успеха микро-заемов, вероятность задержек авиарейсов, вероятность того или иного результата в баскетболе. Например, группе MBA студентов из пяти человек, среди которых были и студенты с русскими фамилиями Валерий Расторгуев и Наталья Алихашкина, дали задание реализовать проект по предсказанию задержек авиарейсов. Они собрали подробную информацию о погоде и вылетах самолетов. Группа сфокусировалась на рейсе из аэропорта Д. Кеннеди в Нью-Йорке в Международный аэропорт Лос-Анджелеса и разработала модель, которая может помочь путешественникам выбирать рейс с минимальной возможностью его отмены. По мнению студентов, это очень важная проблема, поскольку задержки авиарейсов приносят экономике США убытков на 12 млрд. долларов. Если бы люди могли заранее знать, будет ли отложен или отменен тот или иной рейс (даже через несколько недель), они могли бы найти другой вариант. Таким образом, в год они могли бы сберечь от 500 млн. до 1 млрд. долларов.
При написании поста были использованы материалы Knowledge@Wharton.
Tags: data mining, mba, Wharton, Александр Ветелкин, бизнес-школа, МБА, учеба в Америке