В распоряжении бизнес-аналитиков на сегодняшний день немало сложных и интересных инструментов, но очень многие из них представляют собой своеобразный «черный ящик». Эти системы собирают данные и выдают готовый результат. Они могут предсказать, что именно должно произойти с большой долей вероятности, но почему это произойдет, как можно воспроизвести эту ситуацию в будущем или наоборот, избежать ее, остается тайной. То есть, программа способна уловить корреляцию, но не может произвести причинно-следственный анализ.
Но похоже, нашлась как минимум одна система, способная раскрыть отношения внутри «больших данных» и управлять прогнозами. В октябре этого года кембриджская компания Nutonian сообщила, что ей удалось привлечь капитал в 4 миллиона долларов для развития и коммерциализации своей аналитической платформы. Eureqa — платформа для машинного обучения, с которой до нынешней поры работало около 40 тысяч человек, обещает дать миру тысячи новых бизнес-идей. Каким образом? Система будет находить ключевые закономерности и взаимосвязи в «больших данных» и выводить законы бизнеса так же, как раньше открывала научные закономерности.
Неудивитиельно, что этот «Святой Грааль» заинтересовал многих предпринимателей. Eureqa могла бы помочь многим организациям сориентироваться в огромных потоках данных, циркулирующих на их серверах. Частично ее уже опробовали в различных коммерческих сферах, не считая университетской среды, где она разрабатывается. Eureqa уже показала неплохие результаты в исследованиях, связанных с добычей нефти и газа, в химической промышленности. в розничной торговле и финанасах, а также в социальных исследованиях.
Компания утверждает, что Eureqa – лучший из возможных инструментов для открытия и понимания скрытых взаимосвязей в данных любого рода. На сегодняшний день Eureqa способна самостоятельно вывести фундаментальные законы физики, если ей предоставят достаточно экспериментальных данных. Система доказала это, переоткрыв второй закон Ньютона за считанные часы. А еще, как полушутя сказал исполнительный директор и основатель Nutonian Майкл Шмидт, «Возможно, вы заметили, что в бизнесе почти нет никаких законов физики. Мы собираемся изменить это».
Речь, разумеется не о том, чтобы действительно начать открывать пачками новые научные законы. Скорее, слова Майкла – это несколько гиперболизированный способ донести до публики, насколько уверенно его система ориентируется в статистических закономерностях.
Eureqa способна выделить из огромных массивов данных причнно-следственные связи, что позволит клиентам решать проблемы реального мира, для которых не хватает прогнозного анализа. Притом для того, чтобы ориентироваться в результатах, не нужно иметь техническое образование.
Система стала одним из побочных результатов работы над самовосстанавливающимися роботами. Эти машины умеют наблюдать за собой, диагностировать неполадки и принимать решения об их устранении. Оказалось, что алгоритмы, которые используются при этом, можно применить для анализа данных любого другого типа.
Eureqa ачинает с того, что ищет в наборе данных записи, которые, как ей кажется, могут быть связаны друг с другом. Потом она пытается описать найденные взаимосвязи при помощи простых уравнений. Первоначально выражения формируются случайным образом, в них скомбинированы алгебраические операторы(+, -, *, /), синусы, косинусы, константы и различные переменные. Эти исходные уравнения всегда неверны, хотя и в разной степени. На их основе выбираются новые уравнения, чуть более приближенные к действительности — машина тестирует их на реальных данных и немного корректирует, отбрасывая бесперспективные варианты. Приближение выполняется снова и снова, возможно, миллиарды раз, пока цикл не дойдет до уравнений, которые действительно работают. Eureqa способна найти взаимосвязи там, где их практически невозможно получить методом традиционного анализа.
Используя такой метод, Eureqa способна эффективно прогнозировать значимые переменные в уравнениях, которые больше других влияют на конечный результат. Пользователь же получает возможность наблюдать за ходом «размышлений» и наглядно видеть процесс. Это отличается от большинства подходов, которые сосредоточены на прогнозировании результата, однако не дают пользователю узнать, откуда берется тот или иной вывод. Алгоритм, который использует Eureqa, называется «символической регрессией».
Платформа Eureqa — прекрасный пример того, какими всесторонними и всеобъемлющими могут быть алгоритмы исследования «больших данных». Законы Вселенной и правила производства лекарств, способы предвидеть изменение продаж в магазине или вырождение нефтяной скважины — все это достигается практически одинаковыми методами. И достаточно скоро, вероятно, пользователи, даже не имеющие технического образования, будут понимать принципы, которыми руководствуется система, видеть ход ее «мыслей» и использовать их для введения улучшений в своем бизнесе. Ведь просто обидно подумать, сколько закономерностей и факторов, способных кардинально изменить ваш бизнес, остаются неучтенными на сегодняшний день…