Прогнозная аналитика в больших данных

Гостевой пост

Эндрю Роджерс
Технический директор и основатель SpaceCurve

Предсказание - это процесс измерения реальности и контекстуализации его вокруг модели того, как устроен мир. Построение моделей, которые пытаются приблизиться к богатству реального мира, требует не только больших данных, но и работы с данными из различных источников, которые охватывают многие аспекты реальности.


Задача, особенно для больших данных следующего поколения, заключается в том, что мы начинаем говорить о «объединении данных» или объединении множества разнообразных источников данных, таких как социальные сети, спутниковые изображения, телеметрия мобильных телефонов и датчики погоды. Эти источники никогда не были предназначены для совместной работы. Перед нами стоит задача найти первичные ключи, чтобы объединить все эти модели данных в единую унифицированную модель, которая раскрывает взаимосвязи между несвязанными элементами данных.

Пространство и время - интересные атрибуты данных и событий, потому что они представляют фундаментальный организующий принцип реальности, который ограничивает причинность. По сути, сочетание пространства и времени является первичным ключом реальности. Кроме того, большинство источников данных имеют пространство и время в качестве значимого атрибута, тем самым внося общность в ранее разрозненные наборы данных.
Это невероятно мощный механизм, с помощью которого мы можем создавать единые представления о реальности, которые мы не могли построить раньше.

Традиционно, мы бы выбрали более разрозненный подход, в котором основное внимание уделяется отдельным источникам данных, таким как социальные сети, геопространственные данные, видео и т. Д. Проблема с изолированными хранилищами для прогнозной аналитики заключается в том, что они захватывают только узкую полосу доступного контекста. , Когда вы начинаете использовать все потенциальные источники и контекст вокруг того, что происходит в любой момент времени, для построения моделей поведения, тогда использование пространственно-временных отношений становится одним из самых фундаментальных организационных принципов для прогнозной аналитики.

Если вы хотите узнать больше от Эндрю по темам больших данных, прогнозной аналитики и SpaceCurve, присоединяйтесь к нам в среду вечером, 14 мая, для участия в программе Вечернего форума. Большие данные, мелочи, прогнозная аналитика ,