CEEDS by Webit: Практическое применение Big Data для бизнеса

21-22 апреля 2015 года, в Софии проходит Webit CEE Digital Summit – крупнейшее европейское мероприятие в сфере высоких технологий и интернет-маркетинга.

Организация мероприятия как всегда – на высоте. В программе предусмотрены, как выступления именитых европейских специалистов, так и интерактивная деятельность — музыкальные ивенты, панельные и неформальные дискуссии с первыми лицами международных компаний. Молодые предприниматели представляют на Саммите свои стартапы, а также могут получить консультацию специалистов и заключить выгодные контракты.

Утром второго дня организаторы предусмотрительно устроили всем участникам одновременный сеанс интеллектуальной йоги, который живо привел всех в надлежащее состояние духа и облегчил последствия жаркой вечеринке, на которую все были приглашены накануне.

Программная часть второго дня началась выступлением Саму Конттинена (Samu Konttinen), исполнительного вице-президента по безопасности пользователей в компании «F-secure», посвященным вопросам свободы в современном цифровом мире.

По словам докладчика, государство не обладает всеми необходимыми технологиями и пока не способно на 100% контролировать безопасность пользователей.

Статистика показывает, что 52% пользователей испытывают беспокойство за собственную безопасность, когда выходят в интернет с публичных точек доступа. Пароли к социальным сетям – всего лишь занавески, которые защищают частную жизнь пользователей от посторонних глаз. Не надо открывать эти занавески, если не хочется выставлять себя на всеобщее обозрение, однако, все мы понимаем, что он настоящих взломщиков никакие занавески не спасут.

57% пользователей обеспокоены тем, что большое количество сервисов отслеживают их персональные данные. Когда пользователь оплачивает авиабилет онлайн, агрегаторы уже знают, какие страны он посетил, каким классом обычно путешествует, знают его паспортные данные. В зависимости от этих сведений и назначается текущая цена за билет. Проект «F-secure» позволяет шифровать трафик и делает присутствие мобильного пользователя в интернете безопасным.

F Secure Internet Security — лучшая в своем классе программа безопасности, которая защищает пользователя во время работы, при выполнении банковских операций и покупок в интернете. F Secure Internet Security автоматически защищает устройство пользователя от взлома, вредоносных программ и кражи личных данных. Программа не замедляет работу компьютера и отличается простотой в установке и использовании. Программа также оснащена функцией безопасного поиска в интернате F Secure Search, которая также анализирует результаты поиска.

Тему персональных данных продолжил и развил Димитар Цветков, главный специалист про продукту в SAP, который посвятил свое выступление Big Data и трудностях, связанных с их сбором, анализом и использованием. Сложность в обработке больших данных присутствует всегда, и любой бизнес сталкивается с этим.

Как можно посчитать овец в стаде? Нужно пересчитать их ноги, а потом поделить на 4. Так и с Big Data. Постоянно меняющиеся данные нуждаются в сегментации и упорядоченности, и трудности в их исчислении начинаются еще на уровне менеджмента.

Для работы с большими массивами данных нужно вкладывать деньги, закупать сервера и дата-центры. А менеджмент не всегда хочет вкладываться в это. Кроме того, со стороны пользователя важен положительный User Experience: для этого необходим современный дизайн, адаптация под новые типы устройств, сенсорные экраны, учет психологии нового поколения пользователей. Все это способствует сбору информации о пользователях, но создать эти технологии довольно трудно.

Новая парадигма — реалтайм. Эти данные надо собрать и разработать специальные предикторы (системы анализа, позволяющие проецировать данные на возможное поведение пользователя в будущем) для анализа дальнейшего поведения пользователя. Источники Big Data: данные, которые передаются от компьютера к компьютеру, социальные медиа, данные о пользователях, транзакционные данные, прочие неструктурированные данные.

Если со сбором и анализом больших объемов данных более менее все понятно, то совершенно непонятно, как это может в перспективе храниться, защищаться и проверяться на актуальность. Докладчик считает, что нам стоит скоро ожидать появления термина SMART Data.

Компания SAP предлагает к использованию SAP S/4 HANA — платформу нового поколения, позволяющую упростить и ускорить управление бизнесом даже в условиях турбулентной экономики. По словам докладчика, революционная технология позволяет контролировать бизнес-процессы предприятия в режиме реального времени и упростить процессы принятия решений по ключевым бизнес-задачам.

Представитель компании Microsoft Бит Швиглер (Beat Schwegler) представил доклад под названием «Истинная мощь машинного обучения и предиктивной аналитики».

По словам докладчика, каждый человек, практически каждый день сталкивается с обработкой информации алгоритмами машинного обучения. Например, Spotify, Amazon — все рекомендации этих сервисов создаются при помощи алгоритмов машинного обучения.

Предиктивная аналитика на сегодняшний день является одним из наиболее актуальных и перспективных аналитических направлений. Это, прежде всего, множество методов статистики и анализа данных, которые используются для анализа текущих и исторических данных/событий для прогноза данных/событий в будущем.

Наиболее известный способ использования прогностической аналитики – это применение скоринговых моделей для оценки платежеспособности клиента при выдаче кредитов в банке. Любая скоринговая модель строится на исторических данных, и если в прошлом, какая-либо группа клиентов была уличена в несвоевременном гашении кредитов, а новый клиент по каким-либо характеристикам схож с этой группой, то скорее всего в выдаче кредита ему откажут.

Центральной сущностью предиктивной аналитики является задача определения предиктора или нескольких предикторов (параметров или сущностей, которые влияют на прогнозируемое событие). Так, сервисы Cortana и Google Now разрабатывают свои рекомендации на основе анализа поведения пользователя и предиктивных технологий, позволяющих прогнозировать поведение пользователя.

Mashine learning — комплекс алгоритмов и систем, призванных анализировать предыдущий опыт взаимодействия. Любая учебная модель создается на основе маркирования данных, после этого на систему накладываются различные сценарии, и модель развивается в зависимости от принимаемых решений.

Кроме скоринговых моделей в предиктивной аналитике применяется также метод Data mining. Докладчик даже уверен, что предиктивная аналитика является небольшой ветвью Data mining, в основе которой лежат некоторые методы Data mining.

Методы предиктивной аналитики давно реализованы в виде классов, функций и алгоритмов. Для применения на практике таких методов можно не тратить время на программирование, а использовать готовые классы. Еще в 1854 году в Лондоне впервые создали карту, на которую наносились различные аккумулируемые данные. Однако, как тогда, так и сейчас существует проблема наличия большого количества субъективных и недостоверных данных, собранных из непроверенных источников.

Г-н Швиглер настоятельно рекомендует, прежде, чем приступать к выбору источников и площадок для сбора данных, четко понимать итоговую цель сбора и применения этих данных, а также как именно они должны улучшить уже существующие бизнес-процессы.

Рупак Верма (Roopak Verma), директор по цифровым технологиям в центральной Европе компании "Ford", представил доклад о влиянии Business Intelligence и Big Data на развитие в digital-отрасли.

Докладчик напомнил, что сбор данных дает понимание происходящих процессов, а аналитика нужна для того, чтобы понять, почему это происходит. Прогнозирование действий – это своего рода оптимизация на основе полученных данных, производимая в реальном времени.

Решения реалтайм базируются на тех данных, что собираются сегодня. Самые лучшие системы все равно пропускают до 19-20% ложных пользовательских данных. Компания Ford сейчас меняет свою модель взаимодействия рынком, из производственной компании становясь технологической. Вместо производителя автомобилей компания становится разработчиком интеллектуальных решений. Этот шаг обусловлен тем фактом, что без этого вся дальнейшая борьба с конкурирующими компаниями становится невозможной. Сегодняшнее состязание компаний между собой – это состязание технологий. «Ford» работает над добавочной функциональностью автомобилей, к примеру, при ДТП машина сможет сама посылать сигнал в сервисный центр и во все государственные службы. Ключевым преимуществом любого современного высокотехнологичного продукта является использование мобильных и интернет-технологий при минимальном участии пользователя.

Завершая свое выступление докладчик дал несколько советов маркетологам:

  • Сохраняйте и удерживаете существующих клиентов, регулярно их стимулируя и поощряя
  • Выявляйте новых клиентов при помощи различных каналов
  • Развивайте новые маркетинговые возможности, ищите новые пути, используя технологии Data mining
  • Думайте над большей отдачей от рекламы
  • Измеряйте эффект от рекламных кампаний, оценивайте ROI
  • Совершенствуйте все каналы поступления данных — как внутренние, так и внешние. Не жалейте средств на это. Именно сбор данных о ваших потенциальных клиентах позволит вам разработать идеальный продукт, а также создать эффективную стратегию продвижения этого продукта до конечного потребителя.

Журналист, новостной редактор, работает на сайте с 2009 года. Специализация: интернет-маркетинг, SEO, поисковые системы, обзоры профильных мероприятий, отраслевые новости рунета.
Языки: румынский, испанский.
Кредо: Арфы нет, возьмите бубен.