Кельвин Ньюман на SearchLove 2014: Модель «чёрного ящика» и будущее поиска

1

27-28 октября в Лондоне прошла двухдневная конференция SearchLove 2014. Во время этого мероприятия были рассмотрены вопросы поискового продвижения, внутренней аналитики и оптимизации сайтов, разработки стратегий ссылочного продвижения и маркетинговых кампаний.

В рамках программной части конференции выступил Кельвин Ньюман (Kelvin Newman), основатель и управляющий директор Rough Agenda, с докладом на тему: «Модель «чёрного ящика» и будущее поиска» («What the Flash Crash & Black Boxes can Teach us about the Future of Search»).

IMG_4481.JPG

Понимание покупателей и заказчиков всегда очень трудный процесс, но ещё труднее – понять Google.

В результате возникает эффект Даннинга — Крюгера – когнитивное искажение, которое заключается в том, что люди, имеющие низкий уровень квалификации, оценивают свои знания значительно выше, чем они есть на самом деле, делают ошибочные выводы и принимают неудачные решения. При этом они неспособны осознавать свои ошибки в силу низкого уровня квалификации. С другой стороны, люди с высоким уровнем знаний и понимания предмета склонны недооценивать свою компетентность, в связи с ошибочными утверждениями некомпетентных людей.

На самом деле всё ещё сложнее, отметил докладчик: «Я понял, что вещи, которые я раньше считал правильными, больше таковыми не являются. То, что, как я говорил, работает – больше не работает».

В целом, он пришёл к осознанию того, что не понимает Google в той степени, в которой он считал раньше. В своём докладе Кельвин Ньюман попытался изменить представление слушателей о работе поисковых систем. Сегодня SEO-специалисты вынуждены постоянно анализировать собственные знания и навыки, обмениваться мнениями с коллегами и проверять свои гипотезы на практике, считает докладчик.

Переходя к основной части своего выступления, Кельвин Ньюман достал чёрный ящик и сообщил слушателям, что в презентации будет использовано 3 поучительных истории, на основании которых будет предпринята попытка предсказать будущее поиска. Как известно, принцип функционирования поисковых алгоритмов очень сложен и зачастую не поддается анализу и описанию. Чтобы лучше представлять себе работу поисковых систем, имеет смысл обратиться к модели «черного ящика». Она описывает структуру с известными выходными и входными параметрами и неизвестным внутренним устройством. Изучая при помощи такой модели известные параметры, можно получить представление о внутреннем устройстве сложной системы.

Три истории  три урока

История № 1: Машины и системы становятся самообучаемыми

Эта история произошла в Университете Сассекса в 1996 году. Профессор факультета информатики Адриан Томпсон (Adrian Thompson) задался вопросом: «Может ли электронная схема «эволюционировать» в процессе решения конкретной задачи?».

what-the-flash-crash-black-boxes-can-teach-us-about-the-search-searchlove-kelvinnewman-37-638.jpg

Он инициировал эксперимент, в котором концепция Чарльза Дарвина – «Выживает сильнейший» была применена к электронным схемам.

Дарвин говорил, что наиболее приспособленные выживают за счёт своих конкурентов, потому что они успешно адаптируются к окружающей среде.

Схема решала конкретную задачу, используя 37 логических цепочек. 5 логических ячеек были подключены таким образом, что они не могли влиять на то, как работает вся схема. Но когда исследователи удаляли их, схема прекращала работу.

Когда машины становятся самообучаемыми, они решают задачи такими способами, которые человек не может понять. Аналогичным образом практически невозможно становится воспроизвести такую технологию.

В настоящее время, чтобы выжить и развиваться, важно успешно анализировать огромные массивы данных. Схемы призваны решить проблему их систематизации. В результате развития технологий «deep learning», поисковые машины стали самообучаемыми системами, а люди начали больше задумываться над тем, как работать с данными.

История № 2: Любая система слишком сложна для понимания

Эта история связана с Майком МакКарти (Mike McCarthy), бывшим маркетологом ипотечной компании.

what-the-flash-crash-black-boxes-can-teach-us-about-the-search-searchlove-kelvinnewman-52-638.jpg

Он хотел продать акции P&G, которые достались ему в наследство, но произошло резкое падение индекса Dow Jones: акции, которые должны были стоить около $45 тысяч, продавались за $28 тысяч.

what-the-flash-crash-black-boxes-can-teach-us-about-the-search-searchlove-kelvinnewman-55-638.jpg

Перед падением каждая акция продавалась по цене $60. Спустя некоторое время после падения, цена вернулась к прежним цифрам.

Индекс упал на тысячу пунктов, что составило 9%. 20 минут спустя он вернул 600 пунктов.

Тенденция быстро распространилась на всю отрасль. Это было наибольшее однодневное падение индекса Dow Jones за последние 118 лет его существования.

30 крупнейших американских компаний в один момент потеряли 9% стоимости.

what-the-flash-crash-black-boxes-can-teach-us-about-the-search-searchlove-kelvinnewman-62-638.jpg

Почему это произошло?

Аналитики предлагали несколько теорий, объясняющих это событие. Но вполне возможно, что ни одна из них не была реальной причиной падения индекса. Любая система слишком сложна для понимания.

Применительно к поисковым системам, позиции сайта в выдаче зависят от совокупности различных факторов, и невозможно никоим образом влиять на эти изменения.

История № 3: Результат функционирования сложных и хаотичных систем невозможно спрогнозировать

Эта история связана с профессором математики Техасского университета в Остине Яном Малкольмом (Ian Malсolm). Математик, специализирующийся в области «теории хаоса», участвовал в создании романа и фильма «Парк Юрского периода» Джона Хэммонда (John Parker Hammond).

what-the-flash-crash-black-boxes-can-teach-us-about-the-search-searchlove-kelvinnewman-70-638.jpg

По мнению Кельвина Ньюмана, произведение «Парк Юрского периода» отлично объясняет теорию хаоса – не только прошлое определяет будущее, всегда имеет место случайность.

Физика хорошо объясняет конкретные виды поведения, тем не менее: «Даже если вы всё знаете о погоде, понимаете от каких природных явлений и закономерностей она зависит, вы, всё же, не можете её предсказывать со 100% достоверностью».

Системы бывают: простыми, сложными, комплексными. Все сайты, их страницы и ссылки на сайте – сложные системы.

Пока даже самые выдающиеся учёные в мире не могут предоставить точный прогноз результатов работы сложных и хаотичных систем.

Как эти истории относятся к поиску?

Никто, даже сотрудники Google, точно не знают, как на самом деле работает поиск. Google – яркий пример сложной и хаотичной системы. Google также является компанией, развивающей технологии машинного обучения (deep learning).

Все истории, представленные выше, имеют непосредственное отношение к Google, описывая особенности работы его поисковой системы.

Когда лидер поиска запускает очередное обновление своего алгоритма – нет возможности точно спрогнозировать, какие конкретно изменения произойдут в поисковой выдаче.

«Раньше я думал, что поисковые алгоритмы работают по принципу механических часов. Теперь я считаю, что их логичнее сравнивать с природными явлениями – никогда нельзя предугадать на 100%, какой будет погода, и когда случится шторм», — отметил Кельвин Ньюман.