Инженер Facebook рассказал о работе поиска по постам

Инженер команды поиска Facebook Ашот Тевосян (Ashoat Tevosyan) рассказал о работе новой функции Facebook Graph Search – поиска по постам, чекинам, комментариям и статусам. По словам Тевосяна, работа над функцией длилась в течение двух лет и потребовала разработки каталога для 1 миллиарда новых постов, публикуемых на страницах соцсети ежедневно. На данный момент в индексе системы находится более 1 триллиона постов, которые занимают сотни терабайт.

Концепция, которая лежит в основе поиска, является продуктом одного из совместных внутренних проектов, разработанных для поиска старых постов друзей. Для поиска нужного контента Facebook анализирует более 70 различных характеристик, специфичных для разных типов публикаций. Индекс поиска построен при помощи HBase кластера, Hadoop jobs и Unicorn – поисковой инфраструктуры Facebook. Для обновления индекса используется отдельная программа - Wormhole.

Трудность, с которой столкнулись инженеры Facebook – обработка поискового запроса. Так как база индекса занимает 700 терабайт RAM, компании было необходимо найти наиболее эффективный способ обработки запросов, который бы не перегружал сервер. База была перенесена на твердотельные flash-накопители, а в RAM остались только наиболее часто запрашиваемые данные в структурированном виде.

Для вывода в результаты наиболее полезного контента, Facebook использует переколдовку запроса и динамическое ранжирование результатов, что значительно повышает эффективность работы алгоритма, однако на данный момент алгоритм далек от совершенства, в связи с чем команда «продолжит работу над совершенствованием модели и сбор обратной связи от пользователей».

По материалам https://www.facebook.com/notes/facebook-engineering/under-the-hood-building-posts-search/10151755593228920

Mozilla представит свой геолокационный сервис

Mozilla разрабатывает свой собственный геолокационный сервис с использованием данных вышек сотовой связи и Wi-Fi сигналов

Консультант Distilled о том, как изменится поиск Google к 2020 году

Сегодня в блоге Moz появилось весьма интересное сообщение, опубликованное опытным вебмастером и консультантом Distilled Джейкобом Клейном (Jacob Klein

Новая инфраструктура поиска Google сократила задержки обработки запросов на 20%

Исследователи USC в ходе оценки быстродействия обработки поисковых запросов Google выявили значительные изменения поисковой архитектуры, которые были выполнены в течение...

Maps Engine Pro – новая возможность представления малого бизнеса на Google Картах

Google Карты представили новую возможность для малого бизнеса визуализировать данные о своем местоположении...

Как Яндекс умно смешивает разные виды ответов

Яндекс рассказал о своей технологии под названием Блендер, которая обеспечивает ранжирование и встраивание блоков с вертикальными поисками в страницу поисковой выдачи Яндекса

На Яндекс.Картах появились 17 000 новых снимков домов в городах Беларуси

Команда Яндекс.Карт сообщила об обновлении более 20 тысяч фотографий домов в Минске, а также о загрузке 17 000 новых снимков домов в Витебске, Гродно, Гомеле, Могилеве, Бресте