Илья Демьяненко проанализировал данные валидных ID «ВКонтакте», представив получившуюся статистику на блоге Habrahabr.ru
В этом посте я приведу статистику по данным, которые указали в своих профилях пользователи социальной сети ВКонтакте. Под катом также содержится ответ на интересующий многих вопрос — сколько всё-таки активных пользователей в этой соцсети? И, разумеется, пара слов о том, как всё это было собрано.
Предыстория
Всё началось с прочтения мной хабратопика Делаем свой сервис по мониторингу пользователей ВКонтакте. Во время сессии, как известно, делать нечего, поэтому я решил подучить C# и познакомиться с API ВКонтакте.
Процесс сбора статистики
Не все id являются действительными: некоторые пользователи были удалены, красивые номера были заблокированы. Для получения списка валидных id было решено использовать каталог, заботливо сделанный для поисковиков.
Для парсинга каталога была использована библиотека Html Agility Pack. Процесс достаточно тривиален, подробно описывать его не вижу смысла.
Список валидных id по состоянию на 18 июня 2011 года содержит 94 072 230 id из 139 132 951 возможных, то есть действительными являются 67,6%.
Распределение валидных id (сколько действительных из каждого миллиона)Читать далее на habrahabr.ru