Универсальная Схема Эволюции и прогноз развития Поисковой Машины

Автор статьи: Алексей Захаров

Аннотация
Важнейшим инструментом работы с информацией в Интернете являются поисковые машины (ПМ). Сегодняшний уровень развития ПМ не позволяет в полной мере использовать накопленный информационный потенциал Интернета. В качестве направления развития ПМ предлагается дополнить технологию работы ПМ подходом «Универсальная Схема Эволюции», что позволит:

  • Полнее и логичнее описывать эволюции любого объекта
  • Объективизировать поиск информации и создание контента (информации)
  • Более отчетливо показать единство мира и единство его законов развития

По сути, подход «Поисковая машина + УСЭ-USESoft» может дать новое качество поиску в Интернете.

Ключевые слова: поисковая машина, Интернет, ранжирование, недостаток, описание, эволюция, метка, скрытые связи, законы развития, Универсальная Схема Эволюции (УСЭ).

Роль поисковой машины (ПМ) при работе в Интернете

Знакомство с Интернетом, как правило, начинается с поисковой машины. Без неё, как говориться, никуда…

Поиск информации – это процесс выявления во множестве документов таких, которые посвящены указанной теме, удовлетворяют заранее определенному условию поиска (запросу) в виде информации (факты, сведения, данные). О важности именно поиска информации говорит хотя бы такой факт: в 1957 г. Д.Ликлайдер1 проанализировал свой рабочий день — сколько времени уходит на принятие решений, а сколько на сбор и обработку материалов. Оказалось, что 85% времени тратилось на сбор, сортировку и анализ информации, на расчеты и построение графиков. И только после того, как информация была собрана и материалы подготовлены, он был способен принять более или менее правильное решение. Поэтому улучшение работы поисковых систем — одна из приоритетных задач сегодняшнего Интернета.

Функционирование ПМ

Работу большинства поисковых систем можно описать четырьмя этапами:

  • поисковая система собирает и индексирует информацию, занося её в базу данных,
  • поисковая система, с учетом морфологии, разрезает слова на составляющие.

Когда пользователь обращается к машине с запросом — набором поисковых (ключевых) слов — запускаются третий и четвертый этапы:

  • поисковая система выбирает из базы все документы, содержащие набор поисковых слов, а потом
  • выводит документы в зависимости от того, какая страница имеет больший поисковый ранг, точность вхождения набора поисковых слов, дату обновления и т.д.

Такая выборка, на основе многих параметров, называется ранжированием результатов поиска. Именно механизмы ранжирования отличают поисковые системы одну от другой. Сейчас каждая поисковая система старается предложить свои механизмы ранжирования документов, чтобы занять лидирующее положение на поисковом рынке2.

Проблемы современных ПМ

Вероятно, не ошибусь, если предположу, что значительной части пользователей Интернета интересна история (изменение во времени, эволюция) вещей, с которыми им приходиться работать или сталкиваться в жизни. Это предположение согласуется с тем, что статьи в энциклопедиях обычно начинаются именно с описания истории объекта, а в монографиях исторический обзор – стандартный раздел. Вообще-то это неудивительно: «Эволюция – основное условие, которому должны отныне подчиняться и удовлетворять все теории, гипотезы, системы, если они хотят быть разумными и истинными. Свет, озаряющий все факты, кривая, в которой должны сомкнуться все линии, – вот что такое эволюция».3
Отражена история вещей и в сетевых энциклопедиях – статьи в Википедии, как правило, содержат раздел «История» или подобный4:

И при запросе в Интернете информации о каком-либо об объекте в список выдаваемых ссылок обязательно попадают относящиеся к истории эволюции):


А если сделать запрос именно «история паровоза», то будет выдан список ссылок, причем, специально отмечу, никоим образом не упорядоченных – ни хронологически, ни по формату описания самих фактов. Например, вот как история паровоза приведена в Википедии:

Прошу обратить внимание: единственный отмеченный процесс (явление, характеристика) истории паровоза по версии Википедии – усложнение конструкции. Конечно, излишне требовать академической полноты от справочного издания – по истории паровоза написаны тома и библиотеки, но именно справочные издания, с которых обычно начинается знакомство с предметом, могли бы задать шаблон описания. Они могли бы использовать такой шаблон в краткой форме, а упомянутые научные – наполнить шаблон фактами максимально полно.

Направление развития ПМ

С точки зрения разработчиков
О чем думают разработчики? Вот выдержка из интервью Дугласа Мерилла5:
«… хочется сделать поисковый движок, который давал бы возможность:

  • создавать свой контент,
  • расставлять метки (tagging)6 для всей существующей информации на всех языках мира, и
  • подключить к этому автоматические алгоритмы, умеющие находить скрытые связи между разными вещами.

В общем, хочется сделать смесь из UGC7, классификации и расстановки меток силами сообщества и искусственного интеллекта, который бы позволил людям работать эффективнее».

С точки зрения УСЭ
Шаблоном представления эволюции могли бы быть известные из ТРИЗ и использующиеся в практике изобретательства законы развития. Точнее, и сами законы, и их структура в виде Универсальной Схемы Эволюции (УСЭ) и компьютерной программы USESoft, сделанной на основе УСЭ.8

Отмеченные Д.Мериллом направления создания «движка» удивительным образом соответствуют возможностям УСЭ-USESoft подхода:

  • поисковая машина + УСЭ-USESoft будет создавать содержание (информацию об объекте) по запросу пользователя;
  • для описанных в Интернете объектов (для информации о них) с помощью УСЭ будут созданы метки (tags) – это будут характеристики этапов на схеме эволюции;
  • в УСЭ скрытые связи (структура законов) содержатся еще до запроса. Во время обработки запроса схема (блоки + связи) будет наполнена информацией о конкретном объекте и представлена пользователю.

По сути, УСЭ будет дополнением стандартной поисковой машины, т.е. шаблоном, по которому выбранная информация об объекте (вспомним 3-й этап работы ПМ) будет переработана и представлена в виде эволюции объекта. Интернет-страницы с таким описанием эволюции до начала поиска не будет — это будет сборка, которая возникнет «налету» по запросу пользователя.
Вот как может (будет?) происходить поиск в недалеком будущем… Открываем поисковик Google, в котором есть кнопка Evolution of Object и даем задание: «Эй, расскажи-ка мне про эволюцию, э-э-э-э, паровоза». Вносим имя объекта в поисковую строку и кликаем…

1. Google обращается к зашитой в него Универсальной Схеме Эволюции.
2. Google в скрытой от пользователя форме подставляет название системы «паровоз» в Универсальную Схему Эволюции и получает из схемы описание и характеристики всех блоков эволюции — от 1-го до 13-го.
3. Google из описания и характеристик 1-го блока «Низкая жизнеспособность паровоза» конструирует tags (метки): «паровоз, низкая жизнеспособность, недостатки, вытеснение, конкуренция… »9, которые сам тут же использует для нового поиска. Интернет-страницы, найденные в результате этого последнего поиска, ранжируются и сохраняются в Базе данных.
4. Google из описания и характеристик 2-го блока «Низкая идеальность паровоза» конструирует метки: «паровоз, низкая идеальность, неэффективность, недостатки, проблемы, вредная функция…». Найденные Интернет-страницы ранжируются и сохраняются…
5. Google из описания и характеристик 3-го блока «Создание паровоза» конструирует метки: «паровоз, создание». Найденные Интернет-страницы ранжируются и сохраняются…
6. Google из описания и характеристик 5-го блока «Объединение паровозов» конструирует метки: «паровоз, объединение». Найденные Интернет-страницы ранжируются и сохраняются…

Обработка Google’ом блоков 4 «Развитие существующего паровоза», 6 и 7 «Выявление недостатков паровоза», 8 «Изменение компонентов (элементов и связей) паровоза» и т.д. не описана – всё происходит аналогично.

Google, после прохода по всем блокам УСЭ и накопления информации по всему циклу, из созданной Базы данных выдаст Пользователю информацию об эволюции паровоза согласно следованию блоков:

Понятно, что теперь в истории (эволюции) паровоза будет указано не только усложнение конструкции… 🙂

Вот, например, какие факты об эволюции паровоза сошлись10 в картотеке, а в будущем, надеюсь, сойдутся и в результатах поиска в Интернете:

«… Для примера, берем железную дорогу между Rueil и Marly-le-Roi в окрестностях Парижа. Локомотив представляет паровой котел, но без топки. На станциях воду котла нагревают струей перегретого пара до 200о и количество воды рассчитано так, чтобы вода, выделяя пар во время работы, не охлаждалась ниже 150о, а на следующей станции воду снова подогревают до 200о. Выходит, как будто из простого локомотива вынули топку и оставили на станции. Выгода очевидная: на локомотиве нужен только один человек, нет дыма в пути и проч.».11

114312 Ресурсы надсистемы
3256-1 Раздается резкое шипение, и вверх бьют белые струи. Это заводские установки сбрасывают излишки пара. Понятно, что в воздух уходит не только перегретая вода, но и тепловая энергия.

О том, как использовать эту энергию, задумались инженеры транспортного предприятия «Хельмут Шольц» в г. Майнинген (ГДР). Заручившись поддержкой палаты техники, они сконструировали и построили маневровый паровоз без топки.

Главный его узел – стальная оболочка для накопления стравливаемого пара. На такой дешевой энергии при средней скорости 30 км/ч новый паровоз может трудиться целую смену – 8 ч на одной зарядке. Поэтому на очереди создание еще нескольких подобных локомотивов, работающих на практически бесплатном паре.

Не в воздух, а в котел. «Техника и наука» №1/86
Ресурсы надсистемы

Достоинства предлагаемого подхода
1. Полнота и логичность описания эволюции любого объекта – это следует из универсальности подхода УСЭ-USESoft.
2. Объективизация поиска и создания контента (информации) — при поиске с помощью «Поисковая машина + УСЭ-USESoft» реализуется вытеснение:

  • Пользователя информации (контента)

Очевидно, что круг и уровень знаний, опыт, профессионализм
Пользователя влияют на задание поискового образа, и, тем самым, на результат поиска.
Использование системы «Поисковая машина + УСЭ-USESoft» позволит снизить влияние отмеченных субъективных факторов.

  • Создателя контента

В настоящее время придумывание и расстановка тэгов возложена на создателя контента, т.е. на авторов. И авторы придумывают, как умеют. А поисковик потом по этим разномастным тэгам собирает информацию по запросу… Качество такого поиска, понятно, ниже, чем если бы тэги генерировались автоматически на основе представления эволюции в виде некоторого шаблона.
3. Подход УСЭ-USESoft реально помогает Пользователю увидеть важное направление эволюции в виде перехода к надсисистеме (к объединению систем). Опыт показывает, что психологически очень непросто осознать необходимость объединения и увидеть вторую систему для объединения с исходной.13
Или более широко — выявление структуры типа УСЭ-USESoft, реально описывающей свойства и отношения объектов мира, помогает увидеть «информационные дыры» в существующем знании, что, в свою очередь, облегчает либо направленно вести поиск информации (поисковые машины), либо создавать новую информацию (наука, открытия).
4. Пользователь через единообразное представление эволюции самых разных объектов приучается видеть единство мира и единство средств его описания — законов. Это знание приходит не в декларативной форме, поскольку «… мало ли, что в книжке можно написать…», а через свои — постоянно и повсеместно реально изучаемые объекты.

Заключение
По сути, подход «Поисковая машина + УСЭ-USESoft» может дать новое качество поиску в Интернете. Как было отмечено ранее14: «Диалог с программой USESoft выглядит как беседа с системой ИИ». А именно ИИ был отмечен Д.Мериллом в качестве характеристики поисковой машины будущего.

Сентябрь 2008 г.
Брайтон, Массачусеттс, США

_____________________________
Сноски:

1Д.Ликлайдер (John Licklider, директор Бюро методов обработки информации в ARPA) подробно описал идею глобальной сетевой инфраструктуры, предсказал применение графики в компьютерных технологиях, появление цифровых библиотек, электронного бизнеса и многих других важнейших элементов будущей информационной индустрии. Основоположники сети Интернет http://licey.akbylak.ru/rab/infor/1.doc

2История поисковых систем http://www.artpix.ru/about/articles/search_history

3Тейяр де Шарден. Феномен человека http://www.psylib.org.ua/books/shard01/txt09.htm

4Паровоз в Википедии. Steam locomotive http://en.wikipedia.org/wiki/Steam_locomotive; Русский

5Douglas Merrill, вице-президент Google по технологиям http://www.computerra.ru/magazine/337626

6Сейчас информация, которую кто-то размещает в Интернете, снабжается т.н. тэгами (tags = метки), которые распознаются поисковыми машинами. Это помогает искать не только по ключевым словам, но и по темам (машина “понимает” тему поиска через тэги) — результат поиска лучше. Но тэги создает сам создатель контента, что весьма субъективный процесс.

7User Generated Content = Содержание, создаваемое пользователем

8 А.Захаров. Универсальная Схема Эволюции. http://triz-evolution.narod.ru/USE_TRIZ_Developers.pdf

9 Не претендую здесь и далее на полноту списка приведенных характеристик и их точность. Требуется дополнительное исследование.

10 Я говорю – сошлись, т.к. факты попали в картотеку в разное время и совершенно независимо. Как это видно из публикаций, точка эволюции «заправка паровоза паром от внешнего источника» найдена в разных странах и в разное время: Франция (конец XIX века), СССР (40-е гг. ХХ века), ГДР (80-е гг.).

11 Энгельмейер П.К. Экономическое значение современной техники. Точка зрения для оценки успехов техники. М., 1887, с. 32.

12 Так выглядит «древняя» карточка. Таких около 2,5 тысяч.
История создания картотеки: http://www.metodolog.ru/00528/00528.html и её сегодняшнее состояние: http://triz-evolution.narod.ru/Cards_80919.pdf

13 Герасимов В.М., Кожевникова Л.А. Альтернативный подход к постановке задач. Саммит разработчиков ТРИЗ “Развитие инструментов анализа технических систем для постановки задач”, Москва, 2007 г. http://www.triz-summit.ru/ru/section.php?docId=3713

14 А.Захаров. Мое понимание ТРИЗ http://www.metodolog.ru/01303/01303.html

Основатель Searchengines.ru. С 2005 по 2014 год работал генеральным директором компании "Яндекс.Украина". Основатель и директор крупнейшего коворкинга Одессы — "Терминал 42". Ведет блог, участвует в подкастах. Больше ничего не умеет.