Анализ документа и семантическая связность

При анализе документа поисковый движок ищет поисковые термины в важных областях документа (заголовке страницы, метаданных, тегах заголовков и в теле текста). Он также пытается автоматически измерить качество документа (при помощи анализа документа и множества прочих факторов).

Для сегодняшних поисковых движков одного анализа документа недостаточно, поэтому они также смотрят на семантическую связность.

Семантическая связность – это слова или фразы, которые обычно ассоциируются друг с другом. Поисковые движки активно создают свои собственные словари, которые помогают им определить, как связаны определенные термины или темы. Сканируя свои огромные базы данных контента, они могут применить теорию нечетких множеств и некоторые уравнения (это описано по адресу http://forums.searchenginewatch.com/showthread.php?threadid=48) для связывания терминов и начать понимать web-страницы более похожим на человеческий образом.

Профессиональному специалисту по оптимизации не обязательно применять инструменты измерения семантической связности для оптимизации web-сайтов, но для тех продвинутых специалистов, которые хотят использовать каждую возможность, измерения семантической связности могут помочь в следующих областях:

• измерение целевых ключевых фраз;

• измерение ключевых фраз для включения в страницу по определенной теме;

• измерение связей текста (на других сайтах с высоким рейтингом);

• поиск страниц, которые предоставляют релевантные ссылки по теме.

Несмотря на то, что источник этого материала имеет сугубо технический характер, специалисту по оптимизации нужно знать только принципы, чтобы получить эту ценную информацию. Важно помнить, что несмотря на то, что мир информационного поиска имеет сотни технических и часто трудных для понимания терминов, их можно разделить на группы, которые способен понять даже новичок в области оптимизации.

В табл. 2.1 объясняются некоторые часто встречающиеся типы информационного поиска.