Алгоритм автоматической оценки контента сайта
Для систематизации колоссального объёма информации,
опубликованной в киберпространстве, применяется довольно изящная (с точки зрения
тупого алгоритма роботов поисковых машин) технология
веб-дизайна, которая называется методикой автоматического определения тематики
сайта. Именно её принципы являются основой функционирования спайдеров, чей
программный комплекс подчинён своим собственным законам, которые именуются
правилами оценки контента и характерны лишь для конкретной поисковой системы.
Для серверных модулей обработки поступающей информации, не составляет совершенно
никакого труда подбить итоги статистики, то бишь подсчитать количество повторов
ключевых сочетаний в тексте. Казалось бы, что мешает автору наполнить статью
таким количеством элементов семантического ядра, чтобы
«переплюнуть» сайт-конкурент и оказаться на верхушке поисковой выдачи по данному
запросу? Однако такие ухищрения оптимизации у псевдо умельца не прокатят, ибо не
всё так просто с автоматической оценкой контента: хоть она и «дубовая», но на
мякине её не проведёшь.
На какие только выкрутасы не пускаются веб-комбинаторы, пытаясь обмануть
алгоритмы роботов поисковых машин! И с каждым годом количество таковых «обманок»
продолжает расти. А система, в ответ на уловки талантливых веб-мошенников,
отвечает вполне адекватно, всё более усложняя свои принципы и максимально полно
засекречивая формулы, на основании которых строится функционал поисковых ботов
(вот потому-то и прилепилась к ним кличка Float).
К слову, именно по этой методике производят (генерируют) дорвеи. Берём нужное
слово, и с максимальной плотностью ключей заполняем им все страницы сайта
(иногда бывает достаточно всего одной страницы): в итоге, мы имеем вполне
успешно индексируемый контент, частенько представляющий собою полный бредотекст.
Но дорвей, буквально напичканный ключевыми сочетаниями, способен на короткое
время прорваться на вершину поисковой выдачи, тем самым выполнив своё
предназначение (пока там робот поисковой машины раскачается...). Для того, чтобы
отслеживать подобную Интернет макулатуру, поисковики используют специфичные
технологии веб-дизайна, именуемые «алгоритмы оценки контента», а поскольку
функционирование таковых запрограммировано, то и называются они автоматическими.
Работа пауков организована с точной иерархической последовательностью, т. е.
имеет многоуровневую систему оценочных факторов. Изначально, поисковой системой
оценивается уникальность (оригинальность) контента, затем
вычисляется общий его объём и определяется количество ключевых сочетаний.
Причём, вычисляя количество ключей, поисковый бот тщательно проверяет условия их
размещения на каждой веб-странице и делает перерасчёт, учитывая разные ключевые
сочетания, определяя при этом значимость (вес) каждого файла сайта. И как
следствие, значимость исходящей ссылки, которая ведёт с этой страницы на другой
веб-ресурс.
При этом, автоматическая оценка контента придаёт значение и другим оценочным
факторам, как-то: орфографической грамотности, правильному построению
фразеологических оборотов, уникальному содержанию, разбиению на смысловые абзацы
и т. д. Алгоритм float имеет множество критериев для определения значимости
(траста) того или иного сайта в Интернете: его правила глубоко засекречены, но
общие схемы функционирования достаточно прозрачны.
Рекомендации администраторов поисковых систем
Кроме того, администраторы
поисковых систем настоятельно рекомендуют те или другие приёмы подготовки
содержания, способы обработки данных и т. д., а все эти рекомендации чётко и
ясно представлены на тех страницах поисковых систем, которые адресованы
владельцам сайтов или их уполномоченным представителям.
Автоматическая оценка контента у разных поисковиков
Но дело в том, что у разных поисковых систем — разные алгоритмы
автоматической оценки контента, в частности, различается подход к определению
оптимальной плотности ключей. Если любимый Гугл вполне лояльно относится к
показателю текста один к тридцати, то Яндекс за такое неумеренное (по его
мнению) употребление насыщенности применяет штрафные санкции, причисляя
контекстную «переоптимизацию» сайта к методам искусственного ранжирования, что
ведёт к непредсказуемым последствиям некорректного применения технологий
веб-дизайна.
Статья: |
Алгоритм автоматической оценки контента сайта |
Опорные темы: |
Технологии веб-дизайна и терминология Интернета |
|
|