Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Ранжирование результата поиска




 

При поиске для каждого найденного документа Яндекс вычисляет величину релевантности (соответствия) содержания этого документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания релевантности. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Пользователь может повлиять на порядок сортировки, используя операторы веса и уточнения запроса.

Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, содержащих "взвешенное" выражение.

Синтаксис: слово: число или (поисковое_выражение): число

По запросу 'поисковые механизмы:5' будут найдены те же документы, что и по запросу 'поисковые механизмы'. Разница состоит в том, что наверху списка найденного окажутся документы, где чаще встречается именно слово 'механизмы'. Запрос 'поисковые (механизмы | машины | аппараты):5' равнозначен запросу 'поисковые (механизмы:5 | машины: 5 | аппараты:5)'.

Задание уточняющего слова или выражения применяется для того, чтобы увеличить релеватность документов, содержащих уточняющее выражение.

Синтаксис: <- слово или <- (уточняющее_выражение)

По запросу 'компьютер <- телефон' будут найдены все документы, содержащие слово 'компьютер', при этом первыми будут выданы документы, содержащие слово 'телефон'. Если ни в одном документе со словом 'компьютер' нет слова 'телефон', результат запроса будет эквивалентен запросу 'компьютер'.

Правила формулирования запросов в других поисковых системах во многом повторяют приведенные выше, хотя и имеют некоторые отличия, как по форме, так и по возможностям.

Каталоги - это базы данных, хранящие описания web-страниц и ключевые слова, используемые для их поиска. Каталоги имеют обычно тематическую разбивку на подкаталоги. Регистрация в каталогах производится модераторами данной системы. Поскольку модератор - это человек, а не программа, размещение в каталогах позволяет более точно классифицировать web-страницы по тематике и, следовательно, релевантность результатов поиска выше по сравнению с поисковыми системами. Некоторые поисковые системы имеют при себе каталог (Excite, Infoseek); в этом случае индексы отбираются программой, а пополнение каталога производится модератором. Поиск в каталогах осуществляется двумя способами:

- пользователь перемещается в поисках нужной информации по иерархической системе подкаталогов;

- используется внутренняя поисковая система, которая производит поиск по краткому описанию и ключевым словам, которые составляются разработчиком сайта, но могут быть откорректированы или изменены модератором.

В последние годы развитие Интернет привело к появлению порталов. Портал представляет собой сайт, организованный как системное многоуровневое объединение различных ресурсов и сервисов. Портал обычно является некоторой отправной точкой для своих пользователей: войдя на сайт портала пользователь выбирает необходимые сервисы и разделы информации, с которыми предполагает работать.

Наиболее активно порталы начали развиваться в 1998 году. Лучшим зарубежным порталом в 1998 году признавался сайт Excite. Разделы "Новости", "Спорт", "Финансы", "Гороскоп", "Покупки" предлагают возможность редактирования и выбора из обширного списка конкретных подразделов. Возможности индивидуальной настройки хорошо проработаны в Yahoo! (My Yahoo!). На другом известном портале Netscape реализована еще одна полезная идея - если пользователя интересует деловая информация, он работает с бизнес-ресурсами портала, если настроен на отдых - с развлекательными.

Показательным примером российского информационного портала является сайт INFOART.RU компании "IT InfoArt Stars". Посетители сайта получают разностороннюю информацию (информацию по таким разделам, как "Общество", "Бизнес", "Компьютеры", "Техника", "Культура", "Медицина", "Отдых", различные справочные, обзорные и литературные материалы, телепрограмму, сводки погоды, курсы валют, анекдоты и др.), а также разнообразные сервисы: бесплатная Web-почта, чат, форумы, клиентская программа доставки новостей выбранной тематики, служба почтовой рассылки, средства персонализации, поиска, лотереи, аукционы, открытки, личные электронные визитные карточки, комплекс сервисов и служб для владельцев сайтов и многое другое. Данный портал стабильно входит в пятерку лидеров российской сети Интернет.

Важной задачей портала является не только привлечение, но и удержание посетителей. С этой целью порталы предлагают посетителям информацию, отвечающую самым разноплановым интересам, и привлекательные виды и варианты сервиса. Это позволяет порталам получать доходы от платных услуг и рекламных кампаний.

По оценкам консалтинговой компании McKinsey увеличение «индекса привлечения» пользователей (attraction index) на 10% приводит к увеличению стоимости компании на 1-3%, а такое же увеличение «индекса удержания» пользователей (retention index), повышает стоимость компании на 10-15%. Успех Интернет-бизнеса определяется следующими тремя основными элементами:

· привлечение нового пользователя на сайт;

· превращение посетителя в клиента, которое достигается, если сайт настолько интересен пользователю, что он проводит там значительное количество времени;

· создание у посетителя мотивации после ухода с сайта вернуться туда

Исследования показывают, что корреляция между количеством новых посетителей сайта компании и ее стоимостью, прибыльностью и доходами очень невелика. Причиной этого является то, что в настоящее время по сведениям компании McKinsey онлайновые компании обычно тратят 97% своего маркетингового бюджета на привлечение новых посетителей и всего 3% на то, чтобы их удержать. Наибольший эффект на стоимость компании оказывает фактор возврата на сайт, характеризующий то, насколько хорошо компания удерживает пользователя, насколько качественные услуги она предоставляет, чтобы пользователи снова и снова возвращались на сайт. Удержанию пользователей способствует, в частности, развитие средств персонализации, предоставление пользователям необходимого для них сервиса. Большое количество времени, проведенного посетителем на сайте, приносит компании доходы от рекламы, а также от продажи товаров, если сайт включает электронные магазины.

Выделяют вертикальные и горизонтальные порталы. Вертикальные порталы посвящены конкретной тематике и предоставляют различные сервисы в ее рамках. Горизонтальные порталы, или порталы общего характера предлагают набор сервисов, обслуживающих различные темы. Вертикальный портал - это сайт, связанный с отраслью или конкретной проблемой: например, портал для садоводов или портал для инвесторов. Вертикальные порталы, в отличие от горизонтальных, являются более ограниченными по содержанию и посвящены, как правило, торговым отношениям предприятий в какой-либо одной отрасли промышленности или сфере услуг. Многие аналитики предсказывают, что в ближайшие пять лет именно сайты этого типа станут основными двигателями электронной коммерции во всем мире. Существуют также порталы смешанного типа (такие как Amazon.com), которые сочетают в себе сервисы, обеспечивающие функционирование электронной торговли, и классические справочные сервисы.

Рекомендации по выбору поисковой машины. При поиске в Интернет определяющими характеристиками являются полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Именно это и предполагает достижение релевантности результатов. Возможность достижения релевантности можно оценить рядом косвенных характеристик поисковой системы.

Охват и глубина. Под охватом понимают объем базы поисковой машины,
который измеряется тремя показателями общим объемом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Под глубиной понимается существование ограничения на количество страниц или на глубину вложенности директорий на одном сервере. Оценить эти показатели возможно несколькими способами. Например, можно использовать статистику робота, которую хранят на своем сайте некоторые машины. Можно провести собственные тесты. Для этого надо задать несколько поисковых запросов, состоящих из одного слова (чтобы исключить влияние языка запросов, в том числе - различного трактования пробела), и при этом смотреть на статистику результатов, выдаваемую машиной, обычно в начале списка указано, сколько всего было найдено документов. Слова должны быть из разных областей, а также разные по частоте использования в языке: редкие, средние и часто употребляемые. По результатам тестов сравнивают количество найденного. Часто употребляемые слова, в частности, тестируют полнотекстовость (индексацию всех слов документа) поисковой машины. Глубину хождения робота проверить сложнее для этого надо взять какие-то сайты, например, с разветвленной структурой архивов, и проверить, проиндексированы ли документы, на которые можно попасть только, например, за 6 переходов по ссылкам.

Скорость обхода и актуальность ссылок. Скорость обхода Сети показывает, насколько быстро происходит индексация нового ресурса и насколько быстро обновляется информация в базе. Важным показателем качества поисковой машины (ее робота) является не только "захват" новых территорий, но и отслеживание состояния уже охваченных. Серверы исчезают и появляются, страницы на них обновляются. Ссылки, которые выдает поисковая машина в списке найденного, должны, во-первых, существовать, и. во-вторых, их содержание должно соответствовать запросу. В достаточной степени достоверную информацию по этой характеристике можно получить, проанализировав журнал (log) серверов - робот поисковой машины представляется обычно именем своей машины (или похожим образом), поэтому можно увидеть, как часто он бывает на сервере, сколько страниц просматривает и т.д. Так как для изучения бывает доступен лог только своего сайта, можно использовать экспериментальный способ. Для этого необходимо создать где-нибудь страничку текста, добавить ее в поисковики и посмотреть, как быстро она начнет находиться. Или изменить уже имеющуюся страничку. Для определения актуальности ссылок можно проверить документы хотя бы на первой странице списка, найденного по нескольким запросам. Сообщение "Not Found" свидетельствует о том, что документ не существует.

Качество поиска представляет собой субъективный показатель, так как каждая поисковая машина имеет свой алгоритм сортировки результатов поиска. Чем ближе к началу списка оказывается нужный документ, тем лучше показатели релевантности поиска с точки зрения определенного пользователя. Проверить работу поисковой системы по этому показателю можно только путем эксперимента, при этом тестовые запросы должны быть разной длины. Можно также провести тестирование с использованием расширенного языка запросов.

Пользовательские характеристики поисковых систем отражают удобство работы пользователей. Наиболее важными среди них являются скорость поиска и средства формулирования запросов и поисковых предписаний.

Скорость поиска определяет эффективность работы с ней пользователя. К сожалению, на этот показатель существенное влияние оказывает скорость Интернет-каналов. Проверка этого показателя производится путем тестирования: поиска по запросам разной длины, разной частоты употребления слов, в разное время суток.

Средства формулирования запросов определяют то, что поисковая машина вносит в индекс, а также каким образом она это делает. Полнотекстовая поисковая машина индексирует все слова видимого пользователю текста. Наличие морфологии дает возможность находить искомые слова во всех склонениях или спряжениях. Кроме этого, в языке HTML существуют тэги, которые также могут обрабатываться поисковой машиной (заголовки, ссылки, подписи к картинкам и т.д.).

Язык запросов в виде стандартных логических операторов (И, ИЛИ, НЕ) есть практически у всех машин. Некоторые позволяют искать словосочетания или слова на заданном расстоянии, что часто важно для получения хорошего результата. Дополнительной возможностью является поиск в зонах документа - заголовках, ссылках, ключевых словах (МЕТА KEYWORDS) и т.д.

Дополнительная возможность языка запросов - естественно-языковой запрос, который не требует знания операторов.

Обычно информация об этих возможностях публикуется на сервере поисковой машины (в Help'e).

Дополнительные возможности, которые предоставляет пользователям поисковая машина, включают возможные варианты поиска (специализированные страницы, поиск похожих документов, ограничение области поиска), указание списка найденных серверов, поиск по датам и серверам, удобный интерфейс поисковой машины, возможность его персонализации. Информация об этом может быть частично опубликована на сервере поисковой машины, целесообразно самостоятельно попробовать поработать с этими возможностями.

 






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных