Docsity
Docsity

Подготовься к экзаменам
Подготовься к экзаменам

Учись благодаря многочисленным ресурсам, которые есть на Docsity


Получи баллы для скачивания
Получи баллы для скачивания

Заработай баллы, помогая другим студентам, или приобретай их по тарифом Премиум


Руководства и советы
Руководства и советы

Обзор современных поисковых систем, Рефераты из Информационные технологии

реферат по информатике, обзор поисковых систем

Вид: Рефераты

2018/2019

Загружен 19.05.2019

natasha-polyakova
natasha-polyakova 🇧🇾

5

(1)

2 документы

1 / 18

Toggle sidebar

Сопутствующие документы


Частичный предварительный просмотр текста

Скачай Обзор современных поисковых систем и еще Рефераты в формате PDF Информационные технологии только на Docsity! Учреждение образования Белорусский государственный медицинский университет Кафедра медицинской и биологической физики Полякова Наталья Игоревна Обзор и сравнение поисковых систем Реферат по дисциплине «Основы информационных технологий» Соискателя кафедры хирургической стоматологии Рецензент:___________________________ Минск 2019 1 Оглавление Введение..............................................................................................................................................3 Глава 1. История развития поисковых систем.................................................................................3 Глава 2. Краткая характеристика существующих поисковых систем........................................... 4 Глава 3. Популярные представители поисковых систем................................................................ 7 Глава 4. Преимущества и недостатки поисковых систем.............................................................18 Заключение........................................................................................................................................21 Библиографический список:........................................................................................................... 22 2 Yahoo!. Создана в 1995 году. На сегодняшний день это самый старый и наиболее полный каталог Интернет-ресурсов. Система зародилась как простая коллекция закладок, которую пополняли всего 2 человека - Дэвид Фило и Джерри Янг. Вдобавок к релевантной выдаче результатов поисковых запросов Yahoo предлагает возможность использовать ярлыки над поисковой формой на своей главной странице для поиска изображений, товаров или перехода на Желтые Страницы Yahoo. Можно производить поиск по каталогу Yahoo. Есть панель для браузера Firefox. Для хранения почты система предлагает 1 гигабайт бесплатного места или 2 по годовому абонементу. Yahoo продает место на сайте для рекламных ссылок; продажа ведется через программу Overture. Система учитывает орфографические ошибки, позволяет искать слово лишь по первым буквам. Teoma. Создана в 2001 году. Поисковая система, основанная на работе crawlerов (с англ. пауков" - специальных программных роботов, сканирующих Интернет в поисках информации, которая затем заносится в базу данных), принадлежащих Ask Jeeves. Большая релевантность поиска, встроенная система проверки правописания запросов, динамические описания страниц, появляющиеся рядом с результатами поиска. Запросы можно вводить на десяти европейских языках. В баз данных поисковика проиндексированы свыше миллиарда уникальных страниц. Существует возможность уточнения запроса в тематических топиках, ссылки на которые выдаются на странице с результатами поиска. Раздел «Ресурсы», также находящийся на странице результатов, в свою очередь уникален тем, что перенаправляет пользователя на сайты, которые послужили исходным материалом для приведенных в качестве результатов статей. LookSmart. Создана в 1995 году. Это интернет-компания, имеющая свой интернет- каталог и механизм поиска Wisenut. LookSmart - это, в первую очередь, вручную пополняемый перечень сайтов. Он получает списки двумя путями. Во-первых, коммерческие сайты платят за место в торговых топах, уподобляя LookSmart электронным Желтым Страницам. Во-вторых, существуют добровольцы, которые заносят сайты с некоммерческим содержанием в каталог www.zeal.com, принадлежащий LookSmart. Хотя это и отдельный сайт, списки, находящиеся на нем, используются при обработке поисковых запросов LookSmart. Изюминка LookSmart – это возможность доступа к сотням периодических изданий через один из ярлыков над строкой поиска. Содержит службу Furl, предназначенную для архивирования веб-страниц и ссылок на них. Для архива страниц пользователя предоставляется 5 Гб свободного пространства. Запустила систему вертикального поиска из 161 сайта. Scirus. Создана в 2001 году. Специализированная поисковая система научной и околонаучной информации. Scirus использует около 200 миллионов страниц научной тематики и отфильтровывает результаты ненаучного содержания, которые по релевантности в какой-то степени соответствуют запросу. Стартовая страница Scirus радует своей непритязательностью – там только Вы и строка запроса. Если Вы не очень сведущи в научных терминах, Scirus помогает ввести корректный запрос для лучшего поиска. Это лучшая из научных специализированных поисковых систем. Она предоставляет информацию конкретного направления, помогает в составлении запросов и использовании терминов, а кроме того Scirus находит информацию, которая может быть недоступна в случае использования других поисковых машин. GigaBlast. Создана в 2000 году. Поисковая система с более чем двух миллиардным количеством индексированных страниц. GigaBlast имеет высокую релевантность запросу и множество различных инструментов поиска. Стартовая страница GigaBlast.com проста и аккуратна. В дополнение к обычной строке запроса в наличии имеются Каталог, Поиск по блогам, Поиск Путешественника и Правительственный Поиск. Система использует обычный прямой поиск. Соответствие результатов довольно высоко, кроме того, GigaBlast проводит проверку правописания. Поддерживает запросы в буквальной форме («Почему трава зеленая?»). Проводит проверку правописания. В расширенном поиске GigaBlast.com можно искать по точной фразе, ставить исключение на слово, искать на определенном адресе и т.д. 5 Все стандартно. В целом GigaBlast является удобной машиной поиска с высоко релевантными результатами. Aol Search. Создана в 1985 году. Огромный портал, на котором можно найти все, начиная с игр и заканчивая форумами самой различной тематики + простота навигации и хорошо запоминающееся название обозначающие America Online. AOLbyPHONE – Сервис позволяет получать заказанную ранее информацию по телефону. AOLSchool – сервис для школьников. DigitalCity – проект виртуального города. AOL Anywhere – сервис позволяет получить доступ с любого мобильного устройства к контенту America Online. AOL Search предоставляет пользователям страницы с результатами поиска на основании индекса Google, «Встроенная» версия AOL Search в результате поисковых запросов дает ссылки только на содержимое, доступное внутри онлайн системы AOL. А пользуясь AOL Search, вы можете одновременно проводить поиск и по Интернет, и по Сети AOL. Во «внешней» поисковой системе AOL Search такой опции нет. Если вам по душе Google, вам будет не хватать некоторых его особенностей в AOL Search, например, кэширования страниц. Blink TV. Создана в 2004 году. Машина поиска, позволяющая находить в интернете аудио и видео файлы, используя не только ключевые слова и фразы, но и фактическое содержание аудио и видеоклипов. Можно вносить поправки в поиск, например, по дате (если ищете материал за определенный период времени) и по релевантности (если хотите получить результаты, наиболее соответствующие тому, что Вы ищете). Есть Smart папки – это папки, содержимое которых автоматически пополняется из интернет источников без участия пользователя. Они формируются из результатов поиска по вашему запросу. Использование Blinkx TV достаточно просто и удобно (единственное требование – это высокоскоростная связь с Интернетом). Infoseek. Создана в 1994 году. В этой системе индекс создает робот, но он индексирует не весь сайт, а только указанную страницу. Имеется возможность указания ключевых фраз, представляющих собой единое целое, вплоть до порядка слов. Ранжирование при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Infoseek относится к традиционным системам с элементом взвешивания терминов при поиске, а так же позволяет проводить то, что называется контекстным поиском. Это значит, что используя специальную форму запроса, можно потребовать последовательной совместной встречаемости слов, обладает довольно развитым информационно-поисковым языком (не просто указывает, какие термины должны встречаться в документах, но и своеобразно взвешивать их). Mail.ru. Создан в 1997 году. Не является поисковой системой, это огромный портал со множеством сервисов. Но в сервисы mail.ru входит и поисковая система. Ведет активную борьбу со спамом и вирусами, сотрудничая по этим направлениям с создателями «Dr.Web» и «Антивирус Касперского». В 2004 году присоединилась к инициативе почтовых служб мира и начала использовать стандарт SPF в работе фильтров своих почтовых серверов. В поисковом механизме существует опция морфологии русского языка и возможность ведения истории поисковых запросов. Обзавелась двумя инновационными сервисами: доступом по протоколу IMAP и голосовой почтой - возможностью прослушивания содержимого ящика по сотовому телефону. К порталу Mail.ru добавились такие новые сервисы как «Хостинг» и «Энциклопедии». Lucos. Создана в 1945 году. Система предоставляет доступ к результатам, собранным вручную из LookSmart по результатам наиболее частых запросов, а также из Yahoo на основе индексов сайтов, составленных роботами. Система Fast Forward позволяет видеть на одной стороне экрана результаты поиска, а на другой – первые страницы найденных сайтов. Релевантные запросу категории из каталога, собранного вручную, показываются вверху страницы с результатами поиска. Ask Jeeves. Создана в 1998 году. Прославилась как поисковая машина, понимающая «естественную речь» - в поисковую строку вводится предложение в вопросительной форме, 6 и система адекватно отвечает на него. В настоящее время Ask Jeeves работает на основе технологии crawlerов, обрабатывая запросы, поступающие в поисковую систему Teoma. Cuil. Создана в 2007 году выходцами Google. Отличительная черта – большой объем обрабатываемых страниц. Понимает запросы только на английском языке. Hot Bot. Создан в 1996 году. HotBot предоставляет простой доступ к трем основным поисковым системам, в основе которых лежит работа crawler’ов: Google, MSN и ASK. Не смешивает результаты, полученные из трех этих источников. Тем не менее, это быстрый и простой путь к тому, чтобы получить несколько независимых «мнений» по интересующей вас теме. Глава 3. Популярные представители поисковых систем 1. Google (www.google.com) По статистике является самой популярной поисковой системой в мире. Основатели Google - аспиранты Стэнфордского университета Сергей Брин и Ларри Пейдж. Из скромной затеи двух энтузиастов она выросла в интернет-гиганта, услугами которого ежедневно пользуются миллионы человек в 80 странах мира. В одном из интервью Брин, родившийся в Москве, объяснил появление Google так: "Когда мы начинали, было несколько поисковиков, но качество их работы оставляло желать лучшего. Каждый запрос возвращал вам около тысячи результатов, отсортированных в случайном порядке". Именно релевантность результатов, их соответствие запросу, была поставлена во главу угла новой системы. Помимо просто поиска, здесь можно сравнивать цены на товары в интернет-магазинах, читать новости и многое другое. Есть и служба блокировки назойливой интернет-рекламы. Google первым применил новую технологию поиска и выдачи результатов - релевантность интернет-страниц - то, что не лежит на данной конкретной странице, но тем ни менее влияет на ранг ее выдачи. Поисковая система Google учитывает гипертекстовую структуру Интернета, и какие страницы на какие ссылаются. Google сама определяет релевантность интернет-страниц Страница, на которую ссылаются чаще, более релевантна и значит более популярна. Лидерство Google никто не может оспорить. Акции компании за 2005 год выросли почти в два с половиной раза. Поисковый трафик за тот же период вырос примерно на 30%. Коммерческое использование Google запущен в 2000 году и благодаря своему программному обеспечению, обеспечивающему прекрасную релевантность результатов поиска, а также дополнительным сервисам (такому, как поиск новостей, встраиваемый в браузер "Google bar" с "гасителем всплывающих окон") быстро набрал популярность среди "продвинутых" пользователей, которые использовали Сеть в первую очередь как рабочий инструмент. Эффективную систему "тематической рекламы" также оценили рекламодатели. Не случайно Washington Post назвала сервис Google одним из 10 важнейших интернет- достижений 2003 года.Сейчас Google ежедневно обрабатывает более 200 миллионов запросов. В своей работе в настоящее время Google применяет более 15 тысяч компьютеров. Объем проиндексированных страниц более 10 миллиардов. Google - лидер в списке самых популярных поисковиков. В результате исследования, проведенного компанией comScore, выяснилось, что Google - самая популярная из поисковых систем в США. Впервые у Google начались проблемы в связи с нарушением прав человека ещё в 2005 году. При создании карт Google Earth были использованы изображения крыши американского Белого дома, что представляет угрозу для национальной безопасности Соединенных Штатов . Американская общественность была глубоко возмущена тем, что потенциальные террористы впервые получили шанс детально рассмотреть системы защиты Белого дома, расположенные на крыше. 7 24 мая 2011 года состоялся выход «Яндекса» на высокотехнологичную биржу NASDAQ. В ходе первичного размещения акций «Яндекс» привлёк 1,3 млрд долларов (второй результат за всю историю наблюдений, после Гугла с его 1,67 млрд долларов). В целом компания была оценена в 8 млрд долларов, что в 500 раз превысило её первоначальную стоимость в 2000 году. Размещение акций планировалось ещё в 2008 году, но было отложено из-за всемирного кризиса. Десятки сотрудников компании стали миллионерами. 3 июня 2014 года акции компании прошли листинг и на Московской бирже. 20 сентября 2011 года «Яндекс» открывает портал в Турции. Поисковая система локализована для турецкоязычного пользователя, учитывает морфологию, понимает синонимы и исправляет опечатки. Полностью локализованы службы Почта, Новости, Перевод, Карты (в том числе Пробки и Панорамы) и другие, есть и уникальные службы. Это первый опыт «Яндекса» в не говорящей на русском стране; для завоевания нового рынка была открыта штаб-квартира с 50 сотрудниками. В 2012 году выходит Яндекс.Браузер. Вскоре программа получает турецкую и украинскую локализации. С версии 1.1 начинается его рекламная кампания на ТВ. В мае 2012 года в Государственной Думе Российской Федерации появился законопроект, в котором «Яндекс» и «ВКонтакте» признаются стратегическими предприятиями как общенациональные трансляторы информации. Ещё в 2009 году Президент России Дмитрий Медведев инициировал покупку «Сбербанком» «золотой акции» «Яндекса» с целью избежать попадания предприятия общегосударственной важности в руки иностранцев. В том же 2012 году «Яндекс» обогнал «Первый канал» по численности ежедневной аудитории, что сделало российский интернет-гигант лидером отечественного медиарынка. В 2013 году Яндекс подтвердил этот статус, обогнав «Первый канал» по выручке. В феврале 2013 года «Яндекс» оказался впереди «Майкрософта» по числу поисковых запросов, заняв таким образом четвёртое место в рейтинге мировых поисковых систем (после Google, Baidu и Yahoo!). Рост произошёл за счёт российского рынка. В целом «Яндекс» является самым быстрорастущим поисковиком из первой десятки. В июле 2013 года глава «Яндекса» Аркадий Волож объявил о планах своей компании выйти за пределы Интернета и открытии в будущем служб в других отраслях. В 2013 году в Москве прошли съёмки художественного фильма «Стартап», который рассказывает о том, как создавался «Яндекс». Режиссёром фильма выступил Роман Каримов, а прототипами главных героев послужили Аркадий Волож и Илья Сегалович. В фильме название «Яндекс» не упоминается, а заменено на «Холмс». В 2014 году вышла книга «Яндекс.Книга» за авторством Дмитрия Соколова-Митрича, в которой рассказывается о создании «Яндекса» и развитии компании. Автор много общался с сотрудниками Яндекса для уточнения фактов. Летом 2016 года Яндекс выпустил Яндекс.Браузер с персональной лентой рекомендаций Яндекс.Дзен. Она содержит ссылки на статьи, видео, картинки и другие материалы из интернета. Лента рекомендаций формируется с помощью алгоритмов искусственного интеллекта и рекомендательной технологии Яндекса — Диско. В апреле 2017 года ФАС вынесла решение в пользу Яндекса в споре с компанией Google, который продолжался с 2015 года. Компания обращалась в ФАС с жалобой на то, что Google вынуждает производителей мобильных устройств под управлением Android отказываться от предустановки конкурирующих приложений, в том числе продуктов Яндекса. 15 мая 2017 года вследствие применения персональных и экономических санкций в отношении физических и юридических лиц, связанных с ситуацией на Украине, был заблокирован доступ к «Яндекс» для украинских пользователей. СНБО заявил, что Россия может использовать сервисы Яндекса для планирования наступательных действий на территории Украины. Все счета компании были заблокированы. 29 мая 2017 года Служба безопасности Украины (СБУ) провела обыски в украинских офисах «Яндекса» в Киеве и 10 Одессе. По информации местного ресурса, обыск проводился на основании статьи «Государственная измена». В мае 2017 года Яндекс объявил о решении закрыть свои офисы на территории Украины. В июле 2017 года Яндекс и Uber подписали соглашение об объединении бизнеса по онлайн-заказу такси в России, Азербайджане, Армении, Белоруссии, Грузии и Казахстане. Закрытие сделки ожидается в четвёртом квартале 2017 года после согласования с регулирующими органами. В конце августа 2017 года Яндекс представил новую версию поиска, в основе которой лежит поисковый алгоритм «Королёв». Он использует нейронную сеть, которая сопоставляет смысл запроса и веб-страницы. Благодаря этому поисковая система может точно отвечать на сложные запросы. В 2017 году Яндекс совместно с Банком России реализовал проект по маркированию в поисковой выдаче системы Яндекс сайтов микрофинансовых организаций и сайтов субъектов страхового дела, сведения о которых содержатся в соответствующих государственных реестрах. Банк России и Яндекс также в дальнейшем планируют распространить проект по маркированию и на другие сегменты финансового рынка, в которых взаимодействие между потребителями услуг и поставщиками чаще происходит через интернет. В 2018 году экосистема «Яндекса» пополнилась сервисами «Яндекс.Облако», «Яндекс.Диалоги», «Яндекс.Плюс» и «Яндекс.Драйв». В феврале 2018-го закрылась сделка по объединению «Яндекс.Такси» и Uber в России и пяти соседних странах. Доля «Яндекса» в новой компании стоимостью более $3,8 млрд составила 59,3%. Также «Яндекс» купил агрегатор скидок «Едадил» и 83,3% сервиса доставки продуктовых наборов «Партия еды». 3. Rambler (www.rambler.ru). Rambler – первая поисковая система русского Интернета, появилась на свет в 1996 году. Ее создатели, группа «Стек» из подмосковного Пущино, начинали с создания локальной городской сети, и подключения к Интернету. В 1992 году «Стек» запускает собственные ftp- и mail-серверы. Следующим шагом к светлому будущему, стало создание поисковой системы. Дмитрий Крюков и Сергей Лысаков начали с того что дали проекту название «Rambler». Им понравилось значение этого слова «скиталец, бродяга», выражающее саму суть поисковика. К осени 1996 года, окончательный вариант поисковой системы был готов, а 8 октября «Rambler» был запущен. Еще год система отлаживалась, к чести создателей поисковик не работал всего одни сутки – сгорели жесткие диски. Существовавшие на то время в Рунете две – три поисковых системы не выдержали конкуренции и «канули в Лету». Весной 1997 года появляется уникальный рейтинг-классификатор Rambler’s Top –100, который не только оценивал популярность российских ресурсов, но и позволял одним кликом попасть на них. Rambler’s Top –100 быстро стал универсальным барометром сети, общим стандартом медиаизмерений. Следующий шаг в развитии поисковой системы Rambler произошел в июне 2003 года. Компания запустила новую версию поисковой машины, которая отличается от предыдущей по двум основным параметрам. Первое и главное – значительно увеличилась скорость поиска; второе, благодаря новой архитектуре системы, обновление поискового индекса происходит несколько раз в день. Теперь поисковик всегда находит самые свежие документы и последние новости. Рамблер знаком с русским языком, понимает термины типа «б/у», «у.е.» и «а/я». Как дань моде, открылась лаконичная версия поисковой системы по адресу «r0.ru». Содержание ее стандартно – строка поиска, почта и новости. Еще одна уникальная особенность поисковика Rambler, это механизм ассоциаций. Помимо стандартной ответной страницы, в которой найденные документы расположены в порядке убывания релевантности, появляется строка - «У нас также ищут». В ней приведены слова и словосочетания тематически связанные с запросом. Новый механизм также исправляет ошибки запросов. На введенное gjujlf пользователь получит теперь 11 положительный результат: сведения о погоде (gjujlf – это слово «погода» набранное латиницей). «Рамблер» содержит ряд сервисов и инструментов: • «Рамблер/поиск» — поиск по Интернету. С 2011 года используется технология «Яндекс». • «Рамблер/почта» — бесплатный почтовый сервис для работы с письмами. • «Рамблер/погода» — прогноз погоды в 197 странах мира. Сервис умеет сравнивать погоду с предыдущим днем и пишет, потеплело или похолодало на улице. • «Рамблер/новости» — подборка новостей страны и мира. • «Рамблер/финансы» — новости экономики и финансов, аналитика, анализы и прогнозы экономических событий. • «Рамблер/тoп-100» — рейтинг-классификатор русскоязычного интернета. Тематический каталог популярных ресурсов и аналитический инструмент для владельцев сайтов. • «Рамблер/софт» — браузер, панель инструментов для браузера и приложения «Рамблера» для мобильных устройств. Приложение «Рамблер/почта» вошло в список лучших приложений App Store в 2015 году. • Авторамблер — автомобильные новости, изменения в законодательстве, новинки авторынка, тест-драйвы, каталог автомобилей и список официальных дилеров. • Рамблер/радио — популярные радиостанции в прямом эфире. • Рамблер/видео — сайт с подборкой видероликов: новости, клипы, фильмы, трейлеры, лекции, видео про науку, блоги, обзоры и многое другое. Формирует «Картину дня» — актуальные видеоролики, которые регулярно обновляются в течение суток. Есть подробная телепрограмма. • Рамблер/гороскопы — сайт об астрологии для любителей предсказаний. Астрологические прогнозы на каждый день, месяц и год, лунный календарь, китайский и зодиакальный гороскопы, сонник, статьи, гадания и тесты. Есть мобильное приложение. • Рамблер/семья — ответы на вопросы о семье и детях. • Рамблер/субботний — агрегатор развлекательного контента по разным тематикам. • Рамблер/недвижимость — сервис, позволяющий размещать и искать объявления о продаже и аренде объектов недвижимости по всей России. • Рамблер/путешествия — сервис подбора туров по самым популярным направлениям. • Рамблер/касса — онлайн-сервис, где можно купить билеты в кино, театры, на концерты и спортивные мероприятия в Москве, Санкт-Петербурге и ещё 90 городах России. Есть электронные билеты, которые не нужно распечатывать. • Рамблер/знакомства — партнёрский продукт Рамблера. Место знакомств и общения для пользователей из разных стран и городов. • Рамблер/ассистент — панель инструментов для браузеров Firefox, Internet Explorer, Chrome и Рамблер/браузер с сервисами Рамблера. • Рамблер/браузер — браузер с сервисами Рамблера. 4. Bing (www.bing.com) Осенью 1998 года появился сайт Microsoft Network Search (сокращённо MSN Search), представлявший собой поисковую систему Microsoft, которая содержала поисковую машину, индекс, а также веб-сканер. Позднее, 8 марта 2006 года была представлена бета-версия сервиса Windows Live Search, а 12 сентября 2006 года состоялся её окончательный релиз, заменивший устаревшую систему MSN Search. Новый поисковый механизм позволял пользователям искать среди данных конкретного типа, в веб-интерфейсе выбираемого при помощи вкладок: по веб-страницам, новостям, изображениям, музыке, на рабочем столе, в каталогах и в Microsoft Encarta. MSN Search стремилась сделать так, чтобы у их поисковой системы было более чем 2,5 млрд запросов по 12 Поисковая система Преимущества Недостатки Rambler 1. Система работает с большой скоростью поиска. 2. Обновление поискового индекса происходит несколько раз в день. 3. Поисковик всегда находит самые свежие документы и последние новости. 4. Производит ранжирование результатов в зависимости от частоты употребления и местоположения искомых терминов. 5. Один и тот же документ в различных кодировках показывается только один раз, а его конкретные адреса суммируются в списке, идущим за резюме. 1. На величину индекса релевантности влияет время существования сайта в сети. Эта особенность позволяет пользователям находить ресурсы, которые давно существуют, успешно развиваются, а не сайты- однодневки. Но такой подход значительно затрудняет попадание в выдачу новых сайтов, информация на которых подчас оказывается актуальной и, возможно, более важной для пользователя. Яндекс 1. Постоянное развитие системы. 2. Качество выдачи растет, все больше удобных сервисов предлагает компания: каталог, карты, новости, прогноз погоды, почта. 3. Глубокий морфологический анализ обрабатываемых терминов. 4. Обладает хорошим механизмом распознавания одного документа в нескольких кодировках или на зеркальных серверах. 5. Оригинально сконструированный механизм выдачи результатов. 6. Огромная индексная база. 1. Разница в выдаче при наборе слова с большой (маленькой) буквы (иногда выдача меняется, иногда нет). 2. Частое выпадение секторов поисковой базы - когда исчезают части сайтов из выдачи и восстанавливаются через 2-5 дней. 3. Обновление индексов поисковой базы происходит недостаточно часто и регулярно. Google 1. Очень мощная поисковая система, которая находится в постоянном развитии. 2. База индексов этой системы обновляется раз в два дня, 1. Нередко встречаются ссылки на сайты с уже устаревшей информацией. 2. Случается, что ссылки, 15 качество выдачи очень высокое, найти необходимый документ или информацию довольно легко. 3. Система ориентирована в основном на ссылки, причем учитываются как входящие, так и исходящие ссылки с ресурса. 4. Способна выдавать результаты на запросы по семантике языка программирования (исходный код поиска). которые находятся в результатах поиска, ведут на сайт, находящийся в стадии разработки. 3. На запрос «фильм» и «фильмы» результаты поиска будут отличаться. 4. Отсутствие возможности указать конкретную грамматическую форму слова, либо ударение также значительно усложняет процесс поиска информации. Bing 1. Ежедневно изменяющиеся темы оформления стартовой страницы с информационными блоками. 2. Вывод уточняющих вариантов поисковых запросов по отдельным категориям. 3. Видео с автоматически запускающимся предварительным просмотром. 4. Дополнительные данные по каждому результату поиска. 5. Встроенный сервис для поиска маршрутов (другие специальные поисковые сервисы появятся в скором времени). 6. Функции, повышающие удобство в использовании при поиске информации, изображений и видео. 1. Поисковая система полна спамом. 2. Использует внешние данные для обработки поисковых запросов, поэтому на релевантность влияют: расположение ключевых слов, популярность ресурса и текст ведущих на сайт, и ведущих с сайта ссылок. 3. Не адаптирована для русскоязычного поиска. Yahoo! 1. Содержит ссылки, которые наиболее полно отвечают указанной в запросе тематике. 2. Имеются интеллектуальные средства «отсечения» пустых, находящихся в разработке или чисто рекламных сайтов, далеких от искомой тематики. 3. Всегда легко определить, в каком разделе находится нужная информация. 1. Возможна проблема с отсутствующими страницами, поскольку веб-мастера обычно забывают удалить свои сайты с поисковых систем, а на Yahoo нет механизма автоматического обновления. 2. Чисто русские ресурсы не добавляются, потому 16 что их просто некому смотреть и оценивать содержимое. Заключение Поисковые системы обычно состоят из 3 компонентов: • агент (паук или кроулер), который перемещается по Сети и собирает информацию; • база данных, которая содержит всю информацию, собираемую пауками; • поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных. Во время путешествия по Интернету, вам обязательно понадобиться помощь поисковой машины. Очень часто приходится искать информацию в сети не зная даже приблизительно адрес страницы, на которой она может располагаться. В таких случаях на помощь приходит поисковая машина. Поисковые машины - это роботизированные системы. Специальная программа-робот, которую называют паук или ползун, постоянно обходит Сеть в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами. При поиске в Интернете важны две составляющие – полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом – релевантность, то есть соответствие ответа вопросу. Важными показателями являются охват и глубина поисковой машины (насколько велика база данных по документам), скоростью обхода и актуальностью ссылок (скорость обновления информации в этой базе данных), качеством поиска (чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность). Кроме релевантности, существуют важные пользовательские характеристики: скорость поиска (медленная поисковая машина неэффективна в работе), поисковые возможности (как именно происходит индексация: только по ключевым словам web-страницы или по всему тексту, с учетом морфологии или без него, с поиском по тэгам HTML - заголовкам, ссылкам, подписям к изображениям и др.), а также дополнительные удобства (удобный интерфейс, наличие специальных функций, например, поиск по датам и серверам). Здесь все зависит от того, что вы предпочитаете. Среди ведущих поисковых машин на данный момент - Яndex, Google, Rambler и др. 17
Docsity logo