Слайд 1Выполнила студентка группы:17ТВ-9
Ильиных Юлия
Технология поиска информации в интернете
Слайд 2Поиск по адресам URL:
Самый быстрый и надежный вид поиска информации в
Интернете — поиск по адресам URL. Многие из них приводятся в печатных изданиях, специальных справочниках, звучат в эфире популярных радиостанций и с экранов телевизора.
♦ Фанаты футбольного клуба «Зенит» наизусть знают адрес www.fc-zenit.ru.
♦ Поклонникам группы «Король и шут» хорошо известен официальный сайт этой группы www.korol.spb.ru.
♦ Любители телеканала НТВ без труда найдут его сайт по адресу www.ntv.ru. Для быстрого доступа к вышеназванным ресурсам достаточно запустить программу-браузер, например Internet Explorer, и набрать знакомый адрес URL в строке адреса.
Слайд 3Поисковые системы:
Поисковые машины — это автоматические системы, опрашивающие серверы, подключенные к
глобальной сети, и сохраняющие в своей базе информацию об имеющихся на серверах данных. По специальным образом сформулированному запросу поисковые машины предоставляют информацию о том, где можно получить необходимые данные.
Как правило, поисковые машины состоят из трех частей: робота, индекса и программы обработки запроса:
.
Слайд 4
♦ Робот (Spider, Robot или Bot) — это программа, которая посещает
веб-страницы и считывает (полностью или частично) их содержимое. Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.
♦ Индекс поисковой системы — это хранилище поисковых образов, посещенных роботами страниц. Поисковый образ документа (в том числе и веб-страницы) — это описание содержания документа на специальном информационно-поисковом языке. Это описание содержит коды ключевых слов документа, отражающих его смысл и содержание. Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.
♦ Программа обработки запроса — это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы. Множество ссылок на выходе системы распределяется программой в порядке убывания релевантности у то есть от наибольшей степени соответствия ссылки запросу к наименьшей.
Слайд 5В настоящее время самыми популярными для российских пользователей Интернета являются три
крупные поисковые системы индексного типа:
♦ Яндекс (www.yandex.ru);
♦ Апорт (www.aport.ru);
♦ Рамблер (www.rambler.ru).
Эти системы учитывают грамматические особенности русского языка, поэтому результаты их поиска в русскоязычных ресурсах отличаются более высоким качеством, чем у западных систем.
Слайд 6Поисковые машины различаются по охвату информационных ресурсов:
♦ поисковые машины общей тематики
имеют базу данных по всем направлениям знаний и отличаются обширным индексом и большим объемом накапливаемой информации;
♦ поисковые машины специального назначения просматривают только сайты по определенной тематике, например музыкальные или музейные.
Основными характеристиками поисковых машин являются:
♦ объем документов в индексе;
♦ частота обновления информации;
♦ информационное пространство, которое охватывает робот поисковой машины, и разнообразие типов документов, о которых собирается информация;
♦ скорость обработки запроса;
♦ критерий определения релевантности (соответствия найденного документа поисковому запросу);
♦ возможность детализации и уточнения запроса.
Слайд 7Профессиональный поиск
Для научных работников и специалистов придется более продуманно подойти к
организации поиска. При профессиональном поиске информации в Интернете должны соблюдаться следующие требования:
♦ высокая скорость проведения поиска;
♦ достоверность получаемой информации;
♦ полнота охвата ресурсов при поиске.
Слайд 8Скорость. Скорость проведения поиска зависит в основном от двух факторов: от
грамотного планирования поиска (выбора поисковых сервисов и инструментов) и навыков работы с уже выбранным ресурсом (умения быстро разобраться в его структуре и способах навигации). Для обеспечения скорости поиска поисковых индексов недостаточно. Помимо них в Интернете существует еще целый ряд поисковых ресурсов, использование которых обеспечивает выполнение профессионального поиска.
Достоверность. Вопрос достоверности информации, получаемой из Интернета, очень актуален, так как любой человек может разместить там любую информацию без какого-либо контроля ее соответствия действительности. Это, в свою очередь, приводит к большому количеству недостоверных источников, каковыми являются, например, рефераты и курсовые работы, наводнившие Интернет.
Существуют специальные поисковые сервисы, позволяющие оценить надежность источника информации в Интернете:
Полнота. Необходимым условием успешного полномасштабного сбора информации является знание основных существующих на сегодняшний день типов ресурсов и использование различных поисковых сервисов. Ни одна поисковая система не может охватить все ресурсы Интернета.
Слайд 9Поиск по ключевым словам:
Поисковая система найдет в своей базе и
покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо.
Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме. На первый взгляд самое простое — это поиск по слову «аквариум». Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет огромное количество страниц - огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Гребенщикова «Аквариум», торговые центры и неформальные объединения с таким же названием, и многое другое, не имеющее отношения к аквариумным рыбкам.
Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым.
Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области.
Слайд 11 Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать
расширенный поиск. На рис. показано окно расширенного поиска в поисковой системе Яндекс. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами.
Слайд 12Попробуем уточнить условия поиска и введем словосочетание «аквариумные рыбки». Количество ссылок
уменьшится более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров. Очевидно, что следует продолжить движение в направлении уточнения условий поиска.
Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык.