Поиск информации в сети

поисковая система (англ. search engine) – это набор программ с веб-интерфейсом, выполняющий сбор и обработку данных в Интернете, а также поиск по имеющимся данным и вывод результатов поиска в соответствии с запросом пользователя.

Обратите внимание на то, что своё определение понятия разделено на две части: сбор/обработка данных и поиск/вывод результатов. Именно в такой последовательности работают поисковики. Другими словами, для того чтобы что-то найти по запросу пользователя, им нужно это что-то собрать в свою базу данных. А теперь, чтобы всё стало на свои места, проиллюстрируем процесс работы поисковой системы на картинке ниже.

Что такое поисковая система (машина), как работает поисковая система

 

информация с сайта: http://wmascat.blogspot.com/2012/04/chto-takoe-poiskovaya-sistema.html

 

Для того чтобы найти определённую информацию в Интернете, пользователь может использовать специальные системы поиска. В Рунете наиболее популярными из них являются: GoogleЯндексПоиск@Mail.ruНигма.рф и др.

Для начала, чтобы понять как искать в "поисковиках" опишем из чего они состоят.

Поисковые системы состоят из пяти отдельных программных компонент:

1. spider (паук): браузероподобная программа, которая скачивает веб-страницы.

2. crawler : «путешествующий» паук, который автоматически идет по всем ссылкам, найденным на странице.

3. indexer (индексатор): «слепая» программа, которая анализирует веб-страницы, скаченные пауками.

4. the database (база данных): хранилище скаченных и обработанных страниц.

5. search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.

Spider: Паук – это программа, которая скачивает веб-страницы. Он работает точно как ваш браузер, когды вы соединяетесь с веб-сайтом и загружаете страницу. Паук не имеет никаких визуальных компонент. То же действие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете «просмотр HTML-кода» в своем браузере.

Crawler: Как и паук скачивает страницы, он может «раздеть» страницу и найти все ссылки. Это его задача – определять, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов.

Indexer: Индексатор разбирает страницу на различные ее части и анализирует их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и других стилевых частей страницы вычленяются и анализируются.

Database: База данных – это хранилище всех данных, которые поисковая система скачивает и анализирует. Это часто требует огромных ресурсов.

Search Engine Results Engine: О, самое сердце зверя. Именно система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя. Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск.

Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании постоянно меняющихся критериев. Алгоритмом называется метод, по которому она принимает решение. Профессиональные оптимизаторы (SEO) иногда употребляют термин «algos» - это и есть то, о чем мы говорим.

 

Интересную информацию по теме можно найти на сайтах:

https://www.youtube.com/watch?v=mvIqAC07wjg - 16 секретов для быстрого поиска в поисковиках

https://www.youtube.com/watch?v=juoZLzlzPb4 - как искать, чтобы найти?!

Домашнее задание на 21.12.13

задание 1.

Что такое бод?

задача 2.

Кто в 1960 году опубликовал статью «Симбиоз компьютера и человека»? Что за информация была в этой статье?

задача 3.

Что в 1971 году предложил использовать Рэй Томлисон (Ray Tomlison), программист из компьютерной фирмы Bolt Beranek and Newman?

задача 4.

Кто изображен на фотографии?

сергей брин биографияЗадача 5.

 

Кому принадлежит фраза?

 "Если бы я знал тогда, сколько людей будут указывать URL, то не стал бы использовать в синтаксисе два слэша".

чем занимается этот человек, его вклад в истории сети, фото.