WWW — совокупность гипертекстовых и прочих документов

Когда мы говорим об Интернете, то в первую очередь подразумеваем World Wide Web (WWW, Всемирную паутину, Web, веб) — совокупность гипертекстовых и прочих документов, размещенных на веб-серверах в Интернете, самих серверов, а также протокол HTTP, с помощью которого к ним обращаются программы.

Основной инструмент для обращения к ресурсам WWW — программы, называемые браузерами (обозревателями). Кроме того, информацию с веб-страниц способны отображать мини-приложения рабочего стола Windows 7 и другие программы.

Что такое «гипертекст», на котором основана вся Всемирная паутина? В сущности, это обычный текст, который содержит текстовые же фрагменты, воспринимаемые браузером как теги: различного рода ссылки или команды. Обрабатывая теги, браузер «собирает» на экране документ из нескольких источников, причем текст, изображения и другие компоненты отображаемой страницы технически могут находиться на разных серверах.

В отличие от простых текстовых документов, гипертекстовым принято присваивать расширения имени файла HTM, HTML, XML. Если открыть такой документ в текстовом редакторе, например Блокноте, то можно увидеть в нем текст, перемежающийся конструкциями наподобие <table align=center border=1 width=500>, <link rel=»icon» type=»image/png» href=»img/spddail.png»>. Браузер «понимает» подобные выражения как команды. Выполняя такие указания, в первом случае он отобразит часть содержимого документа как таблицу, во втором — вставит в документ соответствующий рисунок, да еще и оформит его как ссылку. Щелчок мыши на ссылке приводит к тому, что браузер откроет в этом или новом окне документ, на который указывает ссылка, и т. д.

Помимо «классических» тегов гипертекстовой разметки, в современных веб-страницах используются и другие активные элементы, например ActiveX, Adobe Flash, JavaScript и т. д. Если браузер в принципе поддерживает обработку таких элементов, и в его настройках это разрешено, на экране будет отображаться анимация, при просмотре страницы воспроизводится звуковое сопровождения и т. д. «Активное содержимое» несет в себе и потенциальную опасность.

В отличие от «простого и честного гипертекста» активные элементы на веб-страницах способны запускать на компьютере довольно сложные сценарии, вплоть до вмешательства в настройки системы, скрытного запуска исполняемых файлов и т. д. Этим вовсю пользуются создатели «зловредов». Разработчики ОС и браузеров, в свою очередь, стараются перекрыть такие возможности — частый выпуск обновлений в некоторой степени и связан с обнаружением очередных уязвимостей, недокументированных возможностей обработки кода веб-страниц.

Евгений Касперский как-то заметил, что единственно безопасный просмотр веб-страниц — это просмотр при отключенных в браузере надстройках, JavaScript и прочих современных дополнениях. С другой стороны, от «красивостей» и функциональности, которые предлагает активное содержимое, никто уже не откажется: ни создатели сайтов, ни пользователи.

Важнейшим элементом WWW сегодня стали службы поиска (поисковые машины, поисковые системы, поисковики). Серверы поисковых систем, например Google, Яндекс, Bing, систематически просматривают и анализируют содержимое появляющихся в Интернете документов. Они формируют индексы, которые позволяют быстро отобрать веб-страницы с искомыми словами и фразами.

Пользователи «старой закалки» еще помнят и вводят URL нужных им сайтов в адресную строку, но большинство поступает иначе. Как правило, они сначала открывают страницу одной из поисковых систем (часто ее назначают стартовой страницей браузера), вводят запрос и уже из результатов поиска переходят к нужному ресурсу. Во многих браузерах для удобства предусмотрены поля поиска: достаточно ввести туда запрос, выбрать одну из поисковых систем, и сразу откроется страница соответствующей поисковой машины с результатами. Эффективное пользование поисковиками — в известном смысле наука и искусство.

Что обычно ищут в Интернете «по работе»?

Товары, материалы и услуги, подходящие под какие-то описания, поставщиков определенных товаров и услуг, техническую и нормативную документацию. Главная проблема в том, что поисковые системы анализируют содержимое Интернета, руководствуясь вполне определенной логикой. В индексы попадают далеко не все, а только наиболее значимые, с точки зрения этих алгоритмов, слова и их сочетания. Различные поисковики работают чуть по-разному, но в целом все они довольно похожи.

Удачно сформулированный запрос — еще не залог успеха, но существенная его часть. При поиске избегайте общих слов. Если ключевое слово — редкий термин, обозначение конкретной марки, имя собственное, велик шанс сразу найти то, или почти то, что нужно. Ищите больше, чем по одному слову. Запрос из двух и более слов сужает круг поиска во много раз. Современные поисковые системы правильно воспринимают грамматические формы одного и того же слова. Однако «естественный язык запросов» скорее является упрощением для тех, кто не хочет вникать в тонкости формального языка запросов.

Принцип его в том, что между словами в запросе вставляются операторы — символы, которые поисковая машина трактует как «и», «не», «или», «слова должны встречаться в одном предложении» и т. д. Вы вводите в поле поиска слова и эти символы, область поиска уточняется и сужается.

Язык запросов в каждой из поисковых машин свой, однако основные операторы в большинстве систем совпадают. Например, вертикальная черта | означает «или»: будут найдены документы с любым из слов, перед которым она стоит. Если несколько слов заключены в кавычки, то поисковик ищет документы, содержащие фразу именно в таком виде. На каждом из поисковых сайтов в разделе помощи приводится полное описание доступных операторов и примеры их применения.

Во многих поисковых системах есть форма расширенного запроса. В ней можно сформировать сложный запрос без ввода операторов вручную. Просто заполняйте поля и выбирайте подходящие варианты и их сочетания с помощью раскрывающихся списков, переключателей и флажков (рис. 9.2).

Рис. 9.2. Форма расширенного поиска

Рис. 9.2. Форма расширенного поиска

Что такое метапоисковая система? Это сайт, который выступает «посредником», переправляя запросы сразу нескольким поисковикам. В результате экономится время, а из множества ответов метапоиск выделяет наиболее точные и достоверные.

Top