АДМИНИСТРИРОВАНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ
ТЕМА 3. СЕТЬ ИНТЕРНЕТ
Интерес к глобальной сети Интернет постоянно растёт среди пользователей ЭВМ, что объясняется широчайшими возможностями получения разнообразной информации со всего мира; возможностью оперативно, практически мгновенно, обмениваться информацией между пользователями сети и, что немаловажно, простотой работы в сети.
Некоторые исторические сведения.
Первая компьютерная сеть появилась в 1973 году в США и получила название “ARPAnet” (Advanced Research Project Agency – Управление передовых исследований Министерства обороны США) по имени организации, которой Министерство обороны США поручило её создание.
Затем в США появляются другие вычислительные сети, например, NASA, DOE и др. В 1983 году из ARPANET выделилась сеть Министерства обороны США “MILNET”, продолжавшая взаимодействовать с породившей её сетью. В результате впервые появляется термин “Интернет”, первоначально обозначавший общение между собой двух сетей “MILNET” и “ARPANET”.
В 1984 году к “ARPANET” подключился Национальный научный фонд США (National Science Foundation, NSF), а в 1986 году на основе использования каналов телефонной связи образуется сеть “NFSNET” (National Science Foundation Network), объединившая учёных и университеты США.
В 1987 году эта сеть преобразуется в “NFSNET Backbone” (базовая часть), объединившую цифровыми быстродействующими каналами (1,45 Mbps –Мегабит в секунду) 13 территориальных центров.
В 1990 году проект, основанный на идее взаимодействия независимых сетей, стали называть Интернетом (англ. “Internet”), т.е. “сетью сетей”; структурой, объединяющей другие (опорные) вычислительные и информационные компьютерные сети.
В 1991 году “ARPANET” прекращает своё существование, а созданная в её рамках сеть Интернет существует и объединяет множество сетей во всем мире.
Практически любая компьютерная сеть, обеспечивающая взаимодействие с другими компьютерными сетями в мире по протоколу TCP/IP, является частью (фрагментом или сегментом) Интернета. В России первой организацией, получившей в начале 1980-х годов доступ в Интернет, становится Институт атомной энергии им. И.В. Курчатова (ИАЭ). В 1989 году для разработки ПО и построения локальных компьютерных сетей создаётся компания ДЕМОС. В 1990 году начинает функционировать сеть пользователей UNIX, получившая название “РЕЛКОМ”. Она обеспечила связь между ИАЭ и ДЕМОС, а также подключение к европейской сети пользователей UNIX – EUnet. Кроме Relcom в нашей стране существует и успешно работает несколько региональных компьютерных сетей, например, Sprint, Glasnet, Rosnet и другие.
К концу XX века возможностей Интернета стало не хватать. В 1996 году несколько десятков американских университетов выступило с инициативой создания системы “Internet2”, предназначенной для разработки и распространения передовых сетевых технологий среди научных и образовательных структур, в частности, методов организации высококачественных цифровых ТВ-передач, дистанционного управления научным оборудованием (телескопами, микроскопами и др.), виртуальной реальности и систем распределенных вычислений.
ФУНКЦИОНАЛЬНЫЕ И АРХИТЕКТУРНЫЕ ОСОБЕННОСТИ ИНТЕРНЕТА
Функционально сети создаются и используются для обмена различными видами информации, проведения исследований, предоставления пользователям разнообразных онлайновых и офлайновых сервисов, осуществления математических вычислений и др.
Архитектурные особенности Интернета
В конце 1980 годов NSF с целью проведения научных исследований создаёт пять суперкомпьютерных центров. Для организации компьютерной связи между ними, по специальным телефонным линиям устанавливаются соединения. Сеть формируется по региональному принципу. Близко расположенные заинтересованные организации соединяются между собой, образуя цепочки, которые соединяются с соответствующими региональными суперкомпьютерными центрами. В результате любой компьютер такой сети может соединяться с любым другим, имеющим к ней подключение. Эта сеть получила название NFSNET.
Однако интенсивная работа пользователей в такой сети (большие потоки данных) достаточно быстро перегрузила управляющие ей суперкомпьютеры и телефонные линии. Эта и другие территориальные сети, взаимодействуя между собой, сформировали глобальную компьютерную “сеть сетей”, называемую Интернетом.
Интернет можно понимать как самоорганизующуюся систему с высоким уровнем роста. При этом до 1989 года Интернет являлся некоммерческой сетью, в основном обслуживая государственные и академические (университетские) сети.
В 1992 году в сети начинает использоваться разработанная Тимом Бернс-Ли технология World Wide Web.
Глобальная компьютерная сеть формируется из сегментов, принадлежащих, как правило, телекоммуникационным компаниям, предоставляющим службы своей сети в аренду. При отсутствии такой сети в нужном регионе предприятия самостоятельно создают свои территориальные сети, арендуя выделенные или коммутируемые каналы у телекоммуникационных или телефонных компаний.
На арендованных каналах можно построить сеть с промежуточной коммутацией или соединять арендованными каналами непосредственно маршрутизаторы или мосты локальных сетей. Выбор способа использования арендованных каналов зависит от количества и топологии связей между локальными сетями.
Разные части (сегменты) Интернета соединяются между собой с помощью узловых компьютеров. Сообщения пересылаются по цепочке узлов, в каждом из которых принимается решение о направлении (маршруте) пересылки пакета данных на следующий узел, последовательно приближаясь к пункту назначения. Такой процесс называется маршрутизацией. Каждый узел имеет таблицу маршрутизации, которую составляет и модифицирует самостоятельно, с помощью устройств, называемых маршрутизаторами.
Число сетей, подключённых к сообществу компьютерных сетей Интернета, постоянно и даже экспоненциально растёт. Популярность Интернета определяется наличием простого в использовании программного обеспечения, отработанной технологии межсетевого обмена и большого количества информационных материалов, размещённых в сети за время её существования.
Происходит рост коммерческого использования технологий Интернета, приведший, например, к появлению нового термина Интранет (Intranet), обозначающего применение информационных технологий Интернета для нужд компаний и корпораций в качестве основы их корпоративных информационных ресурсов. Ядром такой системы является технология WWW, расширенная возможностями подключения через программы, реализующими специальный формат обмена данными между сервером WWW и системами управления базами данных, а также мобильными кодами языка Java, которые должны реализовать концепцию распределённой информационной системы.
Эти обстоятельства вызывают потребность организации централизованного обслуживания клиентов в рамках информационных технологий Интернета.
Рассмотрим основные требования к современным приложениям масштаба предприятия.
Пространственное разделение. Подразделения организации разнесены в пространстве.
Структурное соответствие. ПО должно адекватно отражать информационную структуру предприятия – соответствовать основным потокам данных.
Ориентация на внешнюю информацию. ПО предприятия должно уметь работать с новым типом пользователей и их запросами.
Всеми перечисленными требованиями к ПО масштаба предприятия отвечают распределённые системы. Выделяют четыре основных уровня распределённой архитектуры:
1) представление данных (пользовательский уровень);
2) правила бизнес-логики (уровень обработки данных);
3) управление данными (уровень управления данными);
4) хранение данных (уровень хранения данных).
Клиентские приложения то же могут реализовать правила обработки данных. Если набор правил минимален и сводится в основном к процедурам проверки корректности ввода данных – это “тонкий клиент”. Он содержит минимальный набор бизнес-правил. “Толстый клиент”, наоборот, содержит большую долю функциональности и логики приложения.
Интернет представляет собой две сети – физическую и виртуальную.
Физическая сеть включает сервера, хранящие контент, а также маршрутизаторы, соединяющие элементы физического Интернета и управляющие трафиком. В зависимости от используемых линий связи различают сети с выделенными и коммутируемыми каналами, а также их комбинации. Выделенные каналы обычно арендуются у компаний-операторов территориальных сетей. Порой крупные корпорации создают собственные выделенные каналы.
Виртуальная сеть представлена контентом (текстом, графикой, аудио- и видеосодержанием веб-страниц), линками (соединением между веб-страницами) или количеством линков, которыми измеряется расстояние между парой веб-страниц.
Совокупность корпоративных сетей, объединенных в единое информационное пространство с помощью Интернета, получила название экстранет (extranet).
Территориальные сети, используемые для построения корпоративной сети, обычно делят на две большие категории:
Магистральные территориальные сети (backbone wide-area networks) используются для образования одноранговых связей между крупными локальными сетями, принадлежащими большим подразделениям предприятия. Они должны обеспечивать высокую пропускную способность, так как на магистрали объединяются потоки большого количества подсетей; быть постоянно доступными, то есть обеспечивать очень высокий коэффициентом готовности.
Под сетями доступа понимаются территориальные сети, необходимые для связи небольших локальных сетей и отдельных удалённых компьютеров с центральной локальной сетью предприятия. Быстрый доступ к корпоративной информации из любой географической точки для многих видов деятельности предприятия определяет качество принятия решений его сотрудниками. У предприятия может быть много точек удалённого доступа. Поэтому одним из основных требований в сетях доступа является наличие разветвлённой инфраструктуры доступа, используемой сотрудниками предприятия при работе дома и в командировках.
В связи с широким использованием на предприятиях локальных сетей наиболее часто встречающийся вид удалённого доступа – это доступ не к отдельному компьютеру, а к сети в целом. Для этой цели в центральной сети предприятия устанавливается специальная система – сервер удалённого доступа (Remote Access Server, RAS), выполняющий большой спектр функций по обслуживанию многочисленных удалённых клиентов. Его часто называют коммуникационным сервером. Разделяемый для пользователей локальный пул модемов создаётся с помощью такого коммуникационного сервера.
Коммуникационный сервер (Communication Server) – это обычный компьютер или специализированное устройство, предоставляющее пользователям локальной сети прозрачный доступ к последовательным портам ввода/вывода, к которым подключены разделяемые модемы. Пользователь, подключившийся по локальной сети к коммуникационному серверу, может работать с одним из подключенных к нему модемов точно так же, как если бы этот модем был подключен непосредственно к компьютеру пользователя. Таким образом, коммуникационный сервер обслуживает пользователей локальной сети, делая локальные модемы разделяемыми ресурсами. Коммуникационный сервер поддерживает режим dial-out, позволяющий пользователям локальной сети устанавливать по своей инициативе связь через телефонную сеть с каким-либо удалённым компьютером.
Сервер удалённого доступа обслуживает не локальных, а удалённых пользователей, предоставляя им доступ к ресурсам локальной сети – файлам, принтерам и т. п. – извне. Он поддерживает режим dial-in, который позволяет пользователю, работающему на удалённом компьютере, устанавливать связь с локальной сетью по его инициативе. Именно это является основной задачей систем удалённого доступа. С этой точки зрения удалённый доступ можно определить как эффективный способ разделения ресурсов централизованных серверов между удалёнными клиентами.
Часто коммуникационный сервер и сервер удалённого доступа являются одним и тем же продуктом, выполненным в качестве дополнительного программного обеспечения в среде какой-либо популярной ОС, или в качестве отдельного устройства.
Режимы dial-in и dial-out сообщаю кто является инициатором установления соединения – удалённый пользователь или пользователь локальной сети. Режим dial-in поддерживают все серверы удалённого доступа, а режим dial-out является факультативным и не всегда реализуется.
Вариантом удалённого доступа являются две разновидности одного режима: удалённое управление (remote control)и терминальный доступ (terminal access). При этом способе удалённый компьютер становится виртуальным терминалом компьютера-хоста, который может и не быть подключенным к сети. Этот вариант позволяет запустить любое приложение на компьютере-хосте, а также получить доступ к любым данным этого хоста. Удалённое управление или терминальный доступ эффективны, когда удалённый пользователь работает с приложениями, не оптимизированными для работы в сети, например с традиционными СУБД для персональных компьютеров. Если такое приложение находится на одном компьютере, а файлы баз данных на другом, в сети создаётся чрезмерно интенсивный трафик.
При терминальном доступе в центральной сети желательно установить терминальный сервер. Если его не использовать, то на каждый компьютер, к которому нужно подключиться в режиме удалённого терминала, нужно установить модем и выделять ему отдельный телефонный номер.
Удалённый доступ характеризуется использованием глобальных транспортных служб, несимметричностью взаимодействия и большим количеством удалённых пользователей. При удалённом доступе в основном используются аналоговые телефонные сети и ISDN.
Интернет – это совокупность глобальных сетей. Он предоставляет в основном транспортные услуги, транзитом перенося данные между локальными сетями или компьютерами. Однако в нём для абонентов глобальной сети всё большее развитие получают службы прикладного уровня, осуществляющие не только распространение публично-доступной аудио-, видео- и текстовой информации, но и организацию интерактивного взаимодействия абонентов сети в реальном масштабе времени.
Если компьютер включён в Интернет, это означит, что на нём используется TCP/IP стек, что он имеет индивидуальный IP-адрес и может посылать TCP/IP пакеты другим машинам в сети.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СЕТЕЙ
При передаче сообщений участники сетевого обмена должны принять множество соглашений, которые должны быть приняты для всех уровней, начиная от самого низкого уровня передачи битов, до самого высокого уровня, детализирующего, как информация должна быть интерпретирована. При разработке сетей ЭВМ возникает задача согласования взаимодействия ЭВМ клиентов, серверов, линий связи и других устройств.
Такие формализованные правила, определяющие последовательность и формат сообщений, которыми обмениваются сетевые компоненты, лежащие на одном уровне, но в разных узлах, называются протоколами.
Протокол – это совокупность соглашений о способах представления данных, обеспечивающих их передачу в заданных направлениях и правильную интерпретацию данных всеми участниками информационного обмена.
Реализацию протоколов совместно с реализацией управления серверами называют сетевой ОС или сетевым программным обеспечением.
Программная структура сети включает ОС, и различное ПО, обеспечивающее взаимосвязь компьютеров в сетях, передачу информации, защиту от несанкционированных действий, вирусов и др. Эти серверные приложения обеспечивают функционирование основных узлов сети, клиентское программное обеспечение (браузеры, почтовые программы, FTP-клиенты) и др.
Программное обеспечение компьютерных сетей (сетевое программное обеспечение, СПО) обеспечивает передачу данных между приложениями, работающими на абонентских машинах. К нему относят Unix/Linux подобное СПО, NetWare, Windows NT, 2000 и другое СПО.
СПО определяет функционирование транспортной среды, системы передачи данных и взаимодействие абонентских машин с транспортной средой.
Часть протоколов в сети реализуется программно, часть – аппаратно. Для стандартизации протоколов создана Международная организация по стандартизации (МОС или ISO).
Набор уровней и протоколов называется архитектурой сети. Описание архитектуры сети должно содержать достаточно информации, чтобы разработчик сетевого программного обеспечения мог разработать необходимые для каждого уровня программы, а инженер электронщик – аппаратуру.
Конкретный набор протоколов, используемый на конкретной машине, называется стеком протоколов.
ИЕРАРХИЯ ПРОТОКОЛОВ. СЕТЕВЫЕ ПРОТОКОЛЫ
Компьютерная сеть является сложной инженерно-технической системой. Для решения возникающих в ней проблем сетевое программное обеспечение, как правило, организуют в виде иерархии слоёв или уровней. В разных сетях число уровней, их название, состав и функции могут различаться. Однако, во всех сетях назначением каждого уровня является:
Протоколы сети Интернет объединяют под названием TCP/IP.
Протоколы ISO являются семиуровневыми и известны как протоколы базовой эталонной модели взаимосвязи открытых систем.
СТЕК ПРОТОКОЛОВ TCP/IP
Средства взаимодействия компьютеров в сети организованы в виде многоуровневой структуры – стека протоколов. Иерархически организованная совокупность протоколов, решающих задачу взаимодействия узлов сети называется стеком коммуникационных протоколов.
В однородной сети все компьютеры используют один и тот же стек. В контексте межсетевого взаимодействия понятие “сеть” можно определить как совокупность компьютеров, общающихся друг с другом с помощью единого стека протоколов. Проблема возникает при необходимости организовать взаимодействие компьютеров разных сетей, на которых установлены разные стеки коммуникационных протоколов. Задачи устранения неоднородности зависят от того, к какому уровню модели OSI они относятся.
ISO разработала модель взаимодействия открытых систем (OSI) или моделью ISO/OSI. В ней взаимодействие делится на семь уровней или слоев, каждый из которых имеет дело с одним определённым аспектом взаимодействия. Таким образом, одна проблема декомпозирована на семь частных проблем, каждая из которых может быть решена независимо от других. Каждый уровень поддерживает интерфейсы с выше- и нижележащими уровнями.
Три нижних уровня – физический, канальный и сетевой – являются сетезависимыми, то есть протоколы этих уровней тесно связаны с технической реализацией сети, с используемым коммуникационным оборудованием.
Три верхних уровня – сеансовый, уровень представления и прикладной – ориентированы на приложения и мало зависят от технических особенностей построения сети. На протоколы этих уровней не влияют никакие изменения в топологии сети, замена оборудования или переход на другую сетевую технологию.
Транспортный уровень является промежуточным, он скрывает все детали функционирования нижних уровней от верхних уровней. Это позволяет разрабатывать приложения, независящие от технических средств, непосредственно занимающихся транспортировкой сообщений.
Компьютер с установленной на нём сетевой ОС взаимодействует с другим компьютером с помощью протоколов всех семи уровней. Это взаимодействие компьютеры осуществляют опосредовано через различные коммуникационные устройства: концентраторы, модемы, мосты, коммутаторы, маршрутизаторы, мультиплексоры. В зависимости от типа, коммуникационное устройство может работать только на физическом уровне (повторитель), на физическом и канальном (мост), или на физическом, канальном и сетевом, иногда захватывая и транспортный уровень (маршрутизатор).
При объединении сетей, использующих разные протоколы более высоких уровней, например, при организации доступа к файловому сервису Windows NT клиентов сети Novell NetWare или для работы их с сервисом telnet ОС Unix возникает проблема, называемая интероперабильностью (interoperability). Подобные проблемы характерны для корпоративных сетей, где в разных подразделениях часто работают различные сетевые операционные системы.
Проблема межсетевого взаимодействия может возникнуть в однородной сети Ethernet, в которой установлено несколько сетевых ОС. В этом случае, все компьютеры и все приложения используют для транспортировки сообщений один и тот же набор протоколов, но взаимодействие клиентских и серверных частей сетевых сервисов осуществляется по разным протоколам. Здесь компьютеры могут быть отнесены к разным сетям, если у них различаются протоколы верхних уровней, например, сеть Windows NT, сеть NetWare. Такие сети могут сосуществовать, не мешая друг другу и использовать общий транспорт. Однако, если потребуется обеспечить доступ к данным файл-сервера NetWare для клиентов Windows NT, администратору сети придётся согласовать сетевые сервисы.
Существует три основных подхода к согласованию разных стеков протоколов:
Трансляция протоколов
Трансляция обеспечивает согласование двух протоколов путём преобразования (трансляции) сообщений, поступающих от одной сети, в формат другой сети. Транслирующий элемент, в качестве которого могут выступать, например, программный или аппаратный шлюз, мост, коммутатор или маршрутизатор, размещается между взаимодействующими сетями и служит посредником в их “диалоге”. В зависимости от типа транслируемых протоколов процедура трансляции может иметь разную степень сложности. Сложность трансляции зависит от того, насколько сильно различаются транслируемые протоколы.
Часто в широком смысле транслятор протоколов называют шлюзом, независимо от того, какие протоколы он транслирует. В этом случае подчеркивается, что трансляция осуществляется выделенным устройством, соединяющим две разнородные сети.
Мультиплексирование протоколов
Другим подходом к согласованию коммуникационных протоколов является технология мультиплексирования, заключающаяся в установке нескольких дополнительных стеков протоколов на одной из конечных машин, участвующих во взаимодействии. Компьютер с несколькими стеками протоколов использует для взаимодействия с другим компьютером тот стек, который понимает этот компьютер. Для того, чтобы запрос прикладного процесса был правильно обработан и направлен через соответствующий стек, необходимо наличие специального программного элемента – мультиплексора протоколов. Мультиплексор определяет к какой сети направляется запрос клиента.
При использовании технологии мультиплексирования структура коммуникационных средств операционной системы может быть и более сложной: мультиплексирование осуществляется не на уровне стеков, а на уровне отдельных протоколов. В общем случае на каждом уровне может быть установлено несколько протоколов, и для каждого уровня может существовать собственный мультиплексор, выполняющий коммутацию между протоколами соседних уровней.
Инкапсуляция (туннелирование) протоколов
Инкапсуляция (encapsulation) или туннелирование (tunneling) – метод решения задачи согласования сетей, применяемый для согласования транспортных протоколов и только при определённых ограничениях. Инкапсуляция может быть использована, когда две сети с одной транспортной технологией необходимо соединить через сеть, использующую другую транспортную технологию.
Метод инкапсуляции заключается в том, что пограничные маршрутизаторы, подключающие объединяемые сети к транзитной сети, упаковывают пакеты транспортного протокола объединяемых сетей в пакеты транспортного протокола транзитной сети. Для реализации этого метода пограничные маршрутизаторы должны быть сконфигурированы.
Инкапсуляцию можно использовать для транспортных протоколов любого уровня. Для согласования сетей на сетевом уровне можно использовать многопротокольные и инкапсулирующие маршрутизаторы, а также программные и аппаратные шлюзы. Обычно инкапсуляция приводит к более простым и быстрым решениям по сравнению с трансляцией, так как решает более частную задачу, не обеспечивая взаимодействия с узлами транзитной сети.
Управление Интернетом
Интернет можно представить как организацию с добровольным участием. Управляется она Советом (Интернет Society, ISOC), избирающим авторитетных представителей для ведения технической политики, поддержки и управления сетью. При этом её составляющие (опорные сети) формируются и работают обычно на основе централизованного управления ими. Каждая такая сеть имеет сетевой эксплуатационный центр (NOC), который связывается с другими, подобными центрами, занимается технической эксплуатацией своей сети и поддержкой её в рабочем состоянии. Эти подсети соединяются между собой с помощью шлюзов. При передаче пакета машине, расположенной в другой подсети, используют специальный “межсетевой язык” – IP-протокол.
Решения по вопросам функционирования сети (стандарты, политика распределения ресурсов, например, IP-адресов и др.) принимает Совет по архитектуре Интернета (IAB).
Основу существования Интернета представляют стандартные способы общения в сети между различными компьютерами и прикладными программами.
УПРАВЛЕНИЕ WEB-СЕРВЕРОМ
WWW получила широкое распространение. В процессе развития WWW-технологий пользователям Интернета стали доступны различные виды представления информации, включая текст, картинки, графики, видео и звуковые записи. Одновременно развивалась и сетевая WWW-среда (веб-среда). Эта гипермедийная среда ориентирована на предоставление простого доступа пользователей к распределённым в сети Интернета универсальным БД, содержащим документы неограниченной сложности и произвольной структуры. Она предполагает организацию в глобальной сети специальных WWW-серверов (веб-серверов), имеющих доменные адреса, обозначающие их принадлежность к данной технологии, например, www.microsoft.com.
Сеть соединённых между собой веб-серверов входит в состав глобальной мировой информационной и вычислительной сети. Услуги сети обычно строятся путём использования технологии “клиент-сервер”. Пользователи такой сети являются её веб-клиентами. Сервер по запросам клиентов предоставляет им некоторые сетевые услуги. Клиентское ПО служит для передачи запросов серверу и получения от него ответов.
Особенностью веб-технологий является архитектура построения компьютерных систем, использующая толстых и тонких клиентов. Тонкий клиент реализуется с помощью веб-браузера на стороне клиента. При этом весь функционал размещается на доступном пользователям сервере. В силу различных причин пользователю бывает необходимо работать автономно (толстый клиент), лишь на короткое время получая доступ к корпоративным ресурсам портала.
WWW-сервер – часть глобальной или внутрикорпоративной сети, программа и устройство, позволяющие пользователям сети получать доступ к гипертекстовым документам, расположенным на данном сервере. Для взаимодействия с WWW-сервером пользователю (клиенту) сети необходимо иметь специализированное клиентское программное обеспечение – браузер (от англ. “browser” – программа просмотра веб-страниц). Наибольшее распространение получила программа “Microsoft Internet Explorer” (IE), хотя известны отечественные и зарубежные варианты браузеров, например, “Netscape Navigator”, Opera и др.
Просмотр (браузинг) – операция, характерная только для гипертекста, означающая поиск информации посредством просмотра гипертекстовой сети, при этом возможно запоминание пути следования, с тем, чтобы при последующем аналогичном запросе поиск происходил по зафиксированному пути следования.
В общем виде схема работы WWW-сервера выглядит следующим образом:
1. Пользователь сети запускает пакет программного обеспечения (браузер), в функции которого входит:
2. Веб-сервер ищет запрашиваемый документ и возвращает полученные результаты браузеру.
3. Получив документ, браузер отображает его на экране компьютера пользователя и ожидает его реакции. Возможные варианты:
В первом и третьем случае происходит обращение к новым документам.
Взаимодействие веб-клиента и веб-сервера осуществляется указанием адреса документа (URL), содержащего наименование протокола, по которому работает сервер (http); имени сервера (или его IP-адреса) и пути к документу на веб-сервере. Например: http://www.cnit.nsu.ru/welcome.html.
Таким образом, функции WWW-сервера заключаются в:
В общем случае, WWW-сервером будем называть программно-аппаратный комплекс, предназначенный для выполнения вышеперечисленных действий.
В настоящее время все известные веб-серверы представляют собой компьютер общего назначения с многозадачной операционной системой (ОС). Один или несколько процессов такой системы отвечают за поддержку функций, специфических для веб-сервера. Другие процессы ОС отвечают за обеспечение функций, не обязательно связанных с поддержкой веб-технологии.
Такая структура означает, что WWW-сервер – это часть программного обеспечения. Остальная часть – это компьютер, операционная система, другие процессы, сетевая структура, называемая средой работы веб-сервера или платформой. В таблице 1 приведён список наиболее распространённых платформ для WWW-сервера.
Таблица 1
Компьютер | Операционная система | ||||
IBM PC | Unix (UnixWare, Open Server, Solaris, BSD, Linux и т.д.)
Microsoft Windows NT IBM OS/2 Novell NetWare Sun Sparc Station
| и Sparc Server SunOS Solaris Silicon Graphics
| серверы и рабочие станции IRIS
| |
Для создания WWW-сервера обычно используют следующие два пути. Первый заключается в создании и поддержке собственного WWW-сервера, что требует постоянного подключения сервера к выделенной линии и наличия соответствующих специалистов. Второй путь состоит в том, чтобы найти подключённую к Интернету локальную сеть, и на уже существующем сервере разместить информацию в виде «домашних страниц» - создать так называемый виртуальный Web-сервер на отведённом для этой цели компьютере провайдера или физически установить свой компьютер в чужую локальную сеть, возложив задачу поддержки сервера на персонал сетевого узла.
ЯЗЫКИ СОЗДАНИЯ СЕРВЕРНЫХ ПРИЛОЖЕНИЙ
Формально гипертекст можно представить в виде сети или графа, где узлами являются фрагменты текста, а дуги отображают отношения, связывающие эти фрагменты. Доступ к информации осуществляется не путём последовательного просмотра текста, как в обычных ИПС, а методом перемещения от одного фрагмента к другому. Элементы гипертекста (текстовые фрагменты) называют узлами. Узлы, между которыми возможен переход, считаются смежными, а сама возможность перехода называется “связь”. Совокупность смежных узлов образует “окрестность” данного узла. Последовательно соединенные связями узлы образует “цепь”. Расстояние между узлами равно минимальному количеству промежуточных узлов, что соответствует “близости” или “неблизости” их содержания. В общем случае в качестве узла могут выступать: слово; словосочетание; предложение; абзац; параграф; документ; собрание документов, относящихся к одной теме; отдельные сообщения и т. п. Характер связей между узлами может быть различным.
Основная идея гипертекстовых технологий заключается в том, что поиск документальной информации происходит с учётом множества взаимосвязей, имеющихся между документами, а значит, более эффективно, чем при традиционных методах поиска. Гипертекстовые ссылки встроены в текст документа и хранятся как его часть. Благодаря использованию специального языка можно не только формировать гипертекстовые документы, но и осуществлять связь текста и изображения с документами, расположенными на другом веб-сервере.
HTML
Язык HTML (Hypertext Markup Language – язык гипертекстовой маркировки) – средство формирования гипертекстовых документов.
Гипертекстовый документ – файл, содержащий различные виды информации и имеющий в своей структуре ссылки (гиперссылки) на другие файлы или сам являющийся документом, на который есть ссылка в другом файле, расположенном на некотором сервере в любой точке планеты. Гипертекстовый документ, размещённый на сервере с использованием WWW, называют Web-страницей (веб-страницей).
Структура гипертекстовых (HTML) документов формируется с помощью последовательности тегов – элементов HTML, включающих тексты в формате ASCII. При чтении веб-страниц теги не видны.
Тег или тэг (англ. “Tag”) является признаком объекта, управляющим кодом. Любая страница начинается с тега <HTML> и заканчивается тегом </HTML>. Легко заметить, что теги представляют собой некоторые операторы (команды, дескрипторы), заключенные в скобки типа “< >”, причём ими начинается и заканчивается целая страница или некоторый фрагмент. В конце команды ставится слеж “/” с именем, используемым в её начале. Таким образом, первый дескриптор включает некоторое действие, а второй – его выключает. Это правило касается парных дескрипторов. Существуют операторы, не требующие их выключения (закрытия).
Для расширения возможностей HTML в 2003 году появился стандарт XML, главное назначение которого, прежде всего, заключается в создании новых языков разметки – интеграция существующих стандартов хранения и представления данных и упрощение процессов обмена информацией.
XML
Язык XML (eXtensible Markup Language) в отличие от HTML, ориентирован не на форматирование, а на данные. Он позволяет создавать оригинальные теги, поддерживать произвольную структуру данных и обеспечивать проверку корректности документа.
XML проектировался в основном для того, чтобы снабдить разработчиков инструментарием, упрощающим создание специализированных форматов описания данных, что весьма актуально, учитывая рост объёмов и сложности данных. Все чаще стали возникать задачи, в которых программистам требовалось представлять данные в хорошо структурированной форме. Среди них задачи экспорта данных в формате, который можно было бы в перспективе сравнительно легко понимать и обрабатывать. Язык XML, позволив это, предоставил возможность проверки структуры данных, снизив риск обмена поврежденными или неправильно структурированными данными. Это достигается путём задания корректной структуры XML-документа в виде определения Data Description Definition (DTD). Однако DTD не решает проблемы типизации данных; например, можно определить необходимость наличия того или иного элемента в XML-документе, но нельзя задать его тип и граничные значения. Эти ограничения снимает язык XML Schema, позволяющий задавать корректную структуру XML-документа, учитывая при этом типы и допустимые значения элементов.
Java
Java - интерпретируемый язык с синтаксисом языка C++, специально рассчитанный на работу в открытой сетевой среде.
Текст программы на Java может компилироваться и передаваться по сети для исполнения на виртуальной машине в удалённом интерпретаторе. При этом доступ к ресурсам компьютера для Java-программы может быть ограничен с целью обеспечения безопасности. Такие передаваемые по сети маленькие программы на языке Java называют аплетами. Их обычно используют для украшения веб-страниц. С серверов в Интернете могут вызываться не только программы, но и описания объектов или форматов данных.
WWW-навигатор, поддерживающий Java, неограниченно расширяем. При этом пользователь использует стандартный интерфейс и не замечает никаких сложностей с форматами, протоколами и т.д. Возможности и перспективы Java гораздо шире. Принципиально важно передавать в Интернете не только данные, но приложения. В новой технологии документы позиционируются как объекты, вместе с которыми можно передавать и методы их обработки. Это позволяет с помощью Java строить большие программные продукты, полностью использующие возможности современных корпоративных информационных сред, использующих высокоскоростные сети и мощные сервера баз данных.
ISP (INTERNET SERVICE PROVIDER)
Услуги в Интернете предоставляются различными организациями – провайдерами. Выделяют интернет-провайдеров, сервис-провайдеров, провайдеров приложений и др. Предполагается, что в дальнейшем им на смену придут организации, способные осуществлять все виды услуг одновременно – Full service providers.
Обычно провайдер имеет несколько телефонных линий (телефонных номеров) с модемами для подключения к ним пользователей. Такая структура называется “модемный пул”. Её назначение – уменьшение времени дозвона пользователя до сервера, а также предоставление бóльшему количеству абонентов возможности работать с ним одновременно.
Специально оборудованные сетевые узлы с серверами, называют хостами. Они, являясь провайдерами и, как правило, за определённую плату предоставляют различным категориям пользователей широкий спектр услуг. Наиболее существенным является “хостинг” – размещение на таком узле сайта или портала пользователя.
Абонент, подключившись к Интернету, становится пользователем непрерывного информационного потока. Время и объём информации, получаемый или передаваемый им, характеризуются термином “трафик”. Пользователям приходится платить за аренду каналов, подключение к провайдеру, трафик, а также другие услуги, оказываемые посредниками. При этом стоимость используемых им услуг Интернета, в том числе трафика, определяет провайдер.
РАЗРАБОТКА ВЕБ-СТРАНИЦ
Текстовая, цифровая, графическая и иная, в том числе мультимедийная электронная информация сайтов на веб-серверах обычно оформляется в виде страниц “бумажного документа”. Поэтому принято говорить, что в сети присутствуют “страницы информации”. Каждый документ и любая страница (документ может состоять из ряда страниц-файлов) содержат различные виды данных и множество внутренних ссылок. При этом одна веб-страница всегда называется главной, начальной – “home page”. С неё начинается документ, сайт или портал. На одном сервере может размещаться несколько сайтов и (или) порталов. Так обычно поступают организации, предоставляющие пользователям услуги размещения и поддержания их “домашних страниц” (хостинг).
Материалы, размещаемые на веб-сервере, готовятся с использованием языка HTML, например, с помощью специальных HTML-редакторов или средств конвертирования в HTML-формат документов, подготовленных в среде популярных текстовых процессоров (MS Word и др.). Поэтому вопрос создания веб-сервера в локальной сети заключается в основном в обеспечение постоянного подключения к Интернету.
Поскольку электронный документ создаётся и хранится на любом машинном носителе данных, то методы создания электронных документов для страниц, выставляемых на сайте, не отличаются от методов создания документов в прикладных программах, например, в любом текстовом редакторе. Документ созданный в ряде компьютерных прикладных программ (ПП) может быть сохранён в формате веб-страницы. Во многих случаях целесообразно использовать специальные ПП, например, FrontPage, Publisher, Hot Dog, HomeSite, Dreamweaver, Noteped, Site_Create и др.
Для проверки полученных результатов целесообразно использовать несколько распространённых браузеров, чтобы учесть как разные браузеры отображают страницы и, при необходимости, внести соответствующие коррективы. Дело в том, что пользователи использую разные браузеры. В ряде случаев, полученные ими изображения могут разочаровать и расстроить их, что приводит к нежеланию обращаться к такому сайту в дальнейшем.
Язык HTML поддерживает формы. Пользователь может вводить в них информацию, которая затем передастся на сервер. Таким образом заполняются анкеты, регистрационные карты, проводятся социологические опросы.
Кроме того, используется CGI (общий шлюзовой интерфейс) – программа для связи HTML-браузеров с другими прикладными программами и (или) текстами, находящимися на стороне сервера.
ИНТЕРФЕЙС CGI
Помимо доступа к статическим документам сервера существует возможность получения документов как результата выполнения прикладной программы. Такая возможность реализуется на сервере WWW благодаря использованию интерфейса CGI (Common Gateway Interface).
CGI является механизмом выбора, обработки и форматирования информации. Спецификация CGI описывает формат и правила обмена данными между ПО веб-сервера и запускаемой программой.
В отличие от HTML, CGI не является языком описания документов - это стандарт. Он просто определяет, как Web-серверы передают информацию, используя приложения, исполняемые на сервере. Это способ расширения возможностей Web-сервера без преобразования его самого. Подобно тому, как Web-браузер обращается к вспомогательным приложениям для обработки информации, которую он не понимает, CGI предоставляет Web-серверу возможность переложить работу на другие приложения, такие как базы данных и средства поиска.
Для инициирования CGI необходимо, чтобы в запрашиваемом URL был указан путь к запускаемой программе. ПО веб-сервера исполняет эту программу, передаёт ей входные параметры и возвращает результаты её работы, как результат обработки запроса, клиенту. CGI-программой может являться любая программа локальной операционной системы сервера в двоичном виде или в виде программы для интерпретатора (Basic, SH, Perl и т.д.). С целью облегчения администрирования CGI-программ, а также для удовлетворения требованиям безопасности CGI-программы группируются в одном или нескольких явно указанных серверу каталогах. По умолчанию это каталог "cgi-bin" в иерархии серверных каталогов, однако, его имя и положение могут отличаться. Например, клиент, обращающийся к CGI-программе test-query, будет использовать URL http://<имя_сервера>/cgi-bin/test-query.
Интерфейс CGI позволяет расширить границы применения WWW-технологии. CGI-программа может обрабатывать сигналы с датчиков установок, взаимодействовать с мощным сервером баз данных и т.п.
ОСНОВНЫЕ СЕРВИСЫ ИНТЕРНЕТА
Интернет предоставляет пользователям различные услуги (сервисы).
Сервисом Интернета называют программу, выполняющую определённые функции для обеспечения работы пользователей в Интернете. Существует ряд способов работы с компьютерной сетью: получение информации с электронной доски объявлений; обмен электронной почтой; получение списков рассылки; участие в электронных форумах, конференциях и т.п.; участие телеконференциях; обмен текстовыми сообщениями в чатах; копирование файлов по протоколу FTP; использование WWW, использование интернет-телефонии и др.
По ряду причин невозможно их однозначно классифицировать. Основная из причин – уникальность каждого сервиса и одновременно неотделимость его от остальных. Большинство сервисов характеризуются свойствами, часть из которых объединяет их с одной группой сервисов, а другая часть – с другой группой.
Сервисом Интернета является и перенос с различных серверов и сайтов на компьютер пользователя необходимой ему информации для последующей обработки её на собственном ПК. Пользователь может переслать информацию любому абоненту сети или послать её на определённый сервер (сайт, портал) для размещения там на некоторое время. В этом случае обычно используют такие прикладные сервисы Интернета, как WWW, News и FTP.
Наиболее подходящим для классификации сервисов Интернет является деление на сервисы интерактивные, прямые и отложенного чтения. Эти группы объединяют сервисы по большому числу признаков.
Наиболее распространены, универсальны и наименее требовательны к ресурсам компьютеров и линиям связи сервисы, относящиеся к классу отложенного чтения. Основная особенность этой группы заключается в том, что запрос и получение информации могут быть достаточно сильно разделены по времени, что, вообще говоря, ограничивается только актуальностью информации на момент получения. К этому классу, например, относится электронная почта.
Сервисы прямого обращения характеризуются тем, что информация по запросу возвращается немедленно. Однако от получателя информации не требуется немедленной реакции.
Сервисы с немедленной реакцией на полученную информацию (в них получаемая информация является, по сути дела, запросом) относятся к интерактивным сервисам.
Электронная доска объявлений (Bulletin Board System, BBS) – один из первых сервисов Интернета, небольшая система с доступом по телефонным каналам связи, обычно предназначенная для местных пользователей. Как правило, это отдельная ЭВМ, к которой посредством телефонной сети могут обращаться другие пользователи. Им открыт доступ к части дискового пространства для записи в него информации (“объявлений”) или копирования информации из него.
Одним из первых сервисов Интернета было и создание режима удалённого терминала. Протокол TELNET предназначен для осуществления эмуляции удалённых машин, т.е. организации сеансов работы на удалённых машинах.
Это один из наиболее простых способов переноса локальных информационных систем в технологию Интернета, т.к. он не требует переделки баз данных и программного обеспечения, которое используется при доступе. Его использование позволяет отказаться от копирования системы на каждый из компьютеров пользователей и обеспечить централизованное управление информационным ресурсом. Он продолжает оставаться важным способом первичной организации доступа к локальным информационным системам через сеть. Сервис “telnet” позволяет войти в терминальный сеанс работы с удалённым компьютером. После ввода имени и пароля пользователь оказываетесь в режиме терминальной работы с удалённой машиной.
FTP (File Transfer Protocol) – протокол передачи файлов прикладного уровня, определяющий правила передачи файлов с одного компьютера на другой. С точки зрения применения он во многом аналогичен протоколу telnet. Это стандартная программа, работающая по протоколу TCP, всегда поставляющаяся с операционной системой и предназначенная для передачи файлов между разными компьютерами, работающими в сетях TCP/IP. При этом на одном из компьютеров работает программа-сервер, а на втором пользователь запускает программу-клиента, которая осуществляет соединение с сервером и передаёт или получает файлы по FTP протоколу. FTP-серверы нецентрализованны.
При рассмотрении FTP как сервиса Интернета имеется в виду не просто протокол, а сервис, обеспечивающий доступ к файлам в файловых архивах. Он позволяет переносить файлы с локального компьютера на удалённый и обратно. Этот сервис прямого доступа требует полноценного подключения к Интернету, но возможен доступ и через электронную почту.
FTP-сервер часто позволяет соединяться с ним не только под своим именем, но и под условным именем “anonymous” (аноним). В этом случае пользователю доступна не вся файловая система компьютера, а некоторый набор файлов на сервере, составляющий содержимое сервера anonymous FTP – публичного файлового архива.
FTP-архивы Интернета – огромный распределённый архив различных материалов: от программ до списков классической литературы. Чтобы присоединиться к этому распределённому архиву, необходимо создать и поддерживать свой FTP-сервер.
News (Usernet, Телеконференции)
Сетевые новости Usenet, в российских сетях принято называть телеконференциями. Телеконференции действуют на основе уставов: принятых участниками правил.
Usernet представляет тысячи иерархически организованных тематических групп, содержащих статьи. Статья – обычное электронное письмо, которое, в отличие от электронной почты, может прочитать любой, подписавшийся на группу, где размещено это письмо. Существуют глобальные иерархии (comp и др.) и локальные иерархии для какой-либо организации, страны или сети. К различным иерархиям применимы различные нормы и правила работы с ними. иерархии Так, в группы российской иерархии relcom лучше писать по-русски, а в группы глобальной иерархии comp можно писать только по-английски.
Правила работы помещаются в эти группы человеком, добровольно взявшим на себя обязанности координатора группы (модератора).
Группы новостей бывают двух типов: модерируемые и обычные. Сообщения, появляющиеся в модерируемых группах, до рассылки их по сети просматриваются модератором.
Разновидностью групп новостей являются списки рассылки (maillists) – простой, полезный сервис Интернета. Это практически единственный сервис, не имеющий собственного протокола и программы-клиента, работающий исключительно через электронную почту.
Суть этого сервиса заключается в том, что существует некоторый адрес электронной почты, общий для многих людей – подписчиков организованного на этом адресе списка рассылки. Письмо, посланное на этот адрес или адресованное подписчикам, становится доступным (рассылается) всем людям, подписанным на этот список рассылки, на их адреса электронной почты. Каждый список рассылки ведётся какой-то организацией, обладающей полным контролем над этим списком, в отличие от новостей Usenet, как правило, не принадлежащих никакой организации и менее управляемых. Группы Usenet могут быть доступны через списки рассылки и другими способами, например через WWW.
World Wide Web (WWW, Web или W3) – глобальная гипертекстовая информационная система, удобная оболочка традиционных приложений. WWW является информационной системой, которой весьма непросто дать корректное определение. Она может быть обозначена как: гипертекстовая, гипермедийная, распределённая, интегрирующая, глобальная система.
WWW интегрируется в среду сервисов Интернета. Это второй после FTP ресурс, который пользуется наибольшей популярностью среди пользователей Интернета. Большинство веб программ-клиентов (браузеры, навигаторы) являются программами-клиентами и таких сервисов, как: ftp, gopher, сетевые новости Usenet, электронная почта и т.д. Таким образом, программные веб средства универсальны для различных сервисов Интернета.
Вслед за FTP и World Wide Web следует электронная почта. По ней передаётся как текстовая, так и двоичная информация, которой являются программы, графические образы, видеоматериалы и звукозаписи.
Электронная почта (Electronic mail, E-mail) – специальный пакет программ для хранения и пересылки сообщений между пользователями ЭВМ; типичный сервис отложенного чтения (off-line).
Посредством электронной почты реализуется служба безбумажных почтовых отношений. Она является системой сбора, регистрации, обработки и передачи любой информации (текстовых документов, изображений, цифровых данных, звукозаписи и т.д.) по сетям ЭВМ и выполняет такие функции, как редактирование документов перед передачей, их хранение в специальном банке; пересылка корреспонденции; проверка и исправление ошибок, возникающих при передаче; выдача подтверждения о получении корреспонденции адресатом; получение и хранение информации в своем “почтовом ящике”; просмотр полученной корреспонденции.
“Почтовый ящик” – специально организованный файл для хранения корреспонденции. Он состоит из двух корзин: отправления и получения. Любой пользователь может обратиться к корзине получения другого пользователя и сбросить туда информацию. Но просмотреть её он не может. Из корзины отправлений почтовый сервер забирает информацию для рассылки другим пользователям. Каждый почтовый ящик имеет сетевой адрес. Для работы электронной почты используют выделенные компьютеры – “почтовые отделения”, называемые почтовыми серверами.
Пользователь передаёт сообщение вместе с адресом по телефонному каналу через модем на почтовый сервер в режиме on-line. Отправка адресату осуществляется по мере его выхода на связь с почтовым сервером в режиме off-line. Пересылка сообщений пользователю может выполняться в индивидуальном, групповом и общем режимах. С помощью двух последних режимов можно организовать телеконференцию, электронные доски объявлений.
С 1995 года в России активно используется доступ к ресурсам Интернета в режиме Dial-IP, т.е. доступ по протоколам TCP/IP через телефонную сеть. В качестве, транспорта используются протоколы SLIP (Serial Line Internet Protocol) и PPP (Point-to-Point Protocol).
Интернет-телефония предоставляет пользователям возможность разговаривать по телефону, используя технологии Интернета. Она позволяет с помощью компьютерной техники и телекоммуникаций в реальном времени организовать недорогую голосовую связь. IP-телефония – технология, основана на использовании Интернета или любой другой IP-сети для ведения междугородних и международных телефонных разговоров и передачи факсов в режиме реального времени. IP-телефония одно из наиболее сложных и системных приложений компьютерной телефонии. Голосовой трафик сообщений в сетях передачи данных (речь) передаётся в виде IP-пакетов между шлюзами в оцифрованном виде, а между шлюзом и аппаратом абонента – обычным способом. Данный вид работы называют также “службой пакетных голосовых сообщений”. Шлюз – компьютер и специальные устройства, оснащённые программой, преобразующей телефонный (звуковой) сигнал в коды (формат), передаваемые по сетям Интернета. Фактически шлюз является устройством, обеспечивающим доступ в сеть IP.
В Интернет существуют сервисы, использующие глобальную сеть в качестве среды передачи информации, например для проведения аудио- и видеоконференций; RealAudio (передача звука с сервера клиенту, позволяющая слушать текущий аудиофрагмент); для передачи видеоизображений с других компьютеров или с компьютера пользователя, если к нему присоединена видеокамера; для широковещательной передачи мультимедийной информации в глобальной сети и др.
Кроме достоинств Интернет обладает и недостатками.
Потребители и создатели Интернет услуг различным образом оценивают эти услуги. Существует система SLA (Service Level Agreement), характеризующая уровень поставляемой услуги. Предоставление услуг может быть связано и с иными негативными последствиями, например, слэммингом (slamming) и крэммингом (cramming).
Сламминг представляет собой подмену одного поставщика услуг телекоммуникаций другим без согласия клиента.
Крэмминг – тоже нелегальная практика, состоящая в том, что в счёт клиента добавляются услуги, не заказанные или аннулированные им. Как правило, эти услуги вновь возникают не в следующих счетах, которые обычно проверяются клиентами, а несколько счетов спустя.