Распределенная обработка данных

Распределённые системы обработки данных

Основные условия и требования к распределенной обработке данных
Такая отличительная особенность БД, как многоцелевое параллельное использование данных, предопределяет наличие средств, обеспечивающих практически одновременный и независимый доступ к одним и тем же данным. Причём сама база может быть размещена на одном или нескольких компьютерах.

Ведущими поставщиками СУБД сформулированные следующие свойства "идеальной" системы управления распределёнными БД:

Ни одна из существующих СУБД не смогла достигнуть этого идеала из-за ряда практических проблем, например, низкой, несбалансированной производительности сетей передачи данных, необходимости обеспечивать совместимость данных стандартного типа, для хранения которых в разных системах используются разные физические форматы и кодировки, необходимо обеспечивать совместимость СУБД разных типов и поставщиков и др.

Указанные причины определили на практике частичность и "этапность" введения в СУБД возможностей распределённой обработки данных. В простейшем случае пользователь по сети может обращаться к записям в БД, размещённым на других компьютерах. В других случаях СУБД производит аутентификацию удалённого клиента и устанавливает сетевые соединения.

Режимы работы с БД можно классифицировать по следующим признакам:

Общая тенденция развития технологий обработки данных соответствует этапам развития СВТ и ИТ, и в первую очередь - сетевых. В этом смысле выделяют два класса: системы распределённой обработки данных и системы распределённых баз данных.

Системы распределённой обработки данных в основном отражают структуру и свойства многопользовательских ОС с БД, размещённой на большом центральном компьютере (мэйнфрейме). До недавнего времени это был единственно возможный вариант вычислительной среды для реализации больших БД. Клиентские места в этом случае реализовались в виде терминалов или мини-ЭВМ, обеспечивающих в основном ввод-вывод данных и не имеющих собственных вычислительных ресурсов для функционально-ориентированной обработки получаемых данных.

Развитие сетевых технологий в сочетании с широким распространением персональных ЭВМ и внедрением стандартов открытых систем привело к появлению систем БД, размещённых в сети разнотипных компьютеров. Такие системы распределённых баз данных обеспечивают обработку распределённых запросов, когда при обработке одного запроса используются ресурсы базы, размещенные в сети на различных ЭВМ. Система распределённых БД состоит из узлов, каждый из которых является СУБД, а узлы взаимодействуют между собой так, что БД любого узла доступна пользователю, так как если бы она была для него локальной. Соответственно, программы, обеспечивающие целевую (функциональную) обработку данных, могут быть организованы так, чтобы обеспечивать более эффективное использование совокупных вычислительных ресурсов за счёт специализированного разделения функций обработки между центральным процессом СУБД и клиентскими функционально-ориентированными процедурами.

Использование объектно-ориентированного подхода позволяет свести проектирование открытой системы к оптимальному синтезу функционально независимых компонент (объектов), совместно выполняющих заданные функции системы с требуемой эффективностью, и позволяющих адаптировать систему к вновь появляющимся задачам за счёт набора специфических свойств (наследование и проч.). Таким образом, значительно снижаются затраты на разработку, внедрение и модификацию систем.

Распределенные базы данных, РБД (англ. "Distributed DataBase", DDB) представляют определенным образом связанные между собой БД, рассредоточенные на какой-либо территории (локально или регионально), обеспечивающие свободный обмен информацией и поиск данных в них. Такие БД могут располагаться на различных узлах компьютерной сети.
Выделяют однородные и неоднородные РБД. Часто данные размещаются в БД и СУБД по месту своего возникновения или наиболее эффективного использования в ЭВМ, удаленных друг от друга на большие расстояния, хотя каждая из этих ЭВМ управляет своими локальными СУБД. Возникает необходимость решения задач с распределенными БД путем организации между ЭВМ сети передачи данных по каналам связи, а также обеспечения технической и программной поддержки обмена данными между ними.

Для работы с распределенными данными создаются системы управления распределенными базами данных (СУРБД), оснащенные каталогами, хранящими структуру сети, информацию о локальных СУРБД и БД, а также программным обеспечением, управляющим взаимодействием прикладной программы и конкретной локальной БД сети. Управление однотипными локальными СУРБД осуществляется просто. В противном случае в сеть РБД включают различные программные и технические устройства, обеспечивающие единый интерфейс, согласование и возможность выполнения информационных процессов (промежуточную интерфейсную СУРБД, протокол Z39.50 и др.).

Распределенные банки данных
Накапливаемая в сетях разнообразная машиночитаемая информация обычно не концентрируется в какой-либо одной ЭВМ, а распределена по различным ЭВМ. Доступ в подобные РБД (банки) осуществляется специальными сетевыми СУБД, дающими возможность безадресного обращения к данным, подобно обычным БД, реализованным на одной ЭВМ. Зная логическую структуру БД сети, абонент формирует запрос к ней (на языке манипулирования данными), не заботясь о том, в каких именно ЭВМ сети расположены интересующие его данные.

Интерфейс с реальной физической структурой данных осуществляется СУБД автоматически через систему машинных каталогов. При этом не исключено, что окончательный ответ на запрос абонента будет сформирован из данных, хранящихся не в одной, а в нескольких (удаленных друг от друга) ЭВМ сети. Формирование ответа предусматривает многократные обмены между различными ЭВМ и автоматическое редактирование текста ответа. Эта работа производится под управлением операционной системы сети.


Сайт создан в системе uCoz