Основные понятия систем баз данных. Основные сведения о БД

22.03.2019

Основные понятия о базах данных и СУБД

Наименование параметра Значение
Тема статьи:
Рубрика (тематическая категория) Связь

Лекция 3. Тема 4.3 Представление об организации баз данных и системах управления базами данных.

1 Основные понятия о базах данных

2 СУБД Microsoft Access

Основные понятия о базах данных и СУБД

Информационная система (ИС) - ϶ᴛᴏ система, построенная на базе компьютерной техники, предназначенная для хранения, поиска, обработки и передачи значительных объёмов информации, имеющая определœенную практическую сферу применения.

База данных - ϶ᴛᴏ ИС, которая хранится в электронном виде.

База данных (БД) – организованная совокупность данных, предназначенная для длительного хранения во внешней памяти ЭВМ, постоянного обновления и использования.

БД служат для хранения и поиска большого объёма информации. Примеры баз данных: записная книжка, словари, справочники, энциклопедии и т.д.

Классификация баз данных:

1. По характеру хранимой информации:

- Фактографические – содержат краткие сведения об описываемых объектах, представленных в строго определённом формате (картотеки, н-р: БД книжного фонда библиотеки, БД кадрового состава учреждения),

- Документальные – содержат документы (информацию) самого разного типа: текстового, графического, звукового, мультимедийного (архивы, н-р: справочники, словари, БД законодательных актов в области уголовного права и др.)

2. По способу хранения данных:

- Централизованные (хранятся на одном компьютере),

- Распределœенные (используются в локальных и глобальных компьютерных сетях).

3. По структуре организации данных:

- Реляционные (табличные),

- Нереляционные.

Термин ʼʼреляционныйʼʼ (от лат. relatio – отношение) указывает на то, что такая модель хранения данных построена на взаимоотношении составляющих её частей. Реляционная база данных, по сути, представляет собой двумерную таблицу . Каждая строка такой таблицы принято называть записью. Столбцы таблицы называются полями: каждое поле характеризуется своим именем и типом данных. Поле БД - ϶ᴛᴏ столбец таблицы, содержащий значения определœенного свойства.

Свойства реляционной модели данных:

Каждый элемент таблицы – один элемент данных;

Всœе поля таблицы являются однородными, ᴛ.ᴇ. имеют один тип;

Одинаковые записи в таблице отсутствуют;

Порядок записей в таблице должна быть произвольным и может характеризоваться количеством полей, типом данных.

Иерархической принято называть БД, в которой информация упорядочена следующим образом: один элемент считается главным, остальные – подчинёнными. В иерархической базе данных записи упорядочиваются в определœенную последовательность, как ступеньки лестницы, и поиск данных может осуществляться последовательным ʼʼспускомʼʼ со ступени на ступень. Данная модель характеризуется такими параметрами, как уровни, узлы, связи. Принцип работы модели таков, что несколько узлов более низкого уровня соединяются при помощи связи с одним узлом более высокого уровня.

Узел – информационная модель элемента͵ находящегося на данном уровне иерархии.

Свойства иерархической модели данных:

Несколько узлов низшего уровня связано только с одним узлом высшего уровня;

Иерархическое дерево имеет только одну вершину (корень), не подчинœено никакой другой вершинœе;

Каждый узел имеет своё имя (идентификатор);

Существует только один путь от корневой записи к более частной записи данных.

Иерархической базой данных является Каталог папок Windows, с которым можно работать, запустив Проводник. Верхний уровень занимает папка Рабочий стол. На втором уровне находятся папки Мой компьютер, Мои документы, Сетевое окружение и Корзина, которые представляют из себяпотомков папки Рабочий стол, будучи между собой близнецами. В свою очередь, папка Мой компьютер – предок по отношению к папкам третьего уровня, папкам дисков (Диск 3,5(А:), С:, D:, E:, F:) и системным папкам (Принтеры, Панель управления и др.).

Сетевой принято называть БД, в которой к вертикальным иерархическим связям добавляются горизонтальные связи. Любой объект должна быть главным и подчинённым.

Сетевой базой данных фактически является Всемирная паутина глобальной компьютерной сети Интернет. Гиперссылки связывают между собой сотни миллионов документов в единую распределœенную сетевую базу данных.

Программное обеспечение, предназначенное для работы с базами данных, принято называть система управления базами данных (СУБД). СУБД используются для упорядоченного хранения и обработки больших объёмов информации.

Система управления базами данных (СУБД) - ϶ᴛᴏ система, обеспечивающая поиск, хранение, корректировку данных, формирование ответов на запросы. Система обеспечивает сохранность данных, их конфиденциальность, перемещение и связь с другими программными средствами.

Основные действия, которые пользователь может выполнять с помощью СУБД:

Создание структуры БД;

Заполнение БД информацией;

Изменение (редактирование) структуры и содержания БД;

Поиск информации в БД;

Сортировка данных;

Защита БД;

Проверка целостности БД.

Современные СУБД дают возможность включать в них не только текстовую и графическую информацию, но и звуковые фрагменты и даже видеоклипы.

Простота использования СУБД позволяет создавать новые базы данных, не прибегая к программированию, а пользуясь только встроенными функциями. СУБД обеспечивают правильность, полноту и непротиворечивость данных, а также удобный доступ к ним.

Популярные СУБД - FoxPro, Access for Windows, Paradox.

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, крайне важно различать собственно базы данных (БД) – упорядоченные наборы данных, и системы управления базами данных (СУБД) – программы, управляющие хранением и обработкой данных. К примеру, приложение Access, входящее в офисный пакет программ Microsoft Office, является СУБД, позволяющей пользователю создавать и обрабатывать табличные базы данных.

Принципы построения систем управления баз данных следуют из требований, которым должна удовлетворять организация баз данных:

- Производительность и готовность. Запросы от пользователя базой данных удовлетворяются с такой скоростью, которая требуется для использования данных. Пользователь быстро получает данные всякий раз, когда они ему необходимы.

- Минимальные затраты. Низкая стоимость хранения и использования данных, минимизация затрат на внесение изменений.

- Простота и легкость использования. Пользователи могут легко узнать и понять, какие данные имеются в их распоряжении. Доступ к данным должен быть простым, исключающим возможные ошибки со стороны пользователя.

- Простота внесения изменений. База данных может увеличиваться и изменяться без нарушения имеющихся способов использования данных.

- Возможностьпоиска. Пользователь базы данных может обращаться с самыми различными запросами по поводу хранимых в ней данных. Для реализации этого служит так называемый язык запросов.

- Целостность . Современные базы данных могут содержать данные, используемые многими пользователями. Очень важно, чтобы в процессе работы элементы данных и связи между ними не нарушались. Вместе с тем, аппаратные ошибки и различного рода случайные сбои не должны приводить к необратимым потерям данных. Значит, система управления данными должна содержать механизм восстановления данных.

- Безопасность и секретность. Под безопасностью данных понимают защиту данных от случайного или преднамеренного доступа к ним лиц, не имеющих на это права, от неавторизированной модификации (изменения) данных или их разрушения. Секретность определяется как право отдельных лиц или организаций решать, когда, как какое количество информации должна быть передано другим лицам или организациям.

Далее на примере одной из самых распространенных систем управления базами данных – Microsoft Access входит в состав популярного пакета Microsoft Office – мы познакомимся с основными типами данных, способами создания баз данных и с приемами работы с базами данных.

Основные понятия о базах данных и СУБД - понятие и виды. Классификация и особенности категории "Основные понятия о базах данных и СУБД" 2017, 2018.

Аннотация: В лекции рассматривается общий смысл понятий базы данных (БД) и системы управления базами данных (СУБД). Даются основные понятия, относящиеся к базе данных такие, как алгоритм, кортеж, объект, сущность. Основные требования, предъявляемые к банку данных. Определения БД и СУБД.

Цель лекции: Уяснить разницу между базой данных и системой управления базой данных. Ознакомиться с основными требованиями, которые предъявляются к банку данных и основными определениями, относящимися к БД и СУБД.

Рассмотрим общий смысл понятий базы данных (БД) и системы управления базами данных (СУБД).

С самого начала развития вычислительной техники образовались два основных направления использования ее.

Первое направление - применение вычислительной техники для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Становление этого направления способствовало интенсификации методов численного решения сложных математических задач, развитию класса языков программирования, ориентированных на удобную запись численных алгоритмов, становлению обратной связи с разработчиками новых архитектур ЭВМ.

Второе направление, это использование средств вычислительной техники в автоматических или автоматизированных информационных системах . В самом широком смысле информационная система представляет собой программный комплекс, функции которого состоят в поддержке надежного хранения информации в памяти компьютера, выполнении специфических для данного приложения преобразований информации и/или вычислений, предоставлении пользователям удобного и легко осваиваемого интерфейса. Обычно объемы информации, с которыми приходится иметь дело таким системам, достаточно велики, а сама информация имеет достаточно сложную структуру. Классическими примерами информационных систем являются банковские системы , системы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т.д.

На самом деле, второе направление возникло несколько позже первого. Это связано с тем, что на заре вычислительной техники компьютеры обладали ограниченными возможностями в части памяти. Понятно, что можно говорить о надежном и долговременном хранении информации только при наличии запоминающих устройств, сохраняющих информацию после выключения электрического питания. Оперативная память этим свойством обычно не обладает. В начале, использовались два вида устройств внешней памяти: магнитные ленты и барабаны. При этом емкость магнитных лент была достаточно велика, но по своей физической природе они обеспечивали последовательный доступ к данным. Магнитные же барабаны (они больше всего похожи на современные магнитные диски с фиксированными головками) давали возможность произвольного доступа к данным, но были ограниченного размера.

Легко видеть, что указанные ограничения не очень существенны для чисто численных расчетов. Даже если программа должна обработать (или произвести) большой объем информации, при программировании можно продумать расположение этой информации во внешней памяти, чтобы программа работала как можно быстрее.

С другой стороны, для информационных систем, в которых потребность в текущих данных определяется пользователем, наличие только магнитных лент и барабанов неудовлетворительно. Представьте себе покупателя билета, который стоя у кассы должен дождаться полной перемотки магнитной ленты. Одним из естественных требований к таким системам является средняя быстрота выполнения операций.

Именно требования к вычислительной технике со стороны не численных приложений вызвали появление съемных магнитных дисков с подвижными головками , что явилось революцией в истории вычислительной техники. Эти устройства внешней памяти обладали существенно большей емкостью, чем магнитные барабаны, обеспечивали удовлетворительную скорость доступа к данным в режиме произвольной выборки, а возможность смены дискового пакета на устройстве позволяла иметь практически неограниченный архив данных.

С появлением магнитных дисков началась история систем управления данными во внешней памяти. До этого каждая прикладная программа, которой требовалось хранить данные во внешней памяти, сама определяла расположение каждой порции данных на магнитной ленте или барабане и выполняла обмены между оперативной и внешней памятью с помощью программно-аппаратных средств низкого уровня (машинных команд или вызовов соответствующих программ операционной системы). Такой режим работы не позволяет или очень затрудняет поддержание на одном внешнем носителе нескольких архивов долговременно хранимой информации. Кроме того, каждой прикладной программе приходилось решать проблемы именования частей данных и структуризации данных во внешней памяти.

Историческим шагом стал переход к использованию систем управления файлами. С точки зрения прикладной программы файл - это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные. Правила именования файлов, способ доступа к данным, хранящимся в файле, и структура этих данных зависят от конкретной системы управления файлами и, возможно, от типа файла. Система управления файлами берет на себя распределение внешней памяти, отображение имен файлов в соответствующие адреса внешней памяти и обеспечение доступа к данным.

Любая задача обработки информации и принятия решений может быть представлена в виде схемы, показанной на рис. 1.1 .


Рис. 1.1.

Определение основных терминов

Дадим определения основных терминов. В качестве составных частей схемы выделяются информация (входная и выходная) и правила ее преобразования.

Правила могут быть в виде алгоритмов, процедур и эвристических последовательностей.

Алгоритм - последовательность правил перехода от исходных данных к результату. Правила могут выполняться компьютером или человеком.
Данные - совокупность объективных сведений.
Информация - сведения, неизвестные ранее получателю информации, пополняющие его знания, подтверждающие или опровергающие положения и соответствующие убеждения. Информация носит субъективный характер и определяется уровнем знаний субъекта и степенью его восприятия. Информация извлекается субъектом из соответствующих данных.
Знания - совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача.

Последовательность операций обработки данных называют информационной технологией (ИТ). В силу значительного количества информации в современных задачах она должна быть упорядочена. Существует два подхода к упорядочению.

  1. Данные связаны с конкретной задачей (технология массивов) - упорядочение по использованию. Вместе с тем алгоритмы более подвижны (могут чаще меняться), чем данные. Это вызывает необходимость переупорядочения данных, которые к тому же могут повторяться в различных задачах.
  2. В связи с этим предложена другая, широко используемая технология баз данных, представляющая собой упорядочение по хранению.

Под базой данных (БД) понимают совокупность хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений. Целью создания баз данных , как разновидности информационной технологии и формы хранения данных, является построение системы данных, не зависящих от принятых алгоритмов (программного обеспечения), применяемых технических средств и физического расположения данных в ЭВМ; обеспечивающих непротиворечивую и целостную информацию при нерегламентируемых запросах. БД предполагает многоцелевое ее использование (несколько пользователей, множество форм документов и запросов одного пользователя).

База знаний (БЗ) представляет собой совокупность БД и используемых правил, полученных от лиц, принимающих решения ( ЛПР ).

Наряду с понятием "база данных" существует термин " банк данных ", который имеет две трактовки.

  1. В настоящее время данные обрабатываются децентрализовано (на рабочих местах) с помощью персональных компьютеров (ПК). Первоначально же использовалась централизованная обработка на больших ЭВМ. В силу централизации базу данных называли банком данных и потому часто не делают различия между базами и банками данных.
  2. Банк данных - база данных и система управления ею (СУБД). СУБД (например, FoxPro) представляет собой приложение для создания баз данных как совокупности двумерных таблиц.
Банк данных (БнД) - это система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных.
Базы данных (БД) - это именованная совокупность данных, отображающая состояние объектов и их отношения в рассматриваемой предметной области. Характерной чертой баз данных является постоянство: данные постоянно накапливаются и используются; состав и структура данных, необходимы для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных могут меняться - но и это есть проявления постоянства - постоянная актуальность.
Система управления базами данных (СУБД) - это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

Иногда в составе банка данных выделяют архивы. Основанием для этого является особый режим использования данных, когда только часть данных находится под оперативным управлением СУБД. Все остальные данные обычно располагаются на носителях, оперативно не управляемых СУБД. Одни и те же данные в разные моменты времени могут входить как в базы данных, так и в архивы. Банки данных могут не иметь архивов, но если они есть, то в состав банка данных может входить и система управления архивами.

Эффективное управление внешней памятью являются основной функцией СУБД . Эти обычно специализированные средства настолько важны с точки зрения эффективности, что при их отсутствии система просто не сможет выполнять некоторые задачи уже по тому, что их выполнение будет занимать слишком много времени. При этом ни одна из таких специализированных функций не является видимой для пользователя. Они обеспечивают независимость между логическим и физическим уровнями системы: прикладной программист не должен писать программы индексирования, распределять память на диске и т. д.

Основные требования, предъявляемые к банкам данных

Развитие теории и практики создания информационных систем, основанных на концепции баз данных, создание унифицированных методов и средств организации и поиска данных позволяют хранить и обрабатывать информацию о все более сложных объектах и их взаимосвязях, обеспечивая многоаспектные информационные потребности разных пользователей. Основные требования, предъявляемые к банкам данных, можно сформулировать так:

  • Многократное использование данных: пользователи должны иметь возможность использовать данные различным образом.
  • Простота: пользователи должны иметь возможность легко узнать и понять, какие данные имеются в их распоряжении.
  • Легкость использования: пользователи должны иметь возможность осуществлять (процедурно) простой доступ к данным, при этом все сложности доступа к данным должны быть скрыты в самой системе управления базами данных.
  • Гибкость использования: обращение к данным или их поиск должны осуществляться с помощью различных методов доступа.
  • Быстрая обработка запросов на данные: запросы на данные должны обрабатываться с помощью высокоуровневого языка запросов , а не только прикладными программами, написанными с целью обработки конкретных запросов.
  • Язык взаимодействия конечных пользователей с системой должен обеспечивать конечным пользователям возможность получения данных без использования прикладных программ.

База данных - это основа для будущего наращивания прикладных программ: базы данных должны обеспечивать возможность быстрой и дешевой разработки новых приложений.

  • Сохранение затрат умственного труда: существующие программы и логические структуры данных не должны переделываться при внесении изменений в базу данных.
  • Наличие интерфейса прикладного программирования: прикладные программы должны иметь возможность просто и эффективно выполнять запросы на данные; программы должны быть изолированными от расположения файлов и способов адресации данных.
  • Распределенная обработка данных: система должна функционировать в условиях вычислительных сетей и обеспечивать эффективный доступ пользователей к любым данным распределенной БД, размещенным в любой точке сети.
  • Адаптивность и расширяемость: база данных должна быть настраиваемой, причем настройка не должна вызывать перезаписи прикладных программ. Кроме того, поставляемый с СУБД набор предопределенных типов данных должен быть расширяемым - в системе должны иметься средства для определения новых типов и не должно быть различий в использовании системных и определенных пользователем типов.
  • Контроль целостности данных: система должна осуществлять контроль ошибок в данных и выполнять проверку взаимного логического соответствия данных.
  • Восстановление данных после сбоев: автоматическое восстановление без потери данных транзакции. В случае аппаратных или программных сбоев система должна возвращаться к некоторому согласованному состоянию данных.
  • Вспомогательные средства должны позволять разработчику или
  • Лингвистические средства;
  • Программные средства;
  • Технические средства;
  • Организационно-административные подсистемы и нормативно-методическое обеспечение.

Организационно-методические средства - это совокупность инструкций, методических и регламентирующих материалов, описаний структуры и процедуры работы пользователя с СУБД и БД.

Пользователи БД и СУБД

Пользователей (СУБД) можно разделить на две основные категории: конечные пользователи ; администраторы баз данных .

Особо следует поговорить об администраторе базы данных (АБД). Естественно, что база данных строится для конечного пользователя (КП). Однако первоначально предполагалось, что КП не смогут работать без специалиста-программиста, которого назвали администратором базы данных. С появлением СУБД они взяли на себя значительную часть функций АБД, особенно для БД с небольшим объемом данных. Однако для крупных централизованных и распределенных баз данных потребность в АБД сохранилась. В широком плане под АБД понимают системных аналитиков, проектировщиков структур данных и информационного обеспечения, проектировщиков технологии процессов обработки, системных и прикладных программистов, операторов, специалистов в предметной области и по техническому обслуживанию. Иными словами, в крупных базах данных это могут быть коллективы специалистов. В обязанности АБД входит:

  1. анализ предметной области, статуса информации и пользователей;
  2. проектирование структуры и модификация данных;
  3. задание и обеспечение целостности;
  4. защита данных;
  5. обеспечение восстановления БД;
  6. сбор и статистическая обработка обращений к БД, анализ эффективности функционирования БД;
  7. работа с пользователем.

Краткие итоги

Базы данных (БД) - это именованная совокупность данных, отображающая состояние объектов и их отношения в рассматриваемой предметной области.

Система управления базами данных (СУБД) - это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

Основные требования, предъявляемые к банкам данных: многократное использование данных, простота, легкость использования, гибкость использования, быстрая обработка запросов на данные, язык взаимодействия.

Пользователей (СУБД) можно разделить на две основные категории: конечные пользователи; администраторы баз данных.

Вопросы для самопроверки

  • Дайте определение базы данных.
  • Дайте определение банка данных.
  • Назовите две трактовки банка данных.
  • Что такое система управления базой данных?
  • Основные требования, предъявляемые к банку данных.
  • Что такое данные, информация, знания?
  • Пользователи СУБД и БД?
  • Основные функции администратора БД.
  • Что обеспечивает возможность быстрой и дешевой разработки новых приложений?

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

БЕЗОПАСНОСТЬ СИСТЕМ БАЗ ДАННЫХ

Л екция 1. Основные понятия систем базы данных

База данных - совокупность данных, хранимых в соответствии со схемой данных, манипулирование которых осуществляется в соответствии с правилами средств моделирования данных.

База данных - совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, причём такое собрание данных, которое поддерживают одну или более областей применения.

СУБД - Это совокупность программ и лингвистических средств общего или специального назначения, обеспечивающих управление, создание и использование БД.

Классификация СУБД

I. По модели данных.

1. Иерархические;

2. Сетевые;

3. Реляционные;

4. Объектно-ориентированные;

5. Обьектно-реляционные;

II. По способу доступа БД.

1. Файлсерверный;

2. Клиентсерверный;

3. Встраиваемые.

Основные функции СУБД

1. Непосредственное управление файлами БД .

Обеспечение необходимых структур внешней памятью, как для хранения данных, непосредственно входящих в БД, так и для служебных целей (например, для ускорения поиска).

2. Управление буферами оперативной памяти .

СУБД обычно работают с БД значительного размера, и этот размер всегда больше доступной оперативной памяти, поэтому единственным доступным способом увеличения скорости производительности является буферизация данных в оперативной памяти, поэтому в развитых СУБД поддерживается собственный набор буферов оперативной памяти с собственной дисциплиной замены буферов.

3. Управление транзакциями .

Транзакция - последовательность операций над БД рассматриваемой СУБД, как единое целое. Либо транзакция успешно выполняется и СУБД фиксирует изменения в БД, произведенные этой транзакцией, либо ни одно из этих изменений никак не отображается на состоянии БД. Понятие транзакции необходимо для поддержания логической целостности БД.

4. Журнализация .

Одним из основных требований к СУБД является надёжность хранения данных во внешней памяти. Под надежностью хранения понимается то, что СУБД в состоянии восстановить последнее согласованное состояние БД после любого аппаратного или программного сбоя. Обычно рассматривают 2 вида аппаратных сбоев: 1) мягкий сбой, который можно трактовать как внезапную остановку компьютера; 2) жесткий сбой, который можно трактовать внезапным сбоем компьютера, который характеризуется потерей частью информации на внешних носителях. Журнал - особая часть БД, недоступная пользователям СУБД и поддерживаемая с особой тщательностью, в которую поступают записи обо всех изменениях в основной части БД.

5. Поддержка языков БД.

Для работы с БД используются специальные языки, называемые языками БД. В ранних версиях СУБД поддерживалось несколько языков, специализированных по выполняемым функциям. Обычно выделялось два: язык для выделения структур базы данных и язык манипулирования данными. Сейчас таким языком является TSQL .

Типовая организация современной СУБД

1. Ядро .

Отвечает за управление в СУБД данными во внешней памяти, управлением буферами оперативной памяти, управлением транзакциями и журнализацию. Можно выделить компоненты ядра: менеджер данных, буферов, транзакций, журналов.

2. Компилятор языка .

Основной функцией компилятора языка является компиляция операторов языка, под некоторой управляемой программой.

3. Утилиты БД .

В них выделяют такие процедуры, которые слишком накладно выполнять с использованием языка БД, такие как загрузка БД, глобальная загрузка целостности и так далее.

Лекция 2. Введение в реляционную модель данных

Реляционный подход к организации БД был заложен в конце 1960-х годов Эдгаром Коддом. В современности данных подход является одним из распространенных.

Достоинствами реляционного подхода являются:

Основан на небольшом числе интуитивно понятных абстракций, на основе которых возможно простое моделирование наиболее распространенных предметных областей. Эти абстракции могут быть точно и формально определены. Теоретическом базисом реляционного подхода служит аппарат теории множеств и математической логики. Реляционный подход обеспечивает возможность ненавигационного манипулирования данными без необходимости знания конкретной физической структуры базы данных во внешней памяти.

Основные понятия реляционных баз данных

1. Тип данных;

3. Атрибут;

4. Кортеж;

5. Отношение;

6. Первичный ключ.

Тип данных

Значения данных, хранимые в реляционной базе данных являются типизированными, то есть известен тип каждого хранимого значения. Понятие типа данных в реляционной модели полностью соответствует понятию типы данных языка программирования.

Домен

В общем виде домен определяется путем задания некоторого базового типа данных, к которому относятся элементы домена и произвольного логического выражения, применяемого элементу этого типа данных (ограничение домена). Элемент будет являться элементом домена только в том случае, если вычисления ограничения домена дает результат ИСТИНА. С каждым доменом связываются Имя уникальной среди имен всех доменов и соответствующей базе данных.

Заголовок отношения, кортеж, тело отношения, значение отношения, переменная отношения

Заголовком схемы отношения r отношение (Hr) называется конечное множество , где A - имя атрибута, Т обозначает имя некоторого базового типа или ранее определенного домена. По определению требуется, чтобы все имена атрибутов в заголовке были различны.

Кортежем tr соответствующим заголовку Hr называется множество упорядоченных триплетов вида: , где v должен являться допустимым значением типа данных или домена.

Телом Br называется произвольное множество кортежей tr.

Значением Vr называется пара множества Hr и Br. Заголовок и тело данных.

Первичный ключ

Первичным ключом является такое подмножество, которых что в любое время значение первичного ключа в любом кортеже тела отношения отличается от значения первичного ключа в любом другом кортеже тела этого отношения. А никакое собственное подмножество S этим свойством не обладает.

Фундаментальные свойства отношений

1. Отсутствие кортежей дубликатов. Это свойство следует из определения тела отношения как множество кортежей. В классической теории множеств по определению множество состоит из различных элементов. Именно из этого свойства вытекает наличие у каждого значения отношения первичного ключа. То есть у минимального множества атрибутов, являющегося подмножества заголовка данного отношения, составное значение которых уникально определяет кортеж отношения. Понятие первичного ключа является исключительно важным в связи с понятием целостности баз данных.

2. Отсутствие упорядоченности кортежей.

3. Отсутствие упорядоченности атрибутов.

4. Атомарность значения атрибутов. Значения всех атрибутов являются атомарными. Это следует из определения домена, как потенциального множества значений скалярного типа. То есть среди значений домена не могут содержаться значения с видимой структурой, в том числе множества значений. Главное в атомарности значений атрибутов состоит в том, что реляционная СУБД не должна обеспечивать пользователю явновидимой структуры внутренних данных.

Типы данных

Целые числа Строки символов Деньги Номера отделов

Домены (кроме первичного ключа)

Перв.ключ и номера проп-ов. Имена Размеры зарплат Номера отделов

Атрибуты

Лекция 3. Реляционная алгебра и нормализация

Базисные средства манипулирования реляционными данными составляющие определяются 2 базовых механизма манипулирования реляционными данными.

1) основанные на теории множеств реляционная алгебра и базирующиеся на мат. логике (на исчислении предикатов) реляционные исчисления. В свою очередь рассматривают два вида реляционного исчисления: исчисление доменов и предикатов. Все механизмы обладают одним важным свойством: они замкнуты относительно понятия отношения. Это означает, что выражения реляционной алгебры и формулы рел вычисления определяются над отношениями реляционной базы данных и результатом их выполнения также является отношения. Конкретный язык манипулирования рел. базами данных называется реляционно полным, если любой запрос, выражаемый с помощью одного выражения рел. алгебры или одной формулой реляционного исчисления может быть выражен с помощью одного оператора этого языка.

2) Осн. идея рел. алгебры в том, что отношения явл. множествами, то средствами манипулирования отношениями могут базироваться на традиционных теоретико-множественных операций, дополненными некоторыми специальными операциями, специфичными для БД.

В состав теоретико-множественных операций входят:

объединение

пересечение

разность

прямое произведение

Специальные операции:

ограничение отношений

проекция отношений

соединение отношений;

деление отношений;

Кроме того включают операцию присваивания, которые позволяют сохранить результаты алгебраических отношений, и операцию переименования, которая дает возможность корректно сформировать заголовок результирующего отношения.

Общая интерпретация рел. операций:

1) При выполнении операции объединения двух отношений, производится отношение, включающих все кортежи, входящее в хотя бы одно из отношений операндов.

2) Операция пересечений двух отношений производит отношение, включающее все кортежи, входящие в оба отношений операндов.

3) Отношение, являющееся разностью двух отношений, включает все кортежи, входящие в отношение первого операнда, такие что ни один из них не входит в отношение, являющимся вторым операндом.

4) При выполнении прямого произведения двух отношений производится отношение, кортежи которого являются... (сцеплением) кортежей первого и второго операнда.

5) Результатом ограничения отношений по некоторому условию является отношение, включающее кортежи отношения операнда, удовлетворяющие этому условию.

6) При выполнении проекции отношений на заданный набор атрибутов, ...... кортежи которого производятся путем взятия соответствующих значений, из кортежей отношения операнда.

7) При соединении двух отношений по некоторому условию образуется результирующее отношение, кортежи которого являются контетенацией (сцеплением) кортежей первого и второго отношения и удовлетворяет условию.

8) У операции деления два операнда: бинарные и унарные отношения. результирующее отношение состоит из одноатрибутного значения, включающее значение первого атрибута кортежей, первого операнда таких, что множество значений второго атрибута при фиксированном значении второго атрибута совпадает со множ. значений второго операнда.

9) Операция переименования производит отношение, тело которого совпадает с телом операнда, но имена атрибутов изменены.

Особенности теоретико-множественных операций реляционной алгебры. база данный компиляция реляционный

Понятие совместимости отношений об объединений

Два отношения совместимых по объединению только в том случае, когда обладают одинаковыми заголовками, более точно это означает, что в заголовках содержится один и тот же набор атрибутов, и одноименные атрибуты определены на одном и том же домене. Если два отношения почти совместимы по объединению, то есть во всем, кроме имен атрибутов, то их можно сделать полностью совместимыми, путем использования операции переименования.

Понятие совместимости по взятию расширенного прямого произведения. В том случае, если множество имен этих отношений не пересекаются. Все 4 теоретико-множественных операций рел. алгебры являются ассоциативными.

Специальные реляционные операции

Операция ограничения. Требует наличие двух операндов, ограничиваемых отношений и простого условного ограничения.

a comp-on b - ....

a comp-on const - литерально заданная константа

В результате выполнения операции ограничения производится отношение, заголовок которого совпадает с заголовком отношения операнда, а в тело входят те кортежи отношения операндов, для которых значением ограничения является TRUE.

Операция соединения отношений требует наличия двух операндов, соединяемых отношений и третьего операнда как и в операции соединения отношений она имеет такой же вид. Результатом операции соединения является отношение, получаемое путем выполнения операции путем ограничения по условию прямого произведения отношений a и b.

Операция деления отношений. Результатом деления а на b являются унарные отношения,состоящий из кортежей v таких что в отношении кортежей множество {w}включает множество значений...

Проектирование реляционных БД

При проектировании решаются две проблемы: каким образом отобразить предметно-объектные области в абстрактные модели данных, чтобы это отображение не противоречило семантике предметной области и было по возможности лучше, часто эту проблему называют проблему логического проектирования БД.

вторая - как обеспечить эффективность выполнения запросах в базе данных. Каким образом, имея особенности в конкретной субд расположить данные во внеш памяти и создание доп стр-р например индексов будет требоваться. Это проблема - проблема физ. проектирования бд.

Проектирование БД с использованием нормализации - классический подход, при котором весь процесс, весь процесс проектирования сводится в терминах реляционных моделей данных методом последовательных отношений к удовлетворительному набор схем отношений. Процесс проектирования представляет собой процесс нормализации схем отношений. Каждая след. нормальная форма обладает лучшими свойствами, чем предыдущая. В теории рел бд выделяется след послед-ть норм форм:

1 норм форма

2 норм форма

3 норм форма

Нормальная форма Бойса-Кодде

4 нормальная форма

5 нормальная форма или нормальная форма проекции соединения.

Основные свойства норм форм:

каждая след нф в некотором смысле лучше предыдущей.

при переходе к след нф свойства предыдущих нф сохраняются.

Определение 1. Функциональная зависимость в отношении r атрибут y функционально зависит от атрибута х только в том случае, если каждому значению х соответствует в точности одно значение у.

Полная функциональная зав-ть r(x) r(y) если y не зависит функционально от любого точного значения х.

Транзитивная зависимость если существует атрибут Z, что имеются функциональные зависимости...

Неключевой атрибут - любой атрибут отношения, невходящий в состав первичного ключа.

Взаимнонезависимые атрибуты (2 или более) - если не один из этих атрибутов не является функционально зависимым от других.

Отношение находится в 1нф тогда, когда каждый его кортеж содержит только одно значение для каждого из атрибутов. В реляц модели отношений все они находятся в нормальной форме.

вторая нормальная форма, только в том случае, когда она находится в первой нормальной форме и каждый неключевой атрибут полностью зависит от первичного ключа.

Третья нормальная форма. Отношение r находится в том случае, если она нах-ся во второй и каждый неключевой атрибут нетранзитивно зависит от первичного ключа.

СОТРУДНИК

ОТДЕЛ

ТЕЛЕФОН

БУХГАЛТЕР

БУХГАЛТЕР

СНАБЖЕНЕЦ

Лекция 4. Операторы языка SQL

SELECT служит для получения любого количества данных из одной или нескольких таблиц. В общем случае результатом выполнения предложения SELECT ЯВЛЯЕТСЯ ДРУГАЯ ТАБЛИЦА К этой новой таблице вновь может быть применена операция SELECT И так далее

1) Самостоятельная команда на получение и вывод строк в таблице, сформированной из столбцов и строк одной или нескольких таблиц представлений

2) как элемент WHERE или HAVING условия. Это называется ложным запросом

3) фраза выбора в командах CREATE VIEW DECLARE CURSOR INSERT

4) Средство присвоения глобальным переменным значений и строк сформированной таблицы. INTO

Имеет следующий формат.

SELECT [ выбрать данные и выполнить перед их выводом преобразования в соответствии с указанными выражениями и или функциями

Элемент, -\\-} FROM перечисление.......

базовая таблица | представления],

Строки из указанных таблиц должны соответствовать указанному перечню условий отбора строк

Фраза]

GROUP BY - операция по группировке по указанному перечню столбцов, с тем, чтобы получить для каждой группы единственное агрегированное значение.

HAVING - условие фильтрации по группам.

5. Простая выборка.

* служит псевдонимом для

выбор конкретного поля

Исключение дубликатов. Для исключения дубликатов и одновременного упорядочивания перечня применяется запрос с ключевым словом DISTINCT.

Выборка вычисляемых значений.

Фраза SELECT может содержать не только перечень столбцов, но и выражение.

Выборка с использованием фразы WHERE. В синтаксисе фразы для отбора нужных строк таблицы можно использовать базовые операторы сравнения. И возможность использования составных логических выражений.

WHERE P1 = 6 AND P2 = 8

Можно использовать BETWEEN для выборки значений в интервале.

BETWEEN удобно использовать при работе с данными задаваемыми интервалами, начало и конец, которые расположены в разных таблицах.

Использование оператора IN.

IN (3, 4, 5) <=> P1= 3 OR P1 = 4 OR P1 = 5

Использование LIKE

Данный оператор позволяет отыскать все значения указанного столбца, соответствующий образцу.

Заменяет любой одиночный символ.

% - заменяет любую последовательность из n символов.

Вовлечение неопределенного значения (NULL). Для проверки неопределенного значения используется IS.

Выборка с упорядочиванием. Для сортировки данных используется оператор ORDER BY. Можно упорядочить по возрастанию по умолчанию. Ключевое слово ASC позволит сортировать по убыванию.

Агрегирование данных

В SQL существует ряд стандартных функций. Кроме специального случая COUNT *, каждый из этих функций... столбца некоторой таблицы и создаёт несколько значений.

COUNT - количество значений в столбце

SUM - сумма значений в столбце

AVG - среднее значение в столбце

Столбец должен содержать числовые значения. Аргумент у всех функций кроме COUNT *, предшествует ключевое слово DISTINCT, указывающее...

А COUNT* служит для подсчета всех строк в таблице с дубликатами.

Если не используется фраза GROUP BY то в SELECT можно включать лишь SQL функции или выражения, содержащие такие функции.

Фраза GROUP BY

Инициирует перекомпоновку указанных во FROM таблицы по группам, каждая из которых имеет одинаковые значения в столбце, указанном в GROUP BY. Данная фраза не предполагает сортировки.

Фраза HAVING играет такую же роль для групп, что и WHERE для строк. Те используется для исключения групп.

Размещено на Allbest.ru

Подобные документы

    Современные базы данных – многофункциональные программные системы, работающие в открытой распределенной среде изучении администрирования базы данных. Способы организации внешней памяти баз данных. Системы управления базами данных для хранения информации.

    курсовая работа , добавлен 07.12.2010

    Основные понятия базы данных и систем управления базами данных. Типы данных, с которыми работают базы Microsoft Access. Классификация СУБД и их основные характеристики. Постреляционные базы данных. Тенденции в мире современных информационных систем.

    курсовая работа , добавлен 28.01.2014

    Понятие базы данных, её структура. Общие принципы хранения информации. Краткая характеристика особенностей иерархической, сетевой и реляционной модели организации данных. Structured Query Language: понятие, состав. Составление таблиц в Microsoft Access.

    лекция , добавлен 25.06.2013

    Преимущества и недостатки роботизированной сварки. Характеристика видов систем управления базами данных. Информационная модель сварочного робота, системы управления роботом сварочных клещей. Критерии выбора робота и структура запроса на выборку.

    курсовая работа , добавлен 22.12.2014

    Устройства внешней памяти. Система управления базами данных. Создание, ведение и совместное использование баз данных многими пользователями. Понятие системы программирования. Страницы доступа к данным. Макросы и модули. Монопольный режим работы.

    реферат , добавлен 10.01.2011

    Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция , добавлен 19.08.2013

    Характеристика категорий современных баз данных. Исследование особенностей централизованных и распределенных баз данных. Классификация систем управления базами данных по видам программ и применению. Управление буферами оперативной памяти и транзакциями.

    курсовая работа , добавлен 10.03.2016

    Классификации баз данных по характеру сберегаемой информации, способу хранения данных и структуре их организации. Современные системы управления базами данных и программы для их создания: Microsoft Office Access, Cronos Plus, Base Editor, My SQL.

    презентация , добавлен 03.06.2014

    Особенности управления информацией в экономике. Понятие и функции системы управления базами данных, использование стандартного реляционного языка запросов. Средства организации баз данных и работа с ними. Системы управления базами данных в экономике.

    контрольная работа , добавлен 16.11.2010

    Структура и функции системы управления базами данных (СУБД). Управление хранением данных и доступом к ним. Защита и поддержка целостности данных. Надежность хранения данных во внешней памяти. Классификация СУБД по способу доступа к базе данных.

База данных (БД), упорядоченная информационная система, в которой информация хранится в виде таблиц, управляется специально созданной системой управления базой данных (СУБД), состоящей из таблиц, запросов, форм, макросов и отчетов.

Понятие БД можно применить к любой информации, в которой имеются связанные по определенному признаку элементы, хранимой и организованной в виде таблиц, это некоторое подобие электронной картотеки, электронного хранилища данных, которое хранится в компьютере в виде одного или нескольких файлов. При этом возникает необходимость в выполнении ряда операций с БД, в частности: добавление новой информации в существующие файлы БД; добавление новых пустых файлов в БД; изменение (модификация) информации в существующих файлах БД; поиск информации в БД; удаление информации из существующих файлов БД; удаление файлов из БД.

Примерами информационных систем являются: системы заказа железнодорожных или авиационных билетов; банковские системы и многие другие.

Основным назначением БД в первую очередь является быстрый поиск содержащейся в ней информации; при значительном размере БД ручной поиск, а также модификация содержащейся информации занимает значительное время. Использование компьютера для обработки БД устраняет перечисленные выше проблемы при поиске и выборке информации. В этом случае ее модификация осуществляются достаточно быстро, эффективно, БД, состоящая из тысяч записей, может легко уместиться на дискете.

Обработка информации с помощью СУБД

Существует большое количество программ, которые предназначены для структурирования информации, размещения ее в таблицах и манипулирования имеющимися данными - такие программы и получили название СУБД. Основная особенность СУБД - это наличие средств для ввода и хранения не только самих данных, но и описаний их структуры. Если говорить более детально, то к функциям СУБД относят следующие:

  • - управление данными непосредственно БД - функция, обеспечивающая хранение данных, непосредственно входящих в БД, и служебной информации, обеспечивающей работу СУБД;
  • - управление данными в памяти компьютера - функция, связанная в первую очередь с тем, что СУБД работают с БД большого размера. В целях ускорения работы СУБД используется буферизация данных в оперативной памяти компьютера. При этом пользователь СУБД использует только необходимую для его конкретной задачи часть БД, а при необходимости получает новую "порцию" данных;
  • - управление транзакциями - функция СУБД, которая производит ряд операций над БД, как над единым целым. Как правило, такие операции производятся в памяти компьютера. В первую очередь транзакции необходимы для поддержания логической целостности БД в многопользовательских системах. Если транзакция (манипуляция над данными) успешно выполняется, то СУБД вносит соответствующие изменения в БД. В обратном случае ни одно из сделанных изменений никак не влияет на состояние БД;
  • - поддержка языков БД - для работы с БД используются специальные языки, в целом называемые языками баз данных. В СУБД обычно поддерживается единый язык, содержащий все необходимые средства - от создания БД до обеспечения пользовательского интерфейса при работе с данными. Наиболее распространенным в настоящее время языком СУБД является язык SQL (Structured Query Language).

Реляционная модель базы данных.

В последние годы в большинстве БД используются реляционные модели данных, и практически все современные СУБД ориентированны именно на такое представление информации. Реляционную модель можно представить как особый метод рассмотрения данных, который включает как собственно данные (в виде таблиц), так и способы работы и манипуляции с ними (в виде связей). Другими словами, в реляционной БД используется несколько таблиц, между которыми устанавливаются связи. Таким образом, информация, введенная в одну таблицу, может быть связана с одной или несколькими записями из другой таблицы.

Между записями двух таблиц (например, таблиц А и В) могут существовать следующие основные виды связей:

  • - "один к одному" (каждой записи из А соответствует одна определенная запись из В, например, работник получает зарплату, и только одну);
  • - "один ко многим" (каждой записи из А соответствует несколько записей из В, например, в доме проживает много жильцов);
  • - "многие к одному" (множеству записей из А соответствует одна определенная запись из В, например, несколько студентов учатся в одной группе);
  • - "многие ко многим" (множеству записей из А соответствует множество записей из В, например, у нескольких студентов занятия ведут разные преподаватели).

Важным понятием в теории реляционных БД является нормализация, принципы которой можно сформулировать в виде следующих основных правил, используемых при разработке структуры БД:

  • 1. В каждом поле таблицы должен находиться уникальный вид информации, т.е. в одной и той же таблице не должны находиться повторяющиеся поля.
  • 2. В каждой таблице должен быть первичный ключ или уникальный идентификатор, который однозначно определяет данную запись среди множества записей таблицы.
  • 3. Каждому значению первичного ключа должна соответствовать исчерпывающая информация об объекте таблицы.
  • 4. Изменение значения любого поля таблицы, не входящего в состав первичного ключа, не должно влиять на информацию в других ее полях.

Microsoft Access является СУБД реляционного типа. Достоинством Access является то, что она имеет очень простой графический интерфейс, который позволяет грамотному пользователю (не программисту) не только создавать собственные базы данных, но и разрабатывать приложения различной степени сложности. СУБД Access применяется в тех случаях, когда прикладная задача требует хранения и обработки разнородной информации о большом количестве объектов и предполагает возможность многопользовательского режима. Примером может служить задача ведения складского учета.

Работа с базой данных

Работа с БД делится на три этапа:

  • 1. Проектирование
  • 2. Программная реализация
  • 3. Эксплуатация

На этапе проектирования закладываются основы будущей БД. Проектирование проводится на бумаге и требует очень тщательного подхода, так как именно здесь разрабатывается БД. Необходимо проделать следующие действия:

  • - собрать информацию о будущей работе, о ее структуре и движении документов, изучить задачи автоматизации, определить объекты системы и связи между ними;
  • - для каждого объекта выявить свойства и характеристики, по которым создаются поля таблиц;
  • - для каждого объекта назначить ключевые поля (первичные ключи), провести нормализацию исходных таблиц, установить связи.

Этап реализации выполняется на компьютере в следующем порядке:

  • - составляются структуры таблиц и вводятся в компьютер;
  • - разрабатываются запросы для отбора данных, отчеты для печати, создаются макросы и экранные формы для работы с данными;
  • - планируется порядок ведения и поддержания БД в рабочем состоянии.

Этап эксплуатации начинается с внесения в БД реальной информации, после чего происходит ее использование.

Как отмечалось, БД в простейшем случае представляется в виде системы двумерных таблиц. Таблицы могут быть представлены в ПК либо в виде отдельных файлов, либо размещаться в одном файле.

Файл – информация, хранимая на электронном носителе после завершения отдельных заданий и рассматриваемая в процессе обработки как единое целое. Файл имеет имя и требует некоторого объема памяти носителя, в качестве которого может выступать дискета, винчестер, компакт-диск (CD).

Поле – столбец файлового документа (таблицы). Имя поля часто называют атрибутом.

Домен – совокупность значений одного поля.

Универсум – совокупность значений всех полей.

Запись – строка документа. Следует отметить, что это понятие неоднозначно. В реляционной модели данных запись – строка таблицы, в сетевой модели данных – элемент структуры, аналогичный примерно таблице в реляционной модели данных.

Запись логическая – поименованная совокупность данных, рассматриваемая пользователем как одно целое.

Запись физическая (совокупность данных записываемых/считываемых одним блоком) характеризует расположение данных в физической памяти ПК.

Ключ – поле с уникальными (неповторяющимися) записями, используемое для определения места расположения записи. Ключ может состоять из совокупности полей (составной ключ), называемых суперключом.

Выделенный ключ – ключ, явно перечисленный вместе с реляционной схемой. В противном случае говорят о неявном ключе. Вводят и такие понятия как возможный ключ (ключ-кандидат), если любой из нескольких наборов полей может быть принят за составной ключ. Один из выделенных ключей называют первичным. При работе с несколькими связанными таблицами говорят о родительском ключе главной таблицы и внешнем ключе подчиненной таблицы. Иногда ключ называют идентификатором – атрибутом, значения которого однозначно определяют экземпляры объекта предметной области.

Предметная область – отражение в БД совокупности и объектов реального мира с их связями, относящимися к некоторой области знаний и имеющих практическую ценность для пользователя. Понятие "идентификатор" используется и в физической базе данных.

Указатель – идентификатор, который ведет к заданной записи из какой-то другой записи в физической базе данных. Здесь запись – некоторый блок данных в памяти компьютера.

Приведем перечень используемых в дальнейшем терминов, детальное пояснение которых проводится в последующих разделах данной работы.

Администратор базы данных (АБД) – лицо, отвечающее за выработку требований к БД, ее проектирование, реализацию, эффективное использование и сопровождение.

Архитектура – разновидность (обобщение) структуры, в которой какой-либо элемент может быть заменен на другой элемент, характеристики входов и выходов которого идентичны первому элементу. Понятие "принцип открытой архитектуры" используется при построении компьютера. Этот принцип означает, что вместо принтера одной марки (например, Epson) к компьютеру может быть подключен принтер другого типа (например, Hewlett Packard).

Безопасность – защита от преднамеренного или непреднамеренного нарушения секретности, искажения или разрушения.

Блокировка – неделимая операция, которая позволяет только одному процессу иметь доступ к совместно используемому ресурсу.

Вид (View) – таблица, вычисленная с помощью навигационной операции на основе исходной таблицы (таблиц). Вид может использоваться почти по тем же правилам, что и исходная таблица.

Внешняя схема – описание данных на концептуальном уровне. Как отмечалось, в реляционной БД порядок расположения полей (столбцов) таблицы безразличен. Однако для реализации следует выбрать вполне определенный порядок (схему). Чаще всего ключевые поля располагают в начале схемы.

Внутренняя схема – описание данных на физическом уровне.

Время доступа – промежуток времени между выдачей команды записи (считывания) и фактическим получением данных.

Время отклика – промежуток времени от момента запроса к БД до фактического получения данных.

Даталогическая модель – модель логического уровня, представляющая собой отображение логических связей безотносительно к их содержанию и среде хранения.

Доступ – операция поиска, чтения данных или записи их.

Задание (работа) – программа или совокупность программ и преобразуемые этими программами данные.

Защита данных – противостояние базы данных несанкционированному доступу, преднамеренному искажению или разрушению информации.

Индекс – совокупность указателей, содержащих информацию о местоположении записи. Для ускорения поиска полям сопоставляют уникальный набор (числовой или символьный). Индекс может быть представлен и несколькими полями. Если при построении БД заданы индексы, то для поиска сначала их и используют. Если индексов нет, то может проводиться длительный поиск путем перебора данных.

Концептуальный – определение, относящееся к обобщенному представлению данных, независимому от СУБД. При проектировании БД выделяют концептуальную, логическую и физическую базы данных (модели), определение которых приведено позднее.

Кортеж – совокупность полей или запись (строка).

КОДАСИЛ (CODASIL) – набор стандартов для сетевых баз данных.

Логический – определение, относящееся к представлению или описанию данных, не зависящему от запоминающей среды или вычислительной системы, однако "привязанное" к выбранной СУБД.

Машина баз данных (МБД) – вспомогательный периферийный процессор, выполняющий функции СУБД.

Метаданные – данные о данных, описание информационных ресурсов, их характеристик, местонахождения, способов использования и т. д. Например, перечень таблиц с характеристиками каждой из них (имя, объем памяти и другие параметры).

Многозначная зависимость (MV-зависимость, зависимость 1:М) – для подсхем X, Y, Z, принадлежащих схеме R, Z = R – (XY) и кортежей t2(X) = t1(Х) и t3(Y) = t1(Y) справедливо t3(Z) = t1(Z) и t3(Z) = t2(Z).

Модель данных – средство абстракции, позволяющее видеть информационное содержание (обобщенную структуру), а не их конкретные значения. Выделяют, как отмечалось, иерархическую, сетевую, реляционную, объектно-ориентированную, объектно-реляционную и многомерную модели данных.

Навигация – операция, результат которой представлен единым объектом, полученным при прохождении пути по логической структуре БД. Иными словами, операция получения новой таблицы из полей связанных таблиц.

Независимость данных – возможность изменения логической и физической структуры БД без изменения представлений пользователя.

Объект – термин, обозначающий факт, лицо, событие, предмет, о котором могут быть собраны данные. В реляционных СУБД выделяют такие основные объекты, как таблицы, формы, запросы, отчеты, макросы, модули.

Объектно-ориентированное программирование – методология программирования, основанная на представлении программ в виде связанной совокупности объектов, каждый из которых является экземпляром определенного класса, а классы образуют иерархию по наследованию.

Объектно-ориентированное проектирование – методология проектирования, соединяющая в себе процесс объектной декомпозиции и приемы представления логических и физических, а также статических и динамических моделей проектируемой системы.

Отношение r на множествах (доменах) S1, ..., Sn – подмножество декартова произведения S,& ... &Sn. Понятие "отношение" является основным в реляционных БД. Пусть имеется таблица с двумя полями S1 и S2 по два значения в каждом (S1 = {al, а2} и S2 = {bl, b2}, т. е. в каждом домене по два значения). "Полная" таблица имеет четыре возможных записи (al, bl; al, b2; а2, М; а2, b2), которые и образуют декартово произведение. Отношением является и часть этой таблицы (например, al, bl; а2, b1). Отношение может быть и составным: r – (r1, ..., rn), составленным, например, из нескольких связанных таблиц.

Подсхема – описание логического представления пользователя данной группы. Иными словами, это схема отдельного пользователя БД, если их несколько. Из подсхем может быть составлена схема БД (для всех пользователей). Нетрудно видеть, что при наличии одного пользователя подсхема является схемой.

Программа – полное и точное описание алгоритма на некотором формальном языке программирования.

Процедура – некоторая подпрограмма.

Распределенная база данных (РЕД) – единая БД, представленная в виде отдельных (возможно, избыточных и перекрывающихся) разделов на разных вычислительных средствах.

Связь – ассоциация между экземплярами примитивных или агрегированных объектов (записей) данных.

Семантика – часть языка, касающаяся указания смысла и действия текста, составленного в соответствии с синтаксическими правилами. Действия текста относится к операторам на некотором языке программирования.

Синтаксис – правила, определяющие разрешенные языковые конструкции, а также последовательности расположения символов в программе.

Система баз данных – совокупность СУБД, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Система управления базой данных (СУБД) – совокупность программных средств, обеспечивающих управление БД на всех уровнях.

Системный журнал – журнал регистрации всех изменений БД.

Словарь данных – набор обобщенных описаний данных БД, обеспечивает логически централизованное хранение метаданных.

Спецификация – операция, результатом которой является новая структура, построенная на основе структур базы данных.

Структура – совокупность элементов и нх связей.

Сущность – примитивный объект данных, отображающий элемент предметной области (человек, место, вещь и т. д.).

Схема данных – описание логической структуры данных, специфицированное на языке описания данных и обрабатываемое СУБД. Дело в том, что в общем случае поля таблицы (отношения) могут располагаться в произвольном порядке (семейство отношений). Для конкретного пользователя и в конкретной БД должен быть выбран и зафиксирован только один вариант порядка. Этот вариант называют схемой (пользователя).

Транзакция – процесс изменения файла или БД, вызванный передачей одного входного сообщения. Это сообщение (команду) часто тоже называют транзакцией.

Функциональная зависимость (F-зависимость, зависимость 1:1): схема Y функционально зависит от X, если для кортежей t,(X) = t2(X), справедливо t1(Y) = t2(Y), причем схемы X и Y могут принадлежать схеме R.

Хранимая запись – совокупность связанных элементов данных, соответствующая одной или нескольким логическим записям и содержащая все необходимые служебные данные.

Хранилище данных – предметно-ориентированный, интегрированный, привязанный ко времени и неизменный набор данных, предназначенный для поддержки принятия решений.

Целостность данных – устойчивость хранимых данных к разрушению (уничтожению), связанному с неисправностями технических средств, системными ошибками и ошибочными действиями пользователей.

Элемент данных наименьшая единица данных, имеющая смысл при описании информации; наименьшая единица поименованных данных.

Экземпляр – отдельный экземпляр объекта, записи, элемента данных.

Язык базы данных общий термин, относящийся к классу языков, которые используются для определения и обращения к базам данных.

Язык манипулирования данными (ЯМД) командный язык, обеспечивающий доступ к содержимому БД и его обработку. Обработка предполагает вставку, удаление и изменение данных (операции обновления).

Язык описания данных (ЯОД) – предназначен для описания данных на концептуальном, логическом и физическом уровнях на основе соответствующих схем. Речь идет о командах по формированию структуры (шапки) таблиц и связей между ними. Эти операции могут быть обеспечены визуальным языком программирования QBE или директивным языком программирования SQL.

Язык запросов – высокоуровневый язык манипулирования данными, обеспечивающий взаимодействие пользователей с БД. Язык запросов предполагает выборку данных.

Следует отметить, что три группы операций с БД (описание, манипулирование, запрос) совмещены в языке SQL, а в некоторых СУБД – и в языке QBE.

Исходным элементом базы данных является таблица, структурные составляющие которой – поле и запись. Можно выделить две разновидности структуры таблиц: линейную и нелинейную. В линейной структуре поля располагаются последовательно друг за другом в произвольном порядке (табл. 1.11). В силу произвольности порядка для данной, конкретной реализации следует закрепить определенный вариант, называемый схемой пользователя.

Таблица 1.11

Таблица данных о кафедре

В нелинейной структуре выделяется понятие "агрегат", являющийся как бы таблицей в таблице (табл. 1.12). Агрегат может быть двух видов: вектор и повторяющиеся поля. Возможности реализации структур таблиц зависят от выбранной модели данных (МД). Реляционная и иерархическая модели данных реализуют только линейную структуру, тогда как сетевая и объектно-ориентированная модели позволяют использовать и нелинейную структуру. Особенности конкретной реализации определяются классами БД и СУБД.

Таблица 1.12

Таблица данных о студентах