Базы данных: SQL


Понимание SQL. Введение В Реляционную Базу Данных



  Источник:

В В Е Д Е Н И Е

SQL ( ОБЫЧНО ПРОИЗНОСИМАЯ КАК "СИКВЭЛ" ) символизирует собой Структурированный Язык Запросов. Это - язык который дает вам возможность создавать и работать в реляционных базах данных, которые являются наборами связанной информации сохраняемой в таблицах.

Мир баз данных становится все более и более единым, что привело к необходимости создания стандартного языка, который мог бы использоваться для функционирования в большом количестве различных видов компьютерных сред. Стандартный язык позволит пользователям, знающим один набор команд, использовать их, чтобы создавать, отыскивать, изменять, и передавать информацию, независимо от того, работают ли они на персональном компьютере, сетевой рабочей станции, или на универсальной ЭВМ.

В нашем все более и более взаимосвязанном компьютерном мире, пользователь снабженный таким языком, имеет огромное преимущество в использовании и обобщении информации из ряда источников с помощью большого количества способов.

Элегантность и независимость от специфики компьютерных технологий, а также его поддержка лидерами промышленности в области технологии реляционных баз данных, сделало SQL, и вероятно в течение обозримого будущего оставит его, основным стандартным языком. По этой причине, любой кто хочет работать с базами данных 90-х годов должен знать SQL.

Стандарт SQL определяется ANSI (Американским Национальным Институтом Стандартов) и в данное время также принимается ISO (Международной организацией по стандартизации). Однако, большинство коммерческих программ баз данных расширяют SQL без уведомления ANSI, добавляя разные другие особенности в этот язык, которые, как они считают, будут весьма полезны.
Иногда они несколько нарушают стандарт языка, хотя хорошие идеи имеют тенденцию развиваться и вскоре становиться стандартами "рынка" сами по себе в силу полезности своих качеств.

В этой книге, мы будем, в основном, следовать стандарту ANSI, но одновременно иногда будет показывать и некоторые наиболее общие отклонения от его стандарта.

Вы должны проконсультироваться с документацией вашего пакета программ который вы будете использовать, чтобы знать где в нем этот стандарт видоизменен.

ПРЕЖДЕ, ЧЕМ ВЫ СМОЖЕТЕ ИСПОЛЬЗОВАТЬ SQL, ВЫ должны понять что такое реляционные базы данных.
В этой главе, мы это объясним, и покажем насколько реляционные базы данных полезны. Мы не будем обсуждать SQL именно здесь, и если вы уже знаете эти понятия довольно хорошо, вы можете просто пропустить эту главу.
В любом случае, вы должны рассмотреть три таблицы которые предоставляются и объясняются в конце главы; они станут основой наших примеров в этой книге. Вторая копия этих таблиц находится в Приложении E, и мы рекомендуем скопировать их для удобства ссылки к ним.


ЧТО ТАКОЕ - РЕЛЯЦИОННАЯ БАЗА ДАННЫХ?

Реляционная база данных - это тело связанной информации, сохраняемой в двухмерных таблицах. Напоминает адресную или телефонную книгу.

В книге имеется большое количество входов, каждый из которых соответствует определенной особенности. Для каждой такой особенности, может быть несколько независимых фрагментов данных, например имя, телефонный номер, и адрес. Предположим, что вы должны сформатировать эту адресную книгу в виде таблицы со строками и столбцами. Каждая строка ( называемая также записью ) будет соответствовать определенной особенности; каждый столбец будет содержать значение для каждого типа данных - имени, телефонного номера, и адреса представляемого в каждой строке. Адресная книга могла бы выглядеть следующим образом:

Имя Телефон Адрес
Gerry Farish (415)365-8775 127 Primrose Ave.,SF
Celia Brock (707)874-3553 246 #3rd St.,Sonoma
Yves Grillet (762)976-3665 778 Modernas,Barcelona

То, что вы получили, является основой реляционной базы данных как и было определено в начале этого обсуждения - а именно, двухмерной (строка и столбец) таблицей информации.
Однако, реляционные базы данных редко состоят из одной таблицы. Такая таблица меньше, чем файловая система. Создав несколько таблиц взаимосвязанной информации, вы сможете выполнить более сложные и мощные операции с вашими данными. Мощность базы данных зависит от связи, которую вы можете создать между фрагментами информации, а не от самого фрагмента информации.


СВЯЗЫВАНИЕ ОДНОЙ ТАБЛИЦЫ С ДРУГОЙ

Позвольте нам использовать пример нашей адресной книги чтобы начать обсуждение базы данных которая может реально использоваться в деловой ситуации. Предположим, что персонажи в нашей первой таблице ( адресной книги ) - это пациенты больницы. В другой таблице, мы могли бы запомнить дополнительную информацию об этих пациентах. Столбцы второй таблицы могли бы быть помечены как Пациент, Доктор, Страховка, и Баланс.

   Пациент   Доктор    Страховка    Баланс 
 
   Farish    Drume     B.C./B.S.    $272.99 
 
   Grillet   Halben    None         $44. 76 
 
   Brock     Halben    Health,Inc.  $9077.47 
 
Много мощных функций можно выполнить извлекая информацию из этих таблиц согласно указанным параметрам, особенно когда эти параметры включают в себя фрагменты информации связанные в различных таблицах друг с другом. Например, возьмем - докторов. Предположим доктор Halben захотел получить номера телефонов всех своих пациентов. Чтобы извлечь эту информацию, он мог бы связать таблицу с номерами телефонов пациентов ( по адресной книге ) с таблицей которая бы указывала, какой из пациентов - его. Хотя, в этом простом примере, он мог бы держать это в голове и сразу получать номера телефонов пациентов Grillet и Brock, эти таблицы могут быть слишком большими и слишком сложными. Программы реляционной базы данных разрабатывались для того чтобы обрабатывать большие и сложные совокупности данных такого типа, что очевидно является более универсальным методом в деловом мире. Даже если бы база данных больницы содержала сотни или тысячи имен - как это вероятно и бывает на практике - одна команда SQL могла бы выдать доктору Halben информацию в которой он нуждался почти немедленно.


ПОРЯДОК СТРОК ПРОИЗВОЛЕН

Чтобы поддерживать максимальную гибкость, строки таблицы, по определению, не должны находиться ни в каком определенном порядке. С этой точки зрения, в этом структура базы данных отличается от нашей адресной книги.

Вход в адресную книгу обычно упорядочивается в алфавитном порядке. В системах с реляционной базой данных, имеется одна мощна возможность для пользователей - это способность упорядочивать информацию так чтобы они могли восстанавливать ее.

Рассмотрим вторую таблицу. Иногда Вам необходимо видеть эту информацию упорядоченной в алфавитном порядке по именам, иногда в возрастающем или убывающем порядке, а иногда сгруппированной по отношению к какому-нибудь доктору. Наложение порядка набора в строках будет сталкиваться со способностью заказчика изменять его, поэтому строки всегда рассматриваются как неупорядоченные. По этой причине, вы не можете просто сказать:" Мы хотим посмотреть пятую строку таблицы. " Пренебрегая порядком в котором данные вводились или любым другим критерием, мы определим, не ту строку, хотя она и будет пятой. Строки таблицы которые рассматриваются, не будут в какой-либо определенной последовательности.


ИДЕНТИФИКАЦИЯ СТРОК ( ПЕРВИЧНЫЕ КЛЮЧИ )

По этим и другим причинам, вы должны иметь столбец в вашей таблице который бы уникально идентифицировал каждую строку. Обычно, этот столбец содержит номер - например, номер пациента назначаемый каждому пациенту. Конечно, вы могли бы использовать им пациентов, но возможно что имеется несколько Mary Smiths; и в этом случае, вы не будете иметь другого способа чтобы отличить этих пациентов друг от друга.

Вот почему номера так необходимы. Такой уникальный столбец (или уникальна группа столбцов ), используемый чтобы идентифицировать каждую строку и хранить все строки отдельно, называются - первичными ключами таблицы.

Первичные ключи таблицы важный элемент в структуре базы данных. Они - основа вашей системы записи в файл; и когда вы хотите найти определенную строку в таблице, вы ссылаетесь к этому первичному ключу. Кроме того, первичные ключи гарантируют, что ваши данные имеют определенную целостность. Если первичный ключ правильно используетс и поддерживаетс, вы будете знать что нет пустых строк таблицы и что кажда строка отличаетс от любой другой строки. Мы будем обсуждать ключи и далее когда поговорим относительно справочной целостности в Главе 19.


СТОЛБЦЫ ИМЕНУЮТСЯ И НУМЕРУЮТСЯ

В отличие от строк, столбцы таблицы ( также называемые полями ) упорядочиваются и именуются. Таким образом, в нашей таблице адресной книги, возможно указать на " адрес столбца " или на " столбец 3 ". Конечно, это означает что каждый столбец данной таблицы должен иметь уникальное им чтобы избежать неоднозначности. Лучше всего если эти имена указывают на содержание пол. В типовых таблицах этой книги, мы будем использовать такие сокращения для имени столбца, как cname для имени заказчика, и odate для даты порядка. Мы также дадим каждой таблице личный числовой номер столбца в качестве первичного ключа. Следующий раздел будет объяснять эти таблицы и их ключи более подробно.


ТИПОВАЯ БАЗА ДАННЫХ

Таблицы 1.1, 1.2, и 1.3 составляют реляционную базу данных которая является минимально достаточной чтобы легко ее отслеживать, и достаточно полной, чтобы иллюстрировать главные понятия и практику использования SQL. Эти таблицы напечатаны в этой главе а также в Приложении E.

Так как они будут использоваться для иллюстрирования различных особенностей SQL по всей этой книге, мы рекомендуем чтобы вы скопировали их, для удобства ссылки к ним.

Вы могли уже обратить внимание что первый столбец каждой таблицы содержит номера чьи значения различны для каждой строки. Как вы наверное и предположили, это - первичные ключи таблиц. Некоторые из этих номеров также показаны в столбцах других таблиц. В этом нет ничего неверного. Они показывают связь между строками которые используют значение принимаемое из первичного ключа, и строками где это значение используется в самом первичном ключе.

Таблица 1.1:     Продавцы 
 
      ---------------------------------------------- 
        SNUM  |   SNAME   |  CITY        |   COMM 
      --------|-----------|--------------|---------- 
        1001  |  Peel     |  London      |    .12 
        1002  |  Serres   |  San Jose    |    .13 
        1004  |  Motika   |  London      |    .11 
        1007  |  Rifkin   |  Barcelona   |    .15 
        1003  |  Axelrod  |  New York    |    .10 
       --------------------------------------------- 
 
 
Таблица 1.2:     Заказчики 
 
       ---------------------------------------------- 
        CNUM  |  CNAME     | CITY    | RATING | SNUM 
       -------|------------|---------|--------|------ 
        2001  |  Hoffman   | London  |   100  | 1001 
        2002  |  Giovanni  | Rome    |   200  | 1003 
        2003  |  Liu       | SanJose |   200  | 1002 
        2004  |  Grass     | Berlin  |   300  | 1002 
        2006  |  Clemens   | London  |   100  | 1001 
        2008  |  Cisneros  | SanJose |   300  | 1007 
        2007  |  Pereira   | Rome    |   100  | 1004 
       ---------------------------------------------- 
 
Таблица 1.3:   Порядки 
 
       ----------------------------------------------- 
        ONUM  |    AMT    |    ODATE    | CNUM | SNUM 
       -------|-----------|-------------|------|------ 
        3001  |    18.69  |  10/03/1990 | 2008 | 1007 
        3003  |   767.19  |  10/03/1990 | 2001 | 1001 
        3002  |  1900.10  |  10/03/1990 | 2007 | 1004 
        3005  |  5160.45  |  10/03/1990 | 2003 | 1002 
        3006  |  1098.16  |  10/03/1990 | 2008 | 1007 
        3009  |  1713.23  |  10/04/1990 | 2002 | 1003 
        3007  |    75.75  |  10/04/1990 | 2004 | 1002 
        3008  |  4723.00  |  10/05/1990 | 2006 | 1001 
        3010  |  1309.95  |  10/06/1990 | 2004 | 1002 
        3011  |  9891.88  |  10/06/1990 | 2006 | 1001 
       ----------------------------------------------- 
 
Например, поле snum в таблице Заказчиков указывает, какому продавцу назначен данный заказчик. Номер пол snum связан с таблицей Продавцов, которая дает информацию об этих продавцах. Очевидно, что продавец которому назначены заказчики должен уже существовать - то есть, значение snum из таблицы Заказчиков должно также быть представлено в таблице Продавцов. Если это так, то говорят, что " система находится в состоянии справочной целостности ". Этот вывод будет более полно и формально объяснен в Главе 19.

ПРИМЕЧАНИЕ: Эти три представленных таблицы в тексте имеют русские имена - Продавцов, Заказчиков и Порядков, и далее будут упоминаться именно под этими именами. Имена любых других применяемых в книге таблиц будут написаны по-английски что бы отличать их от наших базовых таблиц этой базы данных. Кроме того в целях однозначности, имена заказчиков, продавцов, Системных Каталогов а также полей в тексте, также будут даны на латыни.

Таблицы приведены как пример к похожей ситуации в реальной жизни, когда вы будете использовать SQL чтобы следить за продавцами, их заказчиками, и порядками заказчиков. Давайте рассмотрим эти три таблицы и значения их полей. Здесь показаны столбцы Таблицы 1.1

   ПОЛЕ              СОДЕРЖАНИЕ 
  ---------    ---------------------------------------------- 
   snum        уникальный номер назначенный каждому продавцу 
                 ( " номер служащего " ). 
   sname       им продавца. 
 
   city         расположение продавца( город ). 
 
   comm       комиссионные продавцов в десятичной форме. 
 
Таблица 1.2 содержит следующие столбцы: 
 
   ПОЛЕ               СОДЕРЖАНИЕ 
  --------     --------------------------------------------------- 
   cnum       уникальный номер назначенный каждому заказчику. 
 
   cname      им заказчика. 
 
   city        расположение заказчика( город ). 
 
   rating      код указывающего уровень предпочтения данного заказчика 
                перед другими. Более высокий номер указывают на большее 
                предпочтение( рейтинг ). 
   snum       номер продавца назначенного этому заказчику 
                ( из таблицы Продавцов ) 
 
 И имеются столбцы в Таблице 1.3: 
 
    ПОЛЕ              СОДЕРЖАНИЕ 
    ---------    --------------------------------------------------- 
    onum      уникальный номер данный каждому приобретению. 
 
    amt       значение суммы приобретений. 
 
    odate     дата приобретения. 
 
    cnum      номер заказчика делающего приобретение 
               ( из таблицы Заказчиков ). 
    snum      номер продавца продающего приобретение 
               ( из таблицы Продавцов). 


РЕЗЮМЕ

Теперь вы знаете что такое реляционная база данных, понятие, которое звучит сложнее чем есть на самом деле. Вы также изучили некоторые фундаментальные принципы относительно того, как сделаны таблицы - как работают строки и столбцы, как первичные ключи отличают строки друга друга, и как столбцы могут ссылаться к значениям в других столбцах.

Вы поняли что запись это синоним строки, и что поле это синоним столбца. Оба термина встречаются в обсуждении SQL, и мы будем использовать их в равной степени в этой книге.

Вы теперь знакомы с таблицами примеров. Краткие и простые , они способны показать большинство особенностей языка, как вы это увидите В некоторых случаях, мы будем использовать другие таблицы или постулаты некоторых различных данных в одной из этих таблиц чтобы показать вам некоторые другие возможности.

Теперь вы готовы к углублению в SQL самостоятельно. Следующая глава даст вам быстрый просмотр языка, и даст вам информацию, которая поможет Вам ссылаться к уже пройденным местам.


РАБОТА С SQL

1. Какое поле таблицы Заказчиков является первичным ключом ?


2. Что является столбцом 4 из таблицы Заказчиков ?

3. Как по другому называется строка? Столбец?

4. Почему вы может не запрашивать для просмотра первые пять строк таблицы?

( См. Приложение A для ответов. )

Далее







При перепечатке любого материала с сайта, видимая ссылка на источник www.warayg.narod.ru и все имена, ссылки авторов обязательны.

© 2005