Создание простого кластеризованного индекса

В примере создается некластеризованный индекс по столбцу CountryID таблицы Countries.

CREATE INDEX IX_Countries_CountryID

ON Countries (CountryID);

Создание составного некластеризованного индекса

В этом примере создается некластеризованный составной индекс по столбцам SalesQuota и SalesYTD таблицы Sales.SalesPerson.

CREATE NONCLUSTERED INDEX IX_SalesPerson_SalesQuota_SalesYTD

ON Sales.SalesPerson (SalesQuota, SalesYTD);

Создание уникального некластеризованного индекса

В следующем примере создается уникальный некластеризованный индекс по столбцу Name таблицы Production.UnitMeasure. Индекс требует уникальности данных, вставляемых в столбец Name.

CREATE UNIQUE INDEX AK_UnitMeasure_Name

ON Production.UnitMeasure(Name);

Следующий запрос проверяет ограничение уникальности данных при попытке вставить строку с тем же значением, что и в уже существующей строке.

SELECT Name FROM Production.UnitMeasure WHERE Name = N'Ounces';

GO

INSERT INTO Production.UnitMeasure (UnitMeasureCode, Name, ModifiedDate)

VALUES ('OC', 'Ounces', GetDate());

В результате выдается сообщение об ошибке:

Сервер: Сообщение 2601, уровень 14, состояние 1, строка 1

Невозможно вставить повторяющуюся строку ключей в объект UnitMeasure с уникальным индексом AK_UnitMeasure_Name. Выполнение данной инструкции было прервано.

 

Создание индекса с включенными (неключевыми) столбцами

В этом примере создается некластеризованный индекс с одним ключевым столбцом (PostalCode) и четырьмя неключевыми столбцами (AddressLine1, AddressLine2, City, StateProvinceID).

 

CREATE NONCLUSTERED INDEX IX_Address_PostalCode

ON Person.Address (PostalCode)

INCLUDE (AddressLine1, AddressLine2, City, StateProvinceID);

Изменение индексов

Инструкция ALTER INDEX устраняет фрагментацию существующих индексов таблицы либо изменяет их посредством отключения или настройки индексных параметров.

Эта инструкция не может использоваться для изменения определения индекса, в том числе добавления или удаления столбцов или изменения порядка столбцов. Для выполнения этих операций следует использовать инструкцию CREATE INDEX с предложением DROP_EXISTING.

ALTER INDEX { index_name | ALL }

ON <object>

{ REBUILD

[ [PARTITION = ALL]

[ WITH ( <rebuild_index_option> [ ,...n ] ) ]

| [ PARTITION = partition_number

[ WITH ( <single_partition_rebuild_index_option>

[ ,...n ] )

]

]

]

| DISABLE

| REORGANIZE

[ PARTITION = partition_number ]

| SET ( <set_index_option> [ ,...n ] )

}

 

<object> ::=

{

[ database_name. [ schema_name ] . | schema_name. ]

table_or_view_name

}

 

<rebuild_index_option > ::=

{

PAD_INDEX = { ON | OFF }

| FILLFACTOR = fillfactor

| SORT_IN_TEMPDB = { ON | OFF }

| IGNORE_DUP_KEY = { ON | OFF }

| STATISTICS_NORECOMPUTE = { ON | OFF }

| ONLINE = { ON | OFF }

| ALLOW_ROW_LOCKS = { ON | OFF }

| ALLOW_PAGE_LOCKS = { ON | OFF }

| MAXDOP = max_degree_of_parallelism

| DATA_COMPRESSION = { NONE | ROW | PAGE }

[ ON PARTITIONS ( { <partition_number_expression> | <range> }

[ , ...n ] ) ]

}

<range> ::=

<partition_number_expression> TO <partition_number_expression>

}

 

<single_partition_rebuild_index_option> ::=

{

SORT_IN_TEMPDB = { ON | OFF }

| MAXDOP = max_degree_of_parallelism

| DATA_COMPRESSION = { NONE | ROW | PAGE } }

}

 

<set_index_option>::=

{

ALLOW_ROW_LOCKS = { ON | OFF }

| ALLOW_PAGE_LOCKS = { ON | OFF }

| IGNORE_DUP_KEY = { ON | OFF }

| STATISTICS_NORECOMPUTE = { ON | OFF }

}

Index_name

Имя индекса, настройки которого требуется изменить.

ALL

Указывает все индексы, связанные с таблицей или представлением, независимо от типа индекса.

Database_name

Имя базы данных.

Schema_name

Имя схемы, к которой принадлежит таблица или представление.

Table_or_view_name

Имя таблицы или представления, связанного с индексом.

 

 

REBUILD [ WITH (<rebuild_index_option> [ ,... n]) ]

Указывает, что индекс будет перестроен с использованием тех же столбцов, типов индекса, атрибута уникальности и порядка сортировки. REBUILD включает отключенный индекс. При перестройке кластеризованного индекса не перестраиваются ассоциированные некластеризованные индексы, если только не указано ключевое слово ALL. Если параметры индекса не заданы, то применяется существующий параметр индекса, который хранится в таблице sys.indexes. Для любого параметра индекса, значение которого не хранится в таблице sys.indexes, применяется значение по умолчанию, указанное в определении аргумента.

При перестроении XML-индекса или пространственного индекса параметры ONLINE = ON и IGNORE_DUP_KEY = ON недопустимы.

Если указано ключевое слово ALL, а базовая таблица реализована в виде кучи, операция перестроения не воздействует на таблицу. Перестраиваются все некластеризованные индексы, ассоциированные с таблицей.

Возможно минимальное протоколирование операции перестроения, если модель восстановления базы данных настроена на массовый или простой режим.

PARTITION

Указывает, что только одна секция индекса будет перестроена или реорганизована. PARTITION не может быть указана, если аргумент index_name — несекционированный индекс.

PARTITION = ALL, перестроение всех секций.

Partition_number

Номер секции секционированного индекса, который предстоит перестроить или реорганизовать partition_number. Секция partition_number должна существовать, иначе выполнение инструкции завершится с ошибкой.

WITH (<single_partition_rebuild_index_option>)

SORT_IN_TEMPDB, MAXDOP и DATA_COMPRESSION - параметры, которые могут быть указаны при перестроении одиночной секции (PARTITION = n).

 

DISABLE

Помечает индекс как отключенный и недоступный для использования компонентом Database Engine. Любой индекс может быть отключен, при этом определение отключенного индекса остается в системном каталоге без базовых индексных данных. Отключение кластеризованного индекса блокирует доступ пользователя к данным базовой таблицы. Чтобы активировать индекс, следует использовать инструкцию ALTER INDEX REBUILD или CREATE INDEX WITH DROP_EXISTING.

 

REORGANIZE

Указывает, что конечный уровень индекса будет реорганизован. Инструкция ALTER INDEX REORGANIZE всегда выполняется в режиме в сети. Это означает, что долгосрочные блокировки таблицы не удерживаются и запросы или обновления базовой таблицы могут продолжаться во время выполнения транзакции ALTER INDEX REORGANIZE. REORGANIZE не может быть вызвана для индекса с ALLOW_PAGE_LOCKS со значением OFF.

 

SET ( <set_index option> [ ,... n] )

Указывает параметры индекса без перестройки или реорганизации индекса. SET нельзя указать для отключенного индекса.

PAD_INDEX = { ON | OFF }

Определяет разреженность индекса. Значение по умолчанию — OFF.

ON

Процент свободного места, определяемый аргументом fillfactor, применяется к страницам индекса промежуточного уровня.

OFF или fillfactor не указан

Страницы промежуточного уровня заполняются почти полностью, при этом остается достаточно места по крайней мере для одной строки максимального размера, возможного в этом индексе при заданном наборе ключей на промежуточных страницах.

Параметр PAD_INDEX имеет смысл только в случае, если указан параметр FILLFACTOR, так как использует процентное значение, указанное в нем. Если процент, заданный аргументом FILLFACTOR, недостаточно велик для размещения одной строки, компонент Database Engine внутренне переопределит это значение, чтобы обеспечить минимум. Количество строк на странице индекса промежуточного уровня никогда не бывает менее двух даже при самых малых значениях аргумента fillfactor.

Для обратной совместимости синтаксиса аргумент WITH PAD_INDEX эквивалентен аргументу WITH PAD_INDEX = ON.

FILLFACTOR =fillfactor

Указывает значение в процентах, показывающее, насколько полным компонент Database Engine должен сделать конечный уровень каждой страницы индекса во время создания или перестроения индекса. Параметр fillfactor должен быть целым числом от 1 до 100. Значение по умолчанию равно 0. Если параметр fillfactor равен 100 или 0, компонент Database Engine создает индексы с полностью заполненными страницами конечного уровня.

Аргумент FILLFACTOR действует только при создании или перестройке индекса. Компонент Database Engine не сохраняет динамически указанный процентный объем свободного места на страницах. Значение коэффициента заполнения можно увидеть в представлении каталога sys.indexes.

 

SORT_IN_TEMPDB = { ON | OFF }

Указывает, сохранять ли временные результаты сортировки в базе данных tempdb. Значение по умолчанию - OFF.

ON

Промежуточные результаты сортировки, которые используются при индексировании, хранятся в базе данных tempdb. Это может уменьшить время, необходимое для создания индекса, если база данных tempdb и база данных пользователя находятся на разных наборах дисков. Однако это увеличивает использование места на диске, которое используется при индексировании.

OFF

Промежуточные результаты сортировки хранятся в той же базе данных, где и индекс.

IGNORE_DUP_KEY = { ON | OFF }

Определяет ответ на ошибку, случающуюся, когда операция вставки пытается вставить в уникальный индекс повторяющиеся значения ключа. Параметр IGNORE_DUP_KEY применяется только к операциям вставки, производимым после создания или перестроения индекса. Значение по умолчанию - OFF.

ON

Если в уникальный индекс вставляются повторяющиеся значения ключа, выводится предупреждающее сообщение. С ошибкой завершаются только строки, нарушающие ограничение уникальности.

OFF

Если в уникальный индекс вставляются повторяющиеся значения ключа, выводится сообщение об ошибке. Будет выполнен откат всей операции INSERT.

STATISTICS_NORECOMPUTE = { ON | OFF }

Указывает, выполнялся ли перерасчет статистики распределения. Значение по умолчанию - OFF.

ON

Устаревшие статистики не пересчитываются автоматически.

OFF

Автоматическое обновление статистических данных включено.

DROP_EXISTING = { ON | OFF }

Указывает, что названный существующий кластеризованный или некластеризованный индекс удаляется и перестраивается. Значение по умолчанию - OFF.

ON

Существующий индекс удаляется и перестраивается. Указанное имя индекса должно совпадать с уже существующим индексом, но определение индекса может быть изменено. Например, можно указать другие столбцы, порядок сортировки, схему секционирования или параметры индекса.

OFF

Выдается ошибка, если индекс с указанным именем уже существует.

Тип индекса не может быть изменен с помощью аргумента DROP_EXISTING.

ONLINE = { ON | OFF }

Определяет, будут ли базовые таблицы и связанные индексы доступны для запросов и изменения данных во время операций с индексами (только в редакциях SQL Server Enterprise и Developer). Значение по умолчанию - OFF.

ALLOW_ROW_LOCKS = { ON | OFF }

Указывает, разрешена ли блокировка строк. Значение по умолчанию — ON.

ON

Блокировки строк допустимы при доступе к индексу. Необходимость в блокировке строк определяет компонент Database Engine.

OFF

Блокировки строк не используются.

ALLOW_PAGE_LOCKS = { ON | OFF }

Указывает, разрешена ли блокировка страниц. Значение по умолчанию - ON.

ON -блокировки страниц возможны при доступе к индексу. Необходимость в блокировке страниц определяет компонент Database Engine.

OFF -блокировки страниц не используются.

 

MAXDOP = max_degree_of_parallelism

MAXDOP можно использовать для ограничения числа процессоров, используемых при параллельном выполнении планов. Параллельные операции с индексами доступны только в редакциях Developer, Enterprise и DataCenter. Максимальное число процессоров завис от редакции (Enterprise – 64, DataCenter – 256). Значение по умолчанию 0 - в зависимости от текущей рабочей нагрузки системы использует реальное или меньшее число процессоров.

DATA_COMPRESSION

Задает режим сжатия данных для указанного индекса, номера секции или диапазона секций. Ниже приведены доступные параметры.

NONE- индекс или заданные секции не сжимаются.

ROW- для индекса или заданных секций производится сжатие строк.

PAGE- для индекса или заданных секций производится сжатие страниц.

ON PARTITIONS ( { <partition_number_expression> | <range> } [,...n] )

Указывает секции, к которым применяется параметр DATA_COMPRESSION. Если индекс не секционирован, аргумент ON PARTITIONS создаст ошибку. Если не указано предложение ON PARTITIONS, то параметр DATA_COMPRESSION применяется ко всем секциям секционированного индекса.

<partition_number_expression > можно указать одним из следующих способов:

· Указать номер секции, например ON PARTITIONS (2).

· Указать номера нескольких секций через запятые, например ON PARTITIONS (1, 5).

· Указать диапазоны и отдельные секции: ON PARTITIONS (2, 4, 6 TO 8).

В следующем примере снимается ограничение PRIMARY KEY путем отключения индекса PRIMARY KEY. Соответствующее первичному ключу ограничение FOREIGN KEY в базовой таблице автоматически отключается, и выводится предупреждение.

ALTER INDEX PK_Department_DepartmentID

ON Department

DISABLE;

В следующем примере устанавливаются несколько параметров для индекса AK_SalesOrderHeader_SalesOrderNumber.

ALTER INDEX AK_SalesOrderHeader_SalesOrderNumber ON

Sales.SalesOrderHeader

SET ( STATISTICS_NORECOMPUTE = ON,

IGNORE_DUP_KEY = ON,

ALLOW_PAGE_LOCKS = ON );

Восстановление индексов

Компонент SQL Server Database Engine автоматически поддерживает состояние индексов при выполнении операций вставки, обновления или удаления в отношении базовых данных. Со временем эти изменения могут привести к тому, что данные в индексе окажутся фрагментированными (разбросанными по базе данных). Существуют два типа фрагментации:

· внутренняя – внутренняя фрагментация означает неполное заполнение страниц индекса, что приводит к увеличению высоты сбалансированного дерева и, как следствие, росту количества операций ввода-вывода.

· внешняя - имеет место в тех случаях, когда в индексах содержатся страницы, для которых логический порядок, основанный на значении ключа, не совпадает с физическим порядком в файле данных.

Значительно фрагментированные индексы могут серьезно снижать производительность запросов и служить причиной замедления откликов приложения.

Устранить фрагментацию можно путем реорганизации или перестроения индекса. Реорганизация индекса дефрагментирует конечный уровень кластеризованных и некластеризованных индексов по таблицам и представлениям, физически переупорядочивая страницы концевого уровня в соответствии с логическим порядком конечных узлов. При перестроении старый индекс удаляется, и создается новый.

Для секционированных индексов, построенных на основе схемы секционирования, можно использовать любой из этих методов в отношении всего индекса целиком или отдельной его секции.

Выявление фрагментации

Первым шагом в определении, какой метод дефрагментации следует использовать, будет анализ индекса на предмет степени фрагментации. Системная функция sys.dm_db_index_physical_stats позволяет выявить фрагментацию конкретного индекса, всех индексов в таблице или индексированном представлении, всех индексов в базе данных или всех индексов во всех базах данных. Для секционированных индексов sys.dm_db_index_physical_stats также предоставляет сведения о фрагментации каждой секции.

Результирующий набор, возвращаемый функцией sys.dm_db_index_physical_stats, включает следующие столбцы:

Столбец Описание
avg_fragmentation_in_percent Процентная доля логической фрагментации (неупорядоченные страницы в индексе).
fragment_count Число фрагментов (физически последовательные конечные страницы) в индексе.
avg_fragment_size_in_pages Среднее число страниц в одном фрагменте индекса.

Выяснив степень фрагментации, используя нижеследующую можно выбрать наиболее подходящий метод устранения фрагментации.

avg_fragmentation_in_percent Корректирующая инструкция
> 5 % и <= 30 % ALTER INDEX REORGANIZE
> 30% ALTER INDEX REBUILD

Обычно фрагментация небольших индексов является неконтролируемой. Страницы индексов малого размера хранятся в смешанных экстентах. Смешанные экстенты могут совместно использоваться восемью объектами, поэтому фрагментация в небольшом индексе может не сократиться после реорганизации или перестроения индекса.

Пример:

Следующий пример запрашивает через функцию динамического управления sys.dm_db_index_physical_stats среднюю фрагментацию для всех индексов в таблице Cources. В соответствии с предыдущей таблицей, рекомендуемым решением проблемы будет реорганизация IX_Id_Unique_Clusteredи перестроение IX_Unique_Code.

SELECT a.index_id, name, avg_fragmentation_in_percentFROM sys.dm_db_index_physical_stats (DB_ID(), OBJECT_ID(N'Cources'), NULL, NULL, NULL) AS a JOIN sys.indexes AS b ON a.object_id = b.object_id AND a.index_id = b.index_id;GO

Результат

index_id name avg_fragmentation_in_percent------------------------------------------------------------------------------------------1 IX_Id_Unique_Clustered 15.0769230769230773 IX_Unique_Code 99.666666666666657 (2 row(s) affected)

 

Реорганизация индекса

Реорганизация индексов производится при помощи инструкции ALTER INDEX с предложением REORGANIZE. Это предложение эквивалентно DBCC INDEXDEFRAG.

Реорганизация индекса дефрагментирует конечный уровень кластеризованных и некластеризованных индексов по таблицам и представлениям, физически переупорядочивая страницы концевого уровня в соответствии с логическим порядком (слева направо) конечных узлов. Расположение страниц в правильном порядке улучшает производительность сканирования индекса. Индекс реорганизуется в пределах выделенных для него страниц, новые страницы не выделяются. Если индекс состоит из более чем одного файла, файлы реорганизуются поочередно. Страницы не перемещаются между файлами.

Кроме того, реорганизация сжимает страницы индекса. Пустые страницы, возникшие в результате этого сжатия, удаляются, освобождая место на диске. Сжатие основывается на коэффициенте заполнения указанном для индекса.

Процесс реорганизации использует минимальные системные ресурсы. Кроме того, реорганизация автоматически осуществляется в режиме в сети. Процесс не требует долговременных блокировок и потому не препятствует выполнению запросов или обновлений.

Перестроение индексов

Реорганизация индексов производится при помощи инструкции ALTER INDEX с предложением REBUILD. Это предложение эквивалентно DBCC DBREINDEX.

При перестроении старый индекс удаляется, и создается новый. Таким образом, устраняется фрагментация, восстанавливается место на диске путем сжатия страниц с учетом указанного или существующего коэффициента заполнения, переупорядочиваются индексные строки в последовательных страницах. Если указывается ключевое слово ALL, то все индексы для таблицы удаляются и перестраиваются в одной транзакции.

Индекс может быть перестроен как в режиме в сети, так и в режиме вне сети. При перестроении индекса в режиме вне сети таблица, над которой данный индекс определен, будет заблокирована от изменений на время перестроения индекса.

Чтобы добиться доступности, подобной варианту с реорганизацией, следует перестраивать индексы в режиме в сети – это означает, что базовые таблицы и связанные индексы будут доступны для запросов и изменения данных во время операций с индексами. Режим перестроения индекса в сети доступен только в редакциях SQL Server Enterprise и Developer.

При удалении или перестроении больших индексов (более чем из 128 экстентов) Database Engine откладывает фактическое освобождение страниц, избегая блокировки размещения, требуемой для удаления больших объектов, с помощью разделения процесса на две стадии: логическую и физическую.

На логическом этапе существующие единицы распределения помечаются как освобождаемые и блокируются до момента фиксации транзакции, строки данных копируются и сортируются, а затем перемещаются в новые единицы распределения, созданные для хранения перестроенного индекса. При откате происходит откат только данной логической стадии.

Физическая стадия удаления начинается после фиксации транзакции. Единицы распределения, помеченные как освобождаемые, физически удаляются одним пакетом. Эти операции удаления проводятся в коротких транзакциях, выполняемых в фоновом режиме и не требующих большого количества памяти.

В силу того, что физическая стадия начинается после фиксации транзакции, дисковое пространство таблицы или индекса может оставаться недоступным в течение некоторого времени.

Пример 1:

В следующем примере перестраивается один индекс в таблице Employee.

 

ALTER INDEX PK_Employee_BusinessEntityID ON HumanResources.Employee

REBUILD;

GO

 

Пример 2:

В следующем примере указывается ключевое слово ALL. Тем самым выполняется перестроение всех индексов, связанных с таблицей.

 

ALTER INDEX ALL ON Production.Product

REBUILD WITH (FILLFACTOR = 80, SORT_IN_TEMPDB = ON,

STATISTICS_NORECOMPUTE = ON);

GO

Удаление индексов

При удалении некластеризованного индекса его определение удаляется из метаданных, а страницы данных сбалансированного дерева индекса удаляются из файлов базы данных. При удалении кластеризованного индекса определение индекса удаляется из метаданных, а строки данных, которые хранились на конечном уровне кластеризованного индекса, сохраняются в результирующей неупорядоченной таблице - куче. Все пространство, ранее занимаемое индексом, освобождается. Оно может быть впоследствии использовано любым объектом базы данных.

Команда DROP INDEX удаляет один или несколько индексов из текущей базы данных.

 

DROP INDEX index_name ON table_ name

[ WITH ( <drop_clustered_index_option> [ ,...n ] ) ]

 

<drop_clustered_index_option> ::=

{

MAXDOP = max_degree_of_parallelism

| ONLINE = { ON | OFF }

| MOVE TO { partition_scheme_name ( column_name )

| filegroup_name

| "default" }

}

index_name

Имя индекса, который необходимо удалить.

table_name

Имя таблицы, на которой создан индекс.

<drop_clustered_index_option>

Управляет параметрами кластеризованного индекса. Эти параметры неприменимы к другим типам индексов.

MAXDOP =max_degree_of_parallelism

MAXDOP можно использовать для ограничения числа процессоров, используемых при параллельном выполнении планов. Параллельные операции с индексами доступны только в редакциях Developer, Enterprise и DataCenter. Максимальное число процессоров завис от редакции (Enterprise – 64, DataCenter – 256). Значение по умолчанию 0 - в зависимости от текущей рабочей нагрузки системы использует реальное или меньшее число процессоров.

ONLINE = { ON | OFF }

Определяет, будут ли базовые таблицы и связанные индексы доступны для запросов и изменения данных во время операций с индексами (только в выпусках SQL Server Enterprise и Developer). Значение по умолчанию - OFF.

 

MOVE TO { partition_scheme_name(column_name) | filegroup_name | "default" }

Определяет размещение, куда будут перемещаться строки данных, находящиеся на конечном уровне кластеризованного индекса. Данные перемещаются в новое расположение со структурой типа куча. В качестве нового расположения можно указать файловую группу или схему секционирования, но они должны уже существовать. Параметр MOVE TO недопустим для индексированных представлений и некластеризованных индексов. Если ни схема секционирования, ни файловая группа не указаны, результирующая таблица помещается в схему секционирования или файловую группу, которая определена для кластеризованного индекса.

Если кластеризованный индекс удаляется с указанием параметра MOVE TO, то все некластеризованные индексы базовых таблиц создаются заново, но остаются в исходных файловых группах или схемах секционирования.

 

partition_scheme_name(column_name)

Указывает схему секционирования, в которой будет размещена результирующая таблица. Схема секционирования должна быть создана заранее. Если схема секционирования не указана и таблица секционирована, таблица включается в ту же схему секционирования, где размещен существующий кластеризованный индекс.

Имя столбца в схеме не обязательно должно соответствовать столбцам из определения индекса. Можно указать любой столбец базовой таблицы.

 

filegroup_name

Указывает файловую группу, в которую будет помещена результирующая таблица. Если размещение не указано и таблица не секционирована, тогда результирующая таблица включается в ту файловую группу, где размещен существующий кластеризованный индекс. Файловая группа должна существовать.

 

"default"

Указывает размещение по умолчанию для результирующей таблицы.

 

 

Следующий пример иллюстрирует удаление индекса IX_ProductVendor_VendorID в таблице ProductVendor.

 

DROP INDEX IX_ProductVendor_BusinessEntityID

ON Purchasing.ProductVendor;

Лекция № 15