Структура видеосистемы CUDA

В видеочипах системы CUDA основной блок — это мультипроцессор с восемью-десятью ядрами и сотнями ALU в целом, несколькими тысячами регистров и небольшим количеством разделяемой общей памяти. Кроме того, видеокарта содержит быструю глобальную память с доступом к ней всех мультипроцессоров, локальную память в каждом мультипроцессоре, а также специальную память для констант (Рисунок 17).

Глобальная память — самый большой объём памяти, доступный для всех мультипроцессоров на видеочипе, размер составляет от 256 мегабайт до 1.5 гигабайт на текущих решениях (и до 4 Гбайт на Tesla). Обладает высокой пропускной способностью, более 100 гигабайт/с для топовых решений NVIDIA, но очень большими задержками в несколько сот тактов.

Локальная память — это небольшой объём памяти, к которому имеет доступ только один потоковый процессор. Она относительно медленная — такая же, как и глобальная.

Разделяемая память — это 16-килобайтный блок памяти с общим доступом для всех потоковых процессоров в мультипроцессоре. Эта память весьма быстрая. Она обеспечивает взаимодействие потоков, управляется разработчиком напрямую и имеет низкие задержки.

Память констант — область памяти объемом 64 килобайта, доступная только для чтения всеми мультипроцессорами. Она кэшируется по 8 килобайт на каждый мультипроцессор. Задержка в несколько сот тактов при отсутствии нужных данных в кэше.

Рисунок 17.Структура видеосистемы CUDA

Текстурная память — блок памяти, доступный для чтения всеми мультипроцессорами. Выборка данных осуществляется при помощи текстурных блоков видеочипа, поэтому предоставляются возможности линейной интерполяции данных без дополнительных затрат. Кэшируется по 8 килобайт на каждый мультипроцессор. Сотни тактов задержки при отсутствии данных в кэше[10].

Применение GPU

Работа с графикой

У видеочипов работа простая и распараллеленная изначально. Видеочип принимает на входе группу полигонов, проводит все необходимые операции, и на выходе выдаёт пиксели.

Пиксель – наименьший логический элемент двумерного цифрового изображения в растровой графике, обладающий особыми цветовыми и/или яркостными характеристиками.

Полигон – минимальная поверхность для визуализации. Поскольку во многих задачах компьютерной графики требуется, чтобы объект являлся выпуклым многоугольником, в качестве полигонов обычно применяют треугольники.

Рисунок 18. Последовательность действий при выводе изображения в 3-х мерной графике

Рисунок 19.Пример полигональной модели 3D графики

Вычисления на GPU

Основные направления применения вычислений на GPU:

· анализ и обработка изображений и сигналов;

· симуляция физики, физика частиц, электромагнитные симуляции, динамика газов и жидкостей;

· вычислительная математика, вычислительная биология;

· финансовые расчёты, базы данных;

· криптография;

· астрономия;

· обработка звука, цифровое кино и телевидение, компьютерное зрение;

· биоинформатика, биологические симуляции, симуляция свёртывания молекул белка;

· геоинформационные системы, океанографические исследования;

· магнитно-резонансная томография (MRI), адаптивная лучевая терапия;

· нейронные сети, и т.д.

Рисунок 20. Основные области применения GPU вычислений

Компании, подобные OptiTex, используют GPU для разработки одежды для потребительского рынка (Рисунок 21).

Рисунок 21. Создание лекал и раскроя

Автомобильные компании создают дизайн машин следующего поколения с помощью трассировки лучей на GPU, используя CUDA (Рисунок 22).

Рисунок 22. Трассировка лучей на GPU

Компании производители чистящих средств и средств гигиены применяют GPU для моделирования молекул своих продуктов (Рисунок 23).

Рисунок 23. Моделирование молекул при помощи GPU

Так, промышленный гигант Procter Gamble совместно с университетом Темпл работают над моделированием взаимодействия молекул поверхностно-активных веществ с грязью, водой и другими материалами[11].


Список использованной литературы

1. Сайт цифровых учебно-методических материалов Центра Образования ВГУЭС // [Электронный ресурс] Видео-системы персональных компьютеров. // Режим доступа: http://abc.vvsu.ru/Books/ebooks_iskt//videosystem.html (Дата обращения: 25.10.12)

2. Внутренние и внешние устройства ПК. [Электронный ресурс] Мониторы // Режим доступа: http://ab-0v0-usque-ad-mala.narod.ru/Displays.htm (Дата обращения: 25.10.12)

3. Электронно-библиотечная система "КнигаФонд" [Электронный ресурс] // Догадин Н.Б. Архитектура компьютера: учебной пособие // Н.Б. Догадин. – М.: БИНОМ. Лаборатория знаний, 2008. – 271 с.: ил. Режим доступа: http://www.knigafund.ru/books/116176/read, ограниченный. – Загл. с экрана. – Яз.рус.

4. Подбери TV [Электронный ресурс] Более подробно про устройство плазменных телевизоров Режим доступа: http://www.podberi.tv/review/461/ (Дата обращения: 25.10.12)

5. Электронно-библиотечная система "КнигаФонд" [Электронный ресурс] // Росс Д. Телевизоры и мониторы. Ремонт, устройство и техническое обслуживание // Джон Росс; Пер. с англ. Карелина А.В. – М.: ДМК Пресс. – 732 с.: ил. Режим доступа: http://www.knigafund.ru/books/106212/read, ограниченный. – Загл. с экрана. – Яз.рус.

6. Свободная интернет энциклопедия "Википедия". [Электронный ресурс] // Органический светодиод // Режим доступа: http://ru.wikipedia.org/wiki/Органический_светодиод (Дата обращения: 27.10.2012)

7. Свободная интернет энциклопедия "Википедия". [Электронный ресурс] // Видеокарта // Режим доступа: http://ru.wikipedia.org/wiki/Видеокарта (Дата обращения: 28.10.2012)

8. Компьютерный Ликбез [Электронный ресурс] // История видеокарт — Часть 1 // Режим доступа: http://antonkozlov.ru/istoriya/istoriya-videokart-1.html (Дата обращения: 28.10.2012)

9. Tom's Hardware Guide [Электронный ресурс] // nVidia CUDA: вычисления на видеокарте или смерть CPU? // Режим доступа: http://www.thg.ru/graphic/nvidia_cuda/print.html (Дата обращения: 29.10.2012)

10. Журнал iXBT.com [Электронный ресурс] // NVIDIA CUDA — неграфические вычисления на графических процессорах // Режим доступа: http://www.ixbt.com/video3/cuda-1.shtml (Дата обращения: 30.10.2012)

11. Журнал iXBT.com [Электронный ресурс] // NVIDIA CUDA — неграфические вычисления на графических процессорах // Режим доступа: http://edu.chpc.ru/cuda/mainse4.html (Дата обращения: 30.10.2012)