Расчет пиковой производительности ВС.

Факультет кибернетики и информационной безопасности

Кафедра компьютерных систем и техно­логий

 

Архитектура информационных систем

 

Курсовая работа

 

 

Выполнил: Васин А. К.

Группа М16-581

Преподаватель:

 


 

Оглавление

Raspberry – микропроцессорная вычислительная система. 3

Используемая литература. 4

 


 

Raspberry – микропроцессорная вычислительная система

1. Описание микропроцессоров в целом?

2. Переход на наш рашбери, некоторые хар-ки.

3. Описание более сложной структуры по схемам взаимодействия процессора.

4. Добавить схему и описание работы самого процессора.

5. Думаю для начала пойдёт.

 

Микропроцессор — процессор (устройство, отвечающее за выполнение арифметических, логических операций и операций управления, записанных в машинном коде), реализованный в виде одной микросхемыили комплекта из нескольких специализированных микросхем(в отличие от реализации процессора в виде электрической схемы на элементной базе общего назначения или в виде программной модели). Первые микропроцессоры появились в 1970-х годах и применялись в электронных калькуляторах, в них использовалась двоично-десятичная арифметика 4-битных слов. Вскоре их стали встраивать и в другие устройства, например, терминалы, принтеры и различную автоматику. Доступные 8-битные микропроцессоры с 16-битной адресацией позволили в середине 1970-х годов создать первые бытовые микрокомпьютеры.

 

Микропроцессор – основа ЭВМ

Микропроцессор, как и любое вычислительное устройство, состоит из двух основных блоков: управляющего и операционного.

Микропроцессор является важнейшей составной частью ЭВМ (рис. 1). Рассмотрим состав и функции основных элементов ЭВМ.

В состав ЭВМ входят процессор, оперативная память и внешние устройства.

Процессор служит для управления всеми элементами системы и организует работу по выполнению заданной программы (преобразование данных).

Память подразделяется на оперативное запоминающее устройство (ОЗУ) и пассивное запоминающее устройство (ПЗУ) и служит для хранения программ и данных.

Внешние устройства обеспечивают ввод/вывод программ и данных в ЭВМ.

В составе ЭВМ имеется центральный процессорный элемент, соединенный со всеми элементами системы при помощи системной магистрали. Системная магистраль, в свою очередь, состоит из трех шин: адреса, данных и управления.

Шина адреса предназначена для передачи текущего адреса, к которому идет обращение, всем элементам ЭВМ.

Шина данных предназначена для передачи данных между центральным процессором, памятью и внешними устройствами, а также между оперативной памятью (ОП) и внешним устройством (ВУ) в режиме прямого доступа в память (ПДП).

Шина управления предназначена для передачи сигналов управления между МП и остальными элементами ЭВМ.

Вся работа ЭВМ – это выполнение какой-либо программы, будь то программа операционной системы или программа пользователя. Достаточно рассмотреть порядок выполнения программы процессором для того, чтобы понять, как работает ЭВМ.

Работа ЭВМ начинается с программы начальной установки (BIOS), которая подготавливает все элементы к работе. В IBM PC программируют тай-мер, контроллеры дисков, адаптеры параллельной и последовательной связи и т. д. Затем загружается ядро операционной системы (с диска или дискеты) и управление передается этой программе. Теперь ЭВМ готова к выполнению программ.[1]

 

Микропроцессорные системы

Микропроцессор – это микросхема или совокупность микросхем (или кристаллов), выполняющая арифметические и логические операции над данными и осуществляющая программное управление вычислительным процессом.

Микропроцессорные средства – это наборы микросхем (БИС), комплекты, совместимые по уровням напряжений, сигналам и передаваемой ин-формации, в состав которых входят: МП, ОЗУ, ПЗУ, управление вводом/выводом и т. д.

К характеристикам МП следует отнести в первую очередь следующие: тип микроэлектронной технологии, количество кристаллов и их типоразмеры, количество транзисторов на кристалле, количество выводов корпуса кристалла. Эти технологические характеристики определяют экономическую целесообразность выпуска самого МП. Далее идут разрядность обрабатываемого слова, быстродействие микропроцессора (тактовая частота на внутренних и внешних шинах, количество и время выполнения основных операций в секунду), емкость адресуемой памяти, тип управляющих устройств, эффективность системы команд, число уровней прерывания и прямого доступа к памяти, пропускная способность интерфейсов ввода/вывода, количество и уровни питающих напряжений, номинальные параметры используемых сигналов, потребляемая мощность; число, состав и назначение дополнительных устройств, входящих в микропроцессорный комплект; поддержка проектирования программного обеспечения и некоторые специализированные характеристики.

Основной характеристикой любой МПС является ее производительность, под которой в общем случае понимают количество выполняемых в единицу времени элементарных операций и время доступа к памяти и внешним устройствам. Критериями максимальной производительности МПС следует считать в первую очередь минимальное время доступа к памяти и максимально возможную тактовую частоту процессора.

 

Магистрально-модульный принцип построения МПС показан на рис. 1.

В МПС все связи между отдельными функциональными блоками осуществляются, как правило, шинами.

Под шиной подразумевается физическая группа передачи сигналов, обладающих функциональной общностью (по каждой линии передается один двоичный разряд информации).

Рисунок 1. Простейшая микропроцессорная система

Микропроцессор Raspberry представляет собой одноплатный компьютер размером с банковскую карту, изначально разработанный как бюджетная система для обучения информатике, при этом, обладая малой себестоимостью, включает в себя следующие элементы:

· Broadcom BCM2835 (CPU & GPU);

· 256/512MB SDRAM;

· 1/2 USB 2.0 Ports;

· None/Ethernet Port;

· HDMI;

· Audio;

· SD Card Slot;

· Micro USB for power.

Они располагаются на плате согласно схеме на рис. 2.Raspberry Pi выпускается в нескольких комплектациях: модель «A», модель «B», модель «B+», модель «2 B», «Zero» и «3B». Первые три версии оснащены ARM11 процессоромBroadcomBCM2835с тактовой частотой 700 МГц и модулемоперативной памятина 256МБ/512МБ, размещенными по технологии «package-on-package» непосредственно на процессоре. Модель «2 B» оснащается процессором с 4 ядрамиCortex-A7с частотой 1ГГц и оперативной памятью размером 1ГБ. Модель «A» оснащается однимUSB 2.0портом, модель «B» двумя, а модели «B+» и «2 B»— четырьмя. Также в моделях «B», «B+» и «2 B» присутствует портEthernet. Помимо основного ядра, BCM2835 включает в себяграфическое ядрос поддержкойOpenGLES 2.0,аппаратного ускоренияиFullHD-видео иDSP-ядро. Одной из особенностей является отсутствие часов реального времени.

Вывод видеосигнала возможен черезкомпозитныйразъёмRCAили через цифровойHDMI-интерфейс. В версии «B+» и «2B» вывод возможен через аудиоразьем 3,5. Корневая файловая система, образ ядра и пользовательские файлы размещаются на карте памятиSD,MMC, microSD (только в модели «B+») илиSDIO.

Одной из самых интересных особенностей Raspberry Pi является наличие портовGPIO. Благодаря этому «малиновый» компьютер можно использовать для управления различными устройствами. В модели «B» платы присутствует 26-пиновый, а в модели «B+» и «2 B»— 40-пиновый разъемGPIO.

Рисунок 2. Смеха расположения элементов RaspberryPi

 

В архитектуру микропроцессора класса Raspberry входят элементы, показанные на рисунке 3.

· ARM11J6JZF-S (ARM11 Family)

· ARMv6 Architecture

· Single Core

· 32-Bit RISC

· 700 MHz Clock Rate

· 8 Pipeline Stages

· Branch Prediction

Основу микропроцессора составляет процессор ARM1176,процессор приложений, развернут в устройствах, начиная от смартфонов до цифрового телевидения, предоставляя средства чтения, представленияданных, защиты вычислительной среды, а также производительность до 1 ГГц в условиях низкой стоимости конструкций. Процессор ARM1176JZ-S поддерживает технологию ARMTrustZone® для защиты приложений и технологий ARMJazelle® для эффективного встроенного исполнения Java. Необязательные тесно связанные воспоминания упрощают миграцию процессора ARM9 ™ и дизайн в режиме реального времени, в то время как AMBA® 3 AXITM интерфейсы повышения производительности шины памяти. Поддержка DVFS позволяет номинально оптимизировать статическую и динамическую мощности архитектуры ARM11TM процессора [2].

Рисунок 3. Внутреннее строение процессораARM 1176

Raspberryоснован на архитектуре RISC.RISC (компьютер с сокращённым набором команд) — архитектура процессора, в котором быстродействие увеличивается за счёт упрощения инструкций, чтобы их декодирование было более простым, а время выполнения — меньшим. Первые RISC-процессоры даже не имели инструкций умножения и деления. Это также облегчает повышение тактовой частоты и делает более эффективной суперскалярность (распараллеливание инструкций между несколькими исполнительными блоками).ОсновнойидеейвсехRISC (ReducedInstructionSetComputer), является увеличение быстродействия за счет сокращения количества операций обмена с памятью программ. Для этого каждую команду стремятся уместить в одну ячейку памяти. При ограниченной разрядности ячейки памяти это неизбежно приводит к сокращению набора команд микропроцессора.

Все выполняемые команды микропроцессора связаны с соответствующими регистрами, позволяющими выполнять те или иные функции.

Таймер/счетчик событий – внутренний таймер, предназначенный длязапуска программы обработки прерывания при определенных условиях счета, в том числе и внешних событий.

Сторожевой таймер предназначен для защиты микроконтроллера отсбоев в процессе работы. При срабатывании сторожевого таймера происходит внутренний перезапуск работы микроконтроллера.

Порты ввода/вывода AVR имеют от 5 до 32 независимых линий ввода/вывода, причем каждый разряд любого порта может быть запрограммирован на ввод или на вывод.

Аналого-цифровой преобразователь – это 10-разрядный АЦП с устройством выборки/хранения и входным аналоговым мультиплексором.

Аналоговый компаратор предназначен для сравнения непрерывно изменяющихся сигналов. Входные аналоговые сигналы компаратора Uвх – анализируемый сигнал и Uоп – опорный сигнал сравнения, а выходной Uвых –дискретный или логический сигнал, содержащий 1 бит информацииn таймер/счетчик – дополнительные таймера/счетчики. Кроме того, можетсодержать широтно-импульсный модулятор (ШИМ), предназначенный дляформирования сигналов заданной длительности при определенных условиях.

Скоростной последовательный интерфейс SPI – последовательныйсинхронный интерфейс ввода/вывода, используется для передачи данных попротоколу SPI.

Асинхронный, дуплексный последовательный порт UART – последовательный порт ввода/вывода информации.[1]

Высокая производительность до 1Гг (в последних версиях ещё выше до 1.4Гг) обеспечивается тактовым генераторомпроцессора BCM2835.ВдополнениекMMUотARM( memorymanagementunit – блокуправленияпамятью), BCM2835такжеобладаетвторымуровнемMMUдля отображения ARM физических адресов на системной шины адреса. На рисунке 4 показаны основные адресные пространства, представляющие контроль. Это позволяет реализовать много эффективную систему управления памятью, при этом не расширяя схему микропроцессора в целом.

Addresses in ARM Linux are: • issued as virtual addresses by the ARM core, then • mapped into a physical address by the ARM MMU, then • mapped into a bus address by the ARM mapping MMU, and finally • used to select the appropriate peripheral or location in RAM.

Реализованные адреса, на основе ARMLinux,следуют следующему пути[4]:

· определение в качестве виртуальных адресов ядром ARM, затем

· отображение в физический адрес на ARMMMU, затем

· отображение в адрес шины отображением ARMMMU, и, наконец,

· распределение по модулям соответствующего периферийного устройства или определённому местоположению в оперативной памяти.

В обычной практике, стандарт ​​BCM2835 Linux ядра обеспечивает непрерывное отображениепо всей доступной оперативной памяти в верхней части памяти. Ядро конфигурируется для1GB / 3GB разделена между ядром и пользовательского пространства памяти.

Виртуальные адреса в режиме ядра будет колебаться между 0xC0000000 и 0xEFFFFFFF.

Виртуальные адреса в пользовательском режиме (т.е. видели процессами, работающими в ARM Linux) будет варьироватьсямежду 0x00000000 и 0xbfffffff.

Периферия (по физическому адресу 0x20000000) отображается в ​​пространствовиртуального адресаядра, начиная с адреса 0xF2000000. Таким образом, периферия представлена здесь на адресе шины0x7Ennnnnn идоступен в ARM Кенель по виртуальному адресу 0xF2nnnnnn.

Рисунок 4. Периферия BCM2835

Программное обеспечение периферии прямого доступа переводит эти адреса в физические или виртуальные. Программное обеспечениепредставляющее доступ периферии, использующей технологию DMA,используютшины адреса. Программное обеспечениенепосредственного доступа к ОЗУ используют физические адреса (начиная с 0x00000000). Программное обеспечение доступа к оперативной памяти с использованием технологии DMA используют шины адреса (начиная с 0xC0000000).

Большинство аппаратных конвейеров и периферия BCM2835 bus мастера, позволяют им эффективно удовлетворять свои собственные потребности в данных. Это уменьшаеттребования контроллера DMA к типуперевода памяти блок-к-блоку и поддерживает некоторыеиз более простых периферийных устройств. Кроме того, контроллер DMA обеспечивает предвыборкурежима“только для чтения”, чтобы данные, которые будут введены в L2 кэш в ожидании его дальнейшего использования.

Контроллер DMA BCM2835 обеспечивает в общей сложности 16 каналов DMA. Каждый канал работает независимо от других и внутренне присуждает одной из 3-х системных шин. Это даёт возможность управлять шириной пропускной способности канала DMA при помощи настройки арбитра.

Более подробно, структура процессора включает также такие элементы как: вычислительное ядро (Core), модуль загрузки (LoadStoreUnit), предварительный модуль (PrefetchUnit), блок управления памятью(MMU), блок памяти 1 и 2 уровней, блок прерывания (InterruptHanding), AMBA интерфейс, блок кэш памяти, блок TCM, блок отладки (Debug), сопроцессор векторной плавающей точкой(VectorFloatingPoint), интерфейс сопроцессора (рис. 5).

Рисунок 5. Структурная модель процессора[4]

 


 

Расчет пиковой производительности ВС.

Частота работы ядра

Как правило, именно этот параметр в просторечии именуют «частотой процессора». Хотя в общем случае определение «частота работы ядра» всё же более корректно, так как совершенно не обязательно все составляющие CPU функционируют на той же частоте, что и ядро (наиболее частым примером обратного являлись старые «слотовые» x86 CPU — IntelPentium II и Pentium III для Slot 1, AMD Athlon для Slot A — у них L2-кэш функционировал на 1/2, и даже иногда на 1/3 частоты работы ядра). Примерно также сегодня в большинстве процессоров работает кэш L3 — на своей отдельной частоте, меньшей, чем у каждого ядра. Ещё одним распространённым заблуждением является уверенность в том, что частота работы ядра однозначным образом определяет производительность. Это дважды не так.

Во-первых, каждое конкретное процессорное ядро (в зависимости от того, как оно спроектировано, сколько содержит исполняющих блоков различных типов, и т.д. и т.п.) может исполнять разное число команд за один такт, частота же — это всего лишь количество таких тактов в секунду. Таким образом (приведённое далее сравнение, разумеется, очень сильно упрощено) процессор, ядро которого исполняет 3 инструкции за такт, может иметь на треть меньшую частоту, чем процессор, исполняющий 2 инструкции за такт — и при этом обладать полностью аналогичным быстродействием.

Во-вторых, даже в рамках одного и того же ядра, увеличение частоты вовсе не всегда приводит к пропорциональному увеличению быстродействия. Здесь вам очень пригодятся знания, которые вы могли почерпнуть из раздела «Общие принципы взаимодействия процессора и ОЗУ». Дело в том, что скорость исполнения команд ядром процессора — это вовсе не единственный показатель, влияющий на скорость выполнения программы. Не менее важна скорость поступления команд и данных на CPU. Представим себе чисто теоретически такую систему: быстродействие процессора — 10'000 команд в секунду, скорость работы памяти — 1000 байт в секунду. Даже если принять, что одна команда занимает не более одного байта, а данных у нас нет совсем, с какой скоростью будет исполняться программа в такой системе? Не более 1000 команд в секунду, и производительность CPU тут совершенно ни при чём: мы будем ограничены не ей, а скоростью поступления команд в процессор. Таким образом, следует понимать: невозможно непрерывно наращивать одну только частоту ядра, не ускоряя одновременно подсистему памяти, так как в этом случае начиная с определённого этапа, увеличение частоты CPU перестанет сказываться на увеличении быстродействия системы в целом.

 

http://www.ixbt.com/cpu/cpu-digest-2009.shtml