Intel Core и последователи

Неудача архитектуры NetBurst заставила Intel вновь обдумать стратегию на ближайшее будущее. Процессоры Pentium 4 показали, что NetBurst не может достойно конкурировать с AMD K8. Даже больше: с течением времени преимущество решений конкурента лишь возрастало. Поэтому в микроархитектуре следующего поколения, получившей имя Core и представленной в начале 2006 года, было решено вернуться к корням и позаимствовать лучшие черты архитектуры P6.

Список полученных изменений стоит начать с конвейера. Он получил «всего» 14 стадий — примерно столько же использовал конвейер P6, в отличие от 31-стадийного дизайна NetBurst. Процессор научился обрабатывать до четырех инструкций за такт. Архитектура Core изначально проектировалась под двухъядерность, поэтому для всех «голов» была предусмотрена общая кэш-память 2-го уровня. Такой подход обеспечивал большую скорость работы и меньшее энергопотребление. В Core была добавлена поддержка различных энергосберегающих технологий, суть которых заключалась во включении необходимой процессорной логики при необходимости. Положительно на производительности сказалась и улучшенная работа с подсистемой памяти. Помимо всего перечисленного, в Core был переработан алгоритм обработки 128-битных инструкций SSE, SSE2 и SSE3. Если раньше каждая команда обрабатывалась за два такта, то теперь для операции требовался лишь один такт.

Отметим, что архитектура Core отличалась от NetBurst отсутствием поддержки некоторых технологий: например, Hyper-Threading и кэш-памяти 3-го уровня.


На смену Pentium пришла торговая марка Core 2

Дебют микроархитектуры Core ознаменовали собой процессоры с кодовыми названиями Merom, Conroe, Allendale и Woodcrest. И если первый и последний предназначались для мобильных и серверных систем соответственно, то второй и третий были нацелены на настольный сегмент. Ядро Allendale было урезанной версией Conroe, в нем была уменьшена частота системной шины с 1066 МГц до 800 МГц, а также урезан объем кэш-памяти 2-го уровня с 4 Мбайт до 2 Мбайт. Плюс не было поддержки аппаратной виртуализации.

Новые «камни» получили оригинальные наименования. Intel ввела торговую марку Core 2, которая заменила Pentium в верхнем и среднем ценовом сегменте. Бренд остался, однако «пенечки» отныне перекочевали в бюджетный сегмент, где обитают и по сей день.

Core ознаменовала возвращение Intel на лидирующие позиции на рынке процессоров. В сравнении с кристаллами Pentium D, производительность Conroe выросла в среднем на 40%, а энергопотребление уменьшилось на те же 40%. Кроме этого, Conroe в целом уверенно превосходил в производительности AMD Athlon 64 X2.

В 2007 году на смену Core пришла 45-нм микроархитектура Penryn. Модификации были минимальны. В производстве новых кристаллов начали использоваться металлические затворы и материалы с высоким показателем диэлектрической константы. В архитектуру добавилась поддержка инструкций SSE4, а максимальный объем кэш-памяти 2-го уровня у двухъядерных процессоров увеличился с 4 Мбайт до 6 Мбайт. Поколение Penryn было представлено двухъядерными решениями Wolfdale и четырехъядерными Yorkfield.


Визуальное сравнение Conroe и Wolfdale

Nehalem, архитектура следующего поколения, была выпущена в 2008 году. В сравнении с Core и Penryn она получила множество улучшений. Как и AMD K8, процессоры обзавелись встроенным трехканальным контроллером памяти DDR3. Nehalem получила новую модульную структуру, которая позволила впоследствии добавить в процессор графическое ядро, да и вообще легче наращивать количество ядер в кристалле. Шина FSB окончательно ушла в прошлое — вместо нее в старших процессорах для разъема Socket LGA1366 использовался интерфейс QPI (QuickPath Interconnect), а в решениях для Socket LGA1156 — DMI (Direct Media Interface). Объем кэш-памяти 2-го уровня был уменьшен до 256 Кбайт на каждое ядро, однако добавилась поддержка L3. Решения поддерживали технологию SMT (Simultaneous Multithreading) — аналог Hyper-Threading.

Чуть больше чем через год Intel перевела архитектуру Nehalem на новый 32-нм техпроцесс. Эта линейка процессоров получила название Westmere. Были выпущены решения с интегрированным графическим ядром Clarkdale, а также десктопные шестиядерные модели Gulftown.

С тех пор Intel успела вывести на рынок 32-нм процессоры следующего поколения — Sandy Bridge и их 22-нм модификацию Ivy Bridge. А в прошлом году в продаже появились кристаллы на базе 22-нм архитектурыHaswell.

AMD K10 и последователи

С появлением архитектуры Intel Core компания AMD оказалась в довольно затруднительном положении. Если во времена конкуренции ее платформы K8 с «интеловской» NetBurst преимущество первой было очевидным, то теперь все было с точностью да наоборот. Даже топовые процессоры K8 с трудом сдерживали натиск не самых быстрых Conroe, поэтому AMD поспешила выпустить архитектуру нового поколения K10. Положительным моментом для AMD было то, что K8 сама по себе была успешным продуктом и кардинально перерабатывать его не потребовалось.

Тем не менее изменения коснулись практически всех процессорных блоков, и это не считая общей оптимизации архитектуры ядра. Если раньше на одном кристалле могли располагаться лишь два ядра, то теперь это число возросло до шести. В дополнение к кэшу 1-го и 2-го уровней модели K10 наконец получили «мозги» L3 объемом 2 Мбайт. Она являлась общей. При этом объем кэша данных и инструкций 1-го уровня составлял 64 Кбайт каждый, а кэш-памяти 2-го уровня — 512 Кбайт. Еще одним отличием от K8 стал контроллер памяти. В процессорах использовался один 128-битный контроллер, а в K10 их стало два — 64-битных. Во многом изменение архитектуры контроллера было вызвано многоядерностью процессоров. Кстати, каждый контроллер памяти получил свой буфер. Такой подход позволил снизить задержки при обращении к памяти. Доработка затронула и блоки FPU. Каждое процессорное ядро имело 128-битный модуль вычислений с плавающей запятой. Были улучшены алгоритмы предсказания переходов. В результате архитектура K10 научилась обрабатывать две 128-битные SSE-инструкции за такт. Вдобавок ко всему новые процессоры работали через интерфейс HyperTransport 3.0. В сравнении с предыдущими версиями, новое поколение шины обеспечивали более высокую скорость обмена данными за счет более высокой тактовой частоты (до 2,6 ГГц). Большую роль начала играть экономичность кристаллов, поэтому в K10 AMD поработала над различными технологиями энергосбережения (Cool’n’Quiet 2.0, CoolCore), которые позволяли отключать неработающие блоки процессоров или же автоматически снижать частоту незагруженных ядер.


А торговая марка Phenom заменила Athlon

Первыми процессорами с архитектурой K10 стали серверные решения Opteron, выпущенные в 2007 году. Настольные модели K10 получили имя Phenom. Они пришли на смену «Атлонам», хотя AMD сохранила торговую марку для своих Low-End продуктов. Первые решения на базе K10 производились по устаревающему 65-нм техпроцессу. К сожалению, архитектура AMD мало что могла противопоставить конкуренту в лице Intel Core.

В конце 2008 года K10 перешла на 45-нм технормы. В новой версии архитектуры (К10,5) контроллер памяти был обучен работе с памятью DDR2 и DDR3, а также значительно снизилось энергопотребление, что позволило существенно повысить тактовые частоты процессоров. В настольный сегмент пришли процессоры Phenom II, которые устанавливались в новый разъем Socket AM3, сохранивший, впрочем, обратную совместимость с предыдущим Socket AM2+. В плане производительности K10,5 удалось сократить огромный отрыв от Intel Core.

Далее производство «переехало» с 45-нм на 32-нм техпроцесс. Однако такие кристаллы нашли свое применение лишь в первых APU (Accelerated Processing Unit) компании AMD с кодовым названием Llano.


Шестиядерный процессор AMD Phenom II X6

В 2011 году на смену K10 пришла принципиально новая архитектура Bulldozer. Главное отличие «Бульдозера» от предшествующих платформ заключалось в самом строении ядра (а точнее модуля). Каждый модуль содержал два ядра, у каждого из которых был свой блок целочисленных вычислений и кэш-память 1-го уровня. При этом в рамках одного модуля у ядер был общий блок вычислений с плавающей запятой, 2 Мбайт кэша L2 и устройства выборки и декодирования инструкций. В плане работы «строительный блок» был похож на технологию Intel Hyper-Threading — можно даже сказать, что идеи «интеловской» технологии здесь были реализованы на аппаратном уровне. При этом по показателям производительности модуль Bulldozer приближался к полноценному двухъядерному процессору, имея при этом почти в два раза меньше транзисторов. Помимо перекроенной архитектуры, Bulldozer мог похвастаться исполнением четырех инструкций за такт. Среди других улучшений нужно отметить поддержку кэш-памяти 3-го уровня объемом 8 Мбайт, шины HyperTransport 3.1, технологии увеличения частоты ядер Turbo Core второго поколения и наборов инструкций AVX, SSE 4.1, SSE 4.2, AES. Также процессоры Bulldozer были наделены двухканальным контроллером памяти DDR3 с эффективной частотой 1866 МГц.


Процессор AMD Bulldozer

Первыми решениями на базе Bulldozer стали кристаллы FX. Но они так и не смогли потеснить процессоры Intel.

В AMD быстро осознали критичность ситуации, поэтому вскоре (в середине 2013 года) появилось на свет следующее поколение процессоров — Piledriver. Модель представляла собой улучшенную во всех отношениях архитектуру Bulldozer. Были доработаны блоки предсказания ветвлений, возросла производительность модуля операций с плавающей запятой и целочисленных вычислений, а также тактовая частота. Стал быстрее интегрированный контроллер памяти. При этом энергопотребление и тепловыделение снизилось. В среднем процессоры с архитектурой Piledriver стали на 15% быстрее «бульдозеров». Более детально с результатами этих процессоров можно ознакомиться в нашем обзоре AMD FX-8350.

Ну, а в начале этого года AMD представила третье поколение архитектуры Bulldozer — платформу Steamroller. Она не претерпела каких-либо кардинальных изменений в сравнении с Piledriver. Самое существенное нововведение — это интеграция для каждого модуля собственного независимого декодера, который может обрабатывать до четырех инструкций за такт. Была улучшена работа кэш-памяти, блока предсказания ветвлений и контроллера памяти.

Заключение

Вот и подошел к концу наш рассказ об истории развития центральных процессоров. Оглядываясь назад, можно увидеть, насколько современные «камни» отличаются хотя бы от тех решений, которые выпускались 15-20 лет назад. И удивительно, как при этом они могут иметь даже общие черты. Например, ту же архитектуру x86. А что касается ближайшего будущего, то нас непременно ждет много всего интересного. На конец этого года запланировал релиз 14-нм архитектуры Intel Broadwell, а на вторую половину 2015 года — новой платформы Skylake. В стане AMD готовятся к выходу в следующем году последнего поколения архитектуры Bulldozer под названием Excavator, после которой планируется запуск совершенно новых кристаллов. Очевидно, что Intel и AMD не дадут нам заскучать.

Российские разработчики, создававшие в советское время суперкомпьютеры, и сегодня продолжают работу над высокопроизводительными микропроцессорами. Статья, рассказывающая о микропроцессоре E2K, созданном в московском центре SPARC


Борис Бабаян

По словам главы МЦСТ Евгения Бабаяна, проект по созданию суперпроцессора E2K, преемника знаменитого процессора "Эльбрус", успешно развивается, и к концу 2002 года будет представлен прототип новой микросхемы. Однако, как подчеркнул Бабаян, до официального

представления прототипа ему бы не хотелось поднимать шум вокруг этого процессора.

Эта «битность» определяет разрядность чисел, с которыми работает процессор компьютера. На основе этой разрядности создается ПО, которое сможет работать на этом процессоре. Также эта разрядность определяет точность вычислений, которые может выполнять процессор.

Для большинства пользователей ПК дома и на работе большая точность данных не нужна, а для ученых, исследователей, военных, наоборот, точности не хватает. Поэтому усилия разработчиков процессоров направлены не только на увеличение частот, объемов кэш-памяти, но и увеличением разрядности.

С точки зрения пользователя компьютер – это связка железо+программы, которая обеспечивает выполнение каких-либо действий и получение нужного результата. Для работы с компьютером аппаратная (железо) и программная часть должны соответствовать друг другу.

 

Согласно планам МЦСТ, процессор "Эльбрус", изготовленный по 0,18-микронной технологии, сможет работать на частоте всего 400 МГц, зато его преемник "E2K", производимый по 0,13-микронной технологии, к 2004 году должен достичь тактовой частоты 1,2 ГГц, если все пойдет по плану. При использовании 0,1-микронной технологии тот же процессор сможет работать уже на тактовой частоте 3 ГГц. В будущем его производительность может превзойти производительность Itanium.

Первые процессоры, разработанные в МЦСТ, были клонами архитектуры SPARC фирмы Sun Microsystems, однако в новых процессорах используется собственный набор команд. По информации МЦСТ, специалистами центра была разработана технология "двоичной компиляции", аналогичная технологии "code-morphing" компании Transmeta и позволяющая реализовать совместимость процессора с набором команд X86.

Несмотря на то, что тактовая частота процессоров может показаться небольшой, прославить "Эльбрус" может архитектура явного параллелизма, которая использовалась и при создании процессора Transmeta Crusoe. При параллельном выполнении большего числа операций достигается более высокая производительность при низкой тактовой частоте, и при этом обеспечивается низкое энергопотребление.

Как утверждает академик Борис Бабаян, возглавляющий отделение разработок МЦСТ, современные американские компьютеры способны параллельно выполнять до шести операций, а компьютеры российской разработки выполняют двадцать четыре операции. По его мнению, результаты, которых добилась российская школа разработчиков микропроцессоров, пока находятся вне пределов досягаемости западных разработчиков. Однако главная проблема состоит в отсутствии финансирования: "Даже если правительство выделит 100 миллионов долларов на разработку новой архитектуры, оно не сможет найти лишний миллиард долларов на маркетинг". Поэтому Бабаян видит выход в продолжении сотрудничества с такими западными фирмами, как Avant!, Cisco Systems, Infineon Technologies, Sun Microsystems, и Transmeta.

Пока не существует физического образца нового процессора, многие аналитики воздерживаются от его заочной оценки.

 


Компьютер Compaq Deskpro 386

Источник изображения

Первым компьютером, использующим процессор i386, стал Compaq Deskpro 386. На то время Compaq стала первой «сторонней» компанией в истории, которая внесла существенные изменения в платформу PC. До того момента новые компьютеры первой всегда выпускала IBM. Она могла оказаться первой и на этот раз, но у IBM был долгосрочный контракт на использование 286-х процессоров, и в компании предпочли уделить 16-битной платформе еще некоторое время. Как показала история, этот шаг стал довольно большой ошибкой. Deskpro 386 отлично продавались, поэтому к моменту запуска первых компьютеров IBM на базе 386-го процессора компания уже утратила свои лидирующие позиции. В итоге Compaq сумела немного «перекроить» весь рынок десктопов. Так, возросла конкуренция, а влияние IBM было уже не столь существенным.


Энди Гроув — бывший CEO компании Intel

Источник изображения

Как и раньше, вскоре на рынке появились клоны i386. Их производством занимались несколько компаний: AMD, Cyrix и IBM. Однако политика самой Intel в отношении клонов изменилась. CEO компании Энди Гроув принял решение не выдавать лицензии на производство модификаций i386 сторонним компаниям, однако впоследствии они все-таки появились. Первой клоны выпустила AMD в марте 1991 года. Процессоры были готовы задолго до этой даты, но в Intel были уверены, что лицензия на производство «дубликатов», предоставленная AMD, распространялась только на процессоры 80286 и более ранние, поэтому дело дошло до суда. Судебные тяжбы продолжались довольно долгое время, но в итоге AMD выиграла дело, и семейство процессоров AMD Am386 таки увидело свет. В линейку входили клоны как процессоров 386DX, так и 386SX. Топовая модель — Am386DX — получила тактовую частоту 40 МГц, то есть на 7 МГц больше, чем у самой производительной модификации Intel! Производительность такого процессора находилась на уровне уже выпущенного к тому времени кристалла следующего поколения от Intel — i486. При этом стоимость решения AMD была намного ниже, чем моделей Intel. Благодаря выгодному сочетанию цены и скорости процессор нашел применение во многих настольных системах.

1)В …….. годах получила свое развитие технология изготовления интегральных схем, что позволило создавать микрочипы с расположенными на них транзисторами.

2) «закон Мура» как он звучит.

3)Пропускная способность Psi Exspress x8

Дополнительный вопрос

4)Возможно ли вставить в сокет Am3 Процессор серии FX?Почему “да или нет”