SlideShare a Scribd company logo
1 of 27
Разработка программно-аппаратного
обеспечения информационных и
автоматизированных систем
Лекция 2. Архитектуры вычислительных систем
1
Классификация Флинна
– SISD (Single Instruction, Single Data)
– MISD (Multiple Instruction, Single Data)
– SIMD (Single Instruction, Multiple Data)
– MIMD (Multiple Instruction, Multiple Data)
2
Закон Амдала
3
• Предположим, что доля a в
вычислениях может быть
выполнена только
последовательно. Тогда для p
процессоров ускорение составит
Классификация параллельных архитектур
по Симе и Фонтейну
Параллельные
архитектуры
Параллелизм
уровня данных
Векторная
SIMD
Систолическая
Параллелизм
уровня функций
Параллелизм
уровня инструкций
VLIW
Суперскалярная
Параллелизм
уровня потоков
Параллелизм
уровня процессов
С распределенной
памятью
(мультикомпьютер)
С общей памятью
(мультипроцессор)
4
Процессор
5
Основные характеристики процессора
• по организации доступа к памяти: гарвардская или фоннеймановская архитектура, где гарвардская
архитектура подразумевает физически раздельные память инструкций и память данных, а в
архитектуре фон Неймана инструкции и данные хранятся в одном устройстве;
• разрядность данных, обрабатываемых в АЛУ;
• тактовая частота ( т.е. частота перемещения данных между компонентами процессора); эта частота в
общем случае не эквивалентна частоте преобразования данных;
• регистровая модель процессора – число и назначение регистров, их разрядность;
• система команд процессора – набор поддерживаемых инструкций, возможные операнды для них;
• показатель CPI (Cycles Per Instruction) – количество тактов для исполнения инструкций (обычно этот
параметр имеет индивидуальные значения для инструкций или их групп).
6
Процессор
Архитектура
системы команд
Микроархитектура
7
Пример характеристик CPU Intel Coffee Lake
Серия Количество ядер
(потоков)
Тактовая частота,
ГГц
Потребляемая
мощность
(«тепловой
пакет»), Вт
Core i9 6 (12) 2,1 – 4,0 35 - 95
Core i7 4 (8) 2,4 – 4,0 35 - 95
Core i5 4 (8) 1,7 – 3,6 35 – 95
Core i3 2 (4) 3,1 – 4,0 35 – 91
Pentium Gold 2 (4) 3,1 – 3,9 35 – 54
Celeron 2 (2) 2,9 – 3,2 35 - 54
8
GPU Nvidia
9
Характеристики GPU семейства RTX
компании Nvidia
GTX 1650 RTX 2060 RTX 2080 TITAN RTX
Ядер CUDA 896 1920 2944 4608
Тензорных ядер – 240 368 576
Кластеров
обработки графики
2 3 6 6
Производительност
ь FP64, GFLOPS
83,1 163,8 203,0 388,8
Производительност
ь тензорных ядер
INT8/INT4, TOPS
– 83,8/167,7 142,7/285,4 199,0/398,1
Потребляемая
мощность, Вт
75 160 215 280
10
Модуль Nvidia Jetson для встраиваемых
применений
• CUDA (Compute Unified Device
Architecture) позволяет
переносить часть вычислений
на GPU
11
Процессоры цифровой обработки сигналов
• Также «сигнальные процессор», DSP (Digital Signal Processor)
• Основная черта – наличие команды «умножение с накоплением»
(MAC, Multiply and Accumulate)
• TI C5000, C6000
• Analog Devices ADSP21xx, TigerSharc, BlackFin
12
Характеристики TI C6000
13
Нейросети
14
Варианты архитектур нейросетей
15
Нейроускоритель Google TPU
16
Микроконтроллеры
• МК (MCU) содержат в одном корпусе ядро
процессора, память и периферию
• Широкие диапазоны характеристик
• 8 бит, 4-8 МГц (Attiny, 8051)
• 32 бит, 24-200 МГц (Cortex-M)
• Встроенные модули АЦП, USB, UART, SPI
• Реже – контроллеры внешней памяти
• Накристальная память содержит flash для
программ и ОЗУ для данных
17
Пример средств разработки для МК
• Настройка аппаратного обеспечения
МК с помощью конфигуратора создает
наборы библиотек (C headers) с
константами, описывающими
периферийные устройства и базовым
набором функций для доступа к ним
• Разработка программного обеспечения
производится на базе IDE при условии
подключения созданных программных
компонентов
• Разработка программного обеспечения
существенно зависит от настройки
аппаратного обеспечения
18
Платформа Arduino
• Arduino не является процессором
или микроконтроллером
• Основа платформы –
управляющий модуль и
дополнительные платы
расширения (shield)
• Программирование на базе языка
Си, однако существенно
упрощена настройка
периферийных устройств
19
Пример периферийных устройств
• Набор датчиков с интерфейсом PMOD
• PMOD – 2 ряда по 6 выводов (2 вывода
питания, 2 вывода земли, 8 сигнальных
выводов)
• Нет универсального интерфейса, с
помощью форм-фактора PMOD могут
быть подключены различные варианты
устройств
20
Платформы на базе ПЛИС
• Zedboard – отладочная
плата на базе ПЛИС Zynq-
7000
• Alveo – ускоритель на базе
высокопроизводительной
FPGA Xilinx
• Модуль «Плеяда» (Россия)
на базе FPGA Xilinx
21
Многоядерные процессоры
• SW26010
• Тенденции:
• Кластерная организация
• Специализация
процессорных ядер
(требуется анализ
программного
обеспечения)
• Управляющие ядра ARM
22
Гетерогенные вычислительные системы.
• Гетерогенные («разнородные») системы предназначены для
задач с различными типами вычислительной нагрузки для
отдельных подзадач
• Пример: CPU + GPU – процессор общего назначения и
графический ускоритель для построения трехмерной графики
• Разновидности вспомогательных подсистем:
• DSP (сигнальный процессор)
• FPGA
• Сетевой процессор
23
Облачные и туманные вычисления
• Облачные вычисления (cloud computing) – передача данных на
сервер («в облако») для последующей обработки
• Туманные вычисления (fog computing) – предварительная
обработка собранных данных с целью уменьшения сетевого
трафика и обеспечения автономной реакции
24
Интернет вещей
• Internet of Things (IoT)
• Распределенные системы датчиков
(возможно, исполнительных устройств)
• Обязателен беспроводной интерфейс
• Интерфейсы с высокой скоростью и дальностью
передачи имеют высокое потребление энергии
• Может использоваться многозвенная
архитектура: маломощный беспроводной
интерфейс → концентратор → ПК (сеть)
25
Системы сбора данных.
• Интернет вещей может рассматриваться как подкласс систем сбора
данных
• Распределенные датчики (например, промышленная автоматика)
подключаются по беспроводным (см. IoT) или проводным
интерфейсам, образуя иерархию устройств
• Подсистема датчиков автомобиля (совокупности близко находящихся
автомобилей)
• Подсистема датчиков станка (цеха, предприятия)
• Подсистема датчиков «умного дома»
• Реализация – микроконтроллер с низким энергопотреблением
• Предварительная статистическая обработка, фильтрация данных, мониторинг
состояния
26
Выводы:
• Аппаратная архитектура вычислительного устройства находится в
тесной взаимосвязи с особенностями решаемых задач
• Различные классы задач требуют различных архитектур
вычислительных устройств
• Перспективными являются гетерогенные вычислительные
системы и разработка методов их проектирования
27

More Related Content

Similar to Лекция 2 Разработка программно-аппаратного обеспечения информационных и автоматизированных систем.pptx

Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Cisco Russia
 
Обзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурОбзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурIoT Community
 
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ontico
 
Современные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO StorageСовременные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO StorageDEPO Computers
 
Технические средства реализации информационных процессов
Технические средства реализации информационных процессовТехнические средства реализации информационных процессов
Технические средства реализации информационных процессовstudent_SSGA
 
Параллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахПараллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахAlex Tutubalin
 
Новейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономитьНовейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономитьFujitsu Russia
 
Смарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны РазработчикаСмарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны РазработчикаPositive Hack Days
 
Virt2real - есть ли жизнь в железе?
Virt2real - есть ли жизнь в железе?Virt2real - есть ли жизнь в железе?
Virt2real - есть ли жизнь в железе?Maxim Krentovskiy
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыVsevolod Shabad
 
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...DEPO Computers
 
Опыт внедрения OpenStack
Опыт внедрения OpenStackОпыт внедрения OpenStack
Опыт внедрения OpenStackYandex
 
Cisco UCS полный обзор
Cisco UCS полный обзорCisco UCS полный обзор
Cisco UCS полный обзорLiubov Belousova
 
Новейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономитьНовейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономитьFujitsu Russia
 
ARM vs Intel microarchitecture
ARM vs Intel microarchitectureARM vs Intel microarchitecture
ARM vs Intel microarchitectureIlya Kryukov
 
ETegro: решения для ЦОД
ETegro: решения для ЦОДETegro: решения для ЦОД
ETegro: решения для ЦОДMirantis IT Russia
 
Scalablehw Лагунцов
Scalablehw ЛагунцовScalablehw Лагунцов
Scalablehw ЛагунцовOntico
 

Similar to Лекция 2 Разработка программно-аппаратного обеспечения информационных и автоматизированных систем.pptx (20)

Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
Архитектура и уникальные особенности магистральной платформы Cisco NCS 6000
 
Обзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурОбзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектур
 
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
 
Современные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO StorageСовременные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO Storage
 
Модульные промышленные ПК Advantech
Модульные промышленные ПК AdvantechМодульные промышленные ПК Advantech
Модульные промышленные ПК Advantech
 
13.pptx
13.pptx13.pptx
13.pptx
 
Технические средства реализации информационных процессов
Технические средства реализации информационных процессовТехнические средства реализации информационных процессов
Технические средства реализации информационных процессов
 
Параллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартахПараллельное программирование на современных видеокартах
Параллельное программирование на современных видеокартах
 
Новейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономитьНовейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономить
 
Смарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны РазработчикаСмарт - Технологии, Взгляд Со Стороны Разработчика
Смарт - Технологии, Взгляд Со Стороны Разработчика
 
Prez osob mikroproc
Prez osob mikroprocPrez osob mikroproc
Prez osob mikroproc
 
Virt2real - есть ли жизнь в железе?
Virt2real - есть ли жизнь в железе?Virt2real - есть ли жизнь в железе?
Virt2real - есть ли жизнь в железе?
 
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктурыГидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
 
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
Новые модели серверов DEPO Storm на базе Intel Xeon. Практический опыт постро...
 
Опыт внедрения OpenStack
Опыт внедрения OpenStackОпыт внедрения OpenStack
Опыт внедрения OpenStack
 
Cisco UCS полный обзор
Cisco UCS полный обзорCisco UCS полный обзор
Cisco UCS полный обзор
 
Новейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономитьНовейшие серверные решения от Fujitsu и как они позволяют экономить
Новейшие серверные решения от Fujitsu и как они позволяют экономить
 
ARM vs Intel microarchitecture
ARM vs Intel microarchitectureARM vs Intel microarchitecture
ARM vs Intel microarchitecture
 
ETegro: решения для ЦОД
ETegro: решения для ЦОДETegro: решения для ЦОД
ETegro: решения для ЦОД
 
Scalablehw Лагунцов
Scalablehw ЛагунцовScalablehw Лагунцов
Scalablehw Лагунцов
 

Лекция 2 Разработка программно-аппаратного обеспечения информационных и автоматизированных систем.pptx

  • 1. Разработка программно-аппаратного обеспечения информационных и автоматизированных систем Лекция 2. Архитектуры вычислительных систем 1
  • 2. Классификация Флинна – SISD (Single Instruction, Single Data) – MISD (Multiple Instruction, Single Data) – SIMD (Single Instruction, Multiple Data) – MIMD (Multiple Instruction, Multiple Data) 2
  • 3. Закон Амдала 3 • Предположим, что доля a в вычислениях может быть выполнена только последовательно. Тогда для p процессоров ускорение составит
  • 4. Классификация параллельных архитектур по Симе и Фонтейну Параллельные архитектуры Параллелизм уровня данных Векторная SIMD Систолическая Параллелизм уровня функций Параллелизм уровня инструкций VLIW Суперскалярная Параллелизм уровня потоков Параллелизм уровня процессов С распределенной памятью (мультикомпьютер) С общей памятью (мультипроцессор) 4
  • 6. Основные характеристики процессора • по организации доступа к памяти: гарвардская или фоннеймановская архитектура, где гарвардская архитектура подразумевает физически раздельные память инструкций и память данных, а в архитектуре фон Неймана инструкции и данные хранятся в одном устройстве; • разрядность данных, обрабатываемых в АЛУ; • тактовая частота ( т.е. частота перемещения данных между компонентами процессора); эта частота в общем случае не эквивалентна частоте преобразования данных; • регистровая модель процессора – число и назначение регистров, их разрядность; • система команд процессора – набор поддерживаемых инструкций, возможные операнды для них; • показатель CPI (Cycles Per Instruction) – количество тактов для исполнения инструкций (обычно этот параметр имеет индивидуальные значения для инструкций или их групп). 6
  • 8. Пример характеристик CPU Intel Coffee Lake Серия Количество ядер (потоков) Тактовая частота, ГГц Потребляемая мощность («тепловой пакет»), Вт Core i9 6 (12) 2,1 – 4,0 35 - 95 Core i7 4 (8) 2,4 – 4,0 35 - 95 Core i5 4 (8) 1,7 – 3,6 35 – 95 Core i3 2 (4) 3,1 – 4,0 35 – 91 Pentium Gold 2 (4) 3,1 – 3,9 35 – 54 Celeron 2 (2) 2,9 – 3,2 35 - 54 8
  • 10. Характеристики GPU семейства RTX компании Nvidia GTX 1650 RTX 2060 RTX 2080 TITAN RTX Ядер CUDA 896 1920 2944 4608 Тензорных ядер – 240 368 576 Кластеров обработки графики 2 3 6 6 Производительност ь FP64, GFLOPS 83,1 163,8 203,0 388,8 Производительност ь тензорных ядер INT8/INT4, TOPS – 83,8/167,7 142,7/285,4 199,0/398,1 Потребляемая мощность, Вт 75 160 215 280 10
  • 11. Модуль Nvidia Jetson для встраиваемых применений • CUDA (Compute Unified Device Architecture) позволяет переносить часть вычислений на GPU 11
  • 12. Процессоры цифровой обработки сигналов • Также «сигнальные процессор», DSP (Digital Signal Processor) • Основная черта – наличие команды «умножение с накоплением» (MAC, Multiply and Accumulate) • TI C5000, C6000 • Analog Devices ADSP21xx, TigerSharc, BlackFin 12
  • 17. Микроконтроллеры • МК (MCU) содержат в одном корпусе ядро процессора, память и периферию • Широкие диапазоны характеристик • 8 бит, 4-8 МГц (Attiny, 8051) • 32 бит, 24-200 МГц (Cortex-M) • Встроенные модули АЦП, USB, UART, SPI • Реже – контроллеры внешней памяти • Накристальная память содержит flash для программ и ОЗУ для данных 17
  • 18. Пример средств разработки для МК • Настройка аппаратного обеспечения МК с помощью конфигуратора создает наборы библиотек (C headers) с константами, описывающими периферийные устройства и базовым набором функций для доступа к ним • Разработка программного обеспечения производится на базе IDE при условии подключения созданных программных компонентов • Разработка программного обеспечения существенно зависит от настройки аппаратного обеспечения 18
  • 19. Платформа Arduino • Arduino не является процессором или микроконтроллером • Основа платформы – управляющий модуль и дополнительные платы расширения (shield) • Программирование на базе языка Си, однако существенно упрощена настройка периферийных устройств 19
  • 20. Пример периферийных устройств • Набор датчиков с интерфейсом PMOD • PMOD – 2 ряда по 6 выводов (2 вывода питания, 2 вывода земли, 8 сигнальных выводов) • Нет универсального интерфейса, с помощью форм-фактора PMOD могут быть подключены различные варианты устройств 20
  • 21. Платформы на базе ПЛИС • Zedboard – отладочная плата на базе ПЛИС Zynq- 7000 • Alveo – ускоритель на базе высокопроизводительной FPGA Xilinx • Модуль «Плеяда» (Россия) на базе FPGA Xilinx 21
  • 22. Многоядерные процессоры • SW26010 • Тенденции: • Кластерная организация • Специализация процессорных ядер (требуется анализ программного обеспечения) • Управляющие ядра ARM 22
  • 23. Гетерогенные вычислительные системы. • Гетерогенные («разнородные») системы предназначены для задач с различными типами вычислительной нагрузки для отдельных подзадач • Пример: CPU + GPU – процессор общего назначения и графический ускоритель для построения трехмерной графики • Разновидности вспомогательных подсистем: • DSP (сигнальный процессор) • FPGA • Сетевой процессор 23
  • 24. Облачные и туманные вычисления • Облачные вычисления (cloud computing) – передача данных на сервер («в облако») для последующей обработки • Туманные вычисления (fog computing) – предварительная обработка собранных данных с целью уменьшения сетевого трафика и обеспечения автономной реакции 24
  • 25. Интернет вещей • Internet of Things (IoT) • Распределенные системы датчиков (возможно, исполнительных устройств) • Обязателен беспроводной интерфейс • Интерфейсы с высокой скоростью и дальностью передачи имеют высокое потребление энергии • Может использоваться многозвенная архитектура: маломощный беспроводной интерфейс → концентратор → ПК (сеть) 25
  • 26. Системы сбора данных. • Интернет вещей может рассматриваться как подкласс систем сбора данных • Распределенные датчики (например, промышленная автоматика) подключаются по беспроводным (см. IoT) или проводным интерфейсам, образуя иерархию устройств • Подсистема датчиков автомобиля (совокупности близко находящихся автомобилей) • Подсистема датчиков станка (цеха, предприятия) • Подсистема датчиков «умного дома» • Реализация – микроконтроллер с низким энергопотреблением • Предварительная статистическая обработка, фильтрация данных, мониторинг состояния 26
  • 27. Выводы: • Аппаратная архитектура вычислительного устройства находится в тесной взаимосвязи с особенностями решаемых задач • Различные классы задач требуют различных архитектур вычислительных устройств • Перспективными являются гетерогенные вычислительные системы и разработка методов их проектирования 27