рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Лекция 10. Минимализация потерь на выполнение команд перехода.

Лекция 10. Минимализация потерь на выполнение команд перехода. - раздел Компьютеры, Микропроцессоры. Основные определения Минимизация Конфликтов По Уровню. Конфликты По Уровню Могут Вызывать...

Минимизация конфликтов по уровню.

Конфликты по уровню могут вызывать даже большие потери, чем конфликты по данным. Команды условного перехода может изменить значение счетчика программ (тогда такой переход называют выполняемым, а если не изменет, то невыполняемым)

Простейший способ борьбы с такими конфликтами заключается в приостановке конвеера. Как только обнаруживается команда условного перехода, конвеер останавливается, пока она не достигнет ступени, которая вычисляет новое значение счетчика программы

На втором такте происходит дешифрация команды условного перехода и конвеер останавливается. Далее возобновляет свою работу на 5ом такте в момент вычисления целевого адреса. Таким образом команда i могла быть загружена в конвеер в любом случае.

Например, если при каждом выполнении команды условного перехода конвеер приостанавливает выполнение на 3 такта, а количество команд условного перехода состовляет 30% от общего числа команд, то машина достигает половину производительности, которую может достичь при конвеерном выполнении команд. Существует несколько методов по борьбе с конфликтами по управлению: статический и динамический.

В 1-ом случае прогнозирование направления перехода фиксируется для каждой команды условного прехода на все время выполнения команды, то есть могут быть используемые на уровне компилятора.

Во 2-ом случае схема прогнозирует реализацию автоматически.

Статическое:

1)Метод ожидания

2 Метод возврата

3)Мживания перехода

1. Представляет собой простейший способ обработки данных конфликтов и заключается в остановке выполнения всех команд в конвеере с момента дешифрации команд условного перехода до момента вычисления целевого адреса.

2. Более эффективной и не намного более сложный метод возврата состоит в том, чтобы прогнозировать условный переход как невыполнимый. В этом случае аппаратура процессора продолжает выполнение команды как будто команды условного перехода не было. Однако если условный переход оказывается выполняемым, то конвеер очищается и заново производится выборка команд. Используется и альтернативная схема, когда условный переход прогнозируется выполняемым.

3. Идея метода заключатся в том, что между моментом загрузки команды условного перехода и собственно переходом по выбранной ветке в конвеер загружаются команды, не связанные с выполнением команды условного перехода.

 

В данном случае в интервале задержки содержится n команд, выполнение которых не зависит от результата выполнения команды условного перехода. Задачи программной части обеспечивать независимость этих команд от условного перехода, а задача аппаратной части обеспечивать выполнение всех команд в интервале задержки

В данном случае интервал задержки заполняется независимой командой, находящейся перед командой условного перехода.

В данном примере направление условного перехода зависит от содержимого регистра . Это значит, что мы не можем переместить команду слож. в интервал задержки. Поэтому в интервал задержки помещается команда вычитания у которой нет зависимости по данным с последними командами сложения и условного перехода.

Из-за такой перестановки необходимо произвести копирование перестав. команд для того, чтобы сохранить порядок следования команд при обращении к переставляемой команде из другого участка программы.

Пример 3 (оптимизированной командой вычитания)

 

Требования При каких условиях получается достичь выигрыш производительности
Команда условного перехода не зависит от переставления команды Всегда, когда есть независимые команды
Выполнение переставляемой команды должно быть корректно, даже если переход не выполняется Прирост получаем, когда переход выполняется. Может увеличиваться размер программы. Из-за копирования команд
Выполнение переставляемой команды должно быть корректно, даже если переход выполняется Прирост получается, когда переход не выполняется

 

Простейший способ динамического предсказания условных переходов, заключается в том, что процессор фиксирует результат выполнения предыдущих команд ветвления по данному адресу, и считает что следующая команда с обращением по данному адресу даст аналогичный результат. Для реализации этого способа используется специальная память (то есть, где будут сохраняться адреса переходов)

Эффективность данного способа зависит от объема памяти и вероятность предсказания может достигать 80%. Для повышения вероятности правильного предсказания используют алгоритмы накапливающие и анализирующие статистику условного перехода по данному адресу и вероятность правильного предсказания повышается до 90-95%.

 

– Конец работы –

Эта тема принадлежит разделу:

Микропроцессоры. Основные определения

На сайте allrefs.net читайте: "Микропроцессоры. Основные определения"

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Лекция 10. Минимализация потерь на выполнение команд перехода.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Обобщенная структура микропроцессора
Рис. 1.2. Обобщённая структура микропроцессора   Регистровое арифметико

Структура, подход к проектированию, основные уравнения работы АЛУ.
АЛУ - это комбинационная схема, предназначенная для выполнения арифметических и поразрядно логических операций над многоразрядными словами. Основные требования к АЛУ: - выполнение различны

Лекция 4. Регистровое арефметикологическое устройство. Базовая структура микропроцессора.
  - любая операция  

Лекция 5. Однокристальный РАЛУ.
В однокристальном РАЛУ характерно наращивание разрядности программным способом, для этого необходима определенная аппаратная поддержка. Поясним на примере: сложим 2-х разрядные числа с пом

Регистровый АЛУ разрядномодульного типа.
    Наращивание разрядности производится только аппаратным путем.  

Принцип построения кеш-памяти.
Поскольку обмен с внешним ОЗУ происходит на частоте шины или даже на более меньшей частоте, то при выполнении процессором программы, где обрабатываются большие массивы данных находящиеся в ОЗУ – мо

Типовые структуры микросистем
Магистрально модульные   Все элименты объеденены одной общей магистралью. В одном

Прерывания
- Программные – реализуются с помощью специальных команд. Фактически это переход по указанному адресу. - Аппаратные - это запросы от внешних устройств. · Маскируе

Прямой доступ к памяти.
Режим прямого доступа к памяти используется, когда необходимо произвести пересылку большого объема данных между ОЗУ и внешним устройством. Реализация такой пересылки с помощью программы обмена треб

Арбитр магистрали (AM).
В каждый момент времени на магистрали допускается в наличии только одно активное устройство. В простейших системах этим устройством является МП. В более сложных системах с множеством активных систе

Лекция 16. Синхронный и асинхронный обмен микропроцессора с внешним устройством
Синхронная: Устройства делем на три группы 1) Доступные по чтению 2) Доступные по записи 3) Доступные по чтению и записи Доступные по чтению:

Лекция 19-20.Структура современных 8-разрядных микроконтроллеров.
Микроконроллер (МК) представляет собой законченную микропроцессорную систему , которая организована в виде одной большой интегральной схемы на одном кристалле. Существует большое ра

Систолические системы
  Разработчики систолических структур поставили задачу комбинировать достоинства матричных и конвейерных систем. Основной принцип заключается в том, чтобы обработать все элементы данн

Кластерные системы
  Под кластерной системой понимается набор компьютеров, используемый в качестве единого вычислительного ресурса. Эти системы являются логическим продолжением систем с раздельной памят

Архитектуры машин, управляемых потоком данных
  В машинах, управляемых по

Структура машины Дэнниса
  Структура состоит из трёх частей: 1. память с ячейками команд; 2. блоки АЛУ и пр

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги