Comments by "Ygorij" (@Ygorij) on "Тест AMD RX 590 против GTX 1060 - 5 игр, NHM и 3DMark" video.
-
@Executor_II Разное соотношение блоков и у Нвидиевских блоков. Есть шейдерные блоки, есь растровые, есть новомодные, по отслеживанию лучей. При чем в новых ВК этого поколения соотношение тоже изменилось соотношение растровых и текстурных блоков. Просто такое соотношение диктуется потребностью, не все блоки одинаково нагружены, и смысла тратить ценные транзисторы на невостребованные блоки нет, лучше из потратить на нужные блоки.
Так же и с фикусом. Там были до 4 модулей, в каждом из которых по 2 ALU на 1 FPU. ALU - это маленькое быстрое ядро, похожее на ядро ARM. А FPU - это сопроцессор, способный выполнять сложные вычисления за небольшое количество тактов и занимает он на кристале гораздо больше места. Плотность транзисторов того времени не позволяла разместить больше 4 ядер за приемлимую себестоимость ни интел, ни АМД. Интел поставила дополнительный планировщик инструкций, получив технологию многопоточности (это, кстати, АМДшная технология, которую те запатентовали в 99 году), а АМД поставила второй маленький ALU модуль. И тоже получила многопоточность. Суть в том, что нагрузка на FPU в два раза ниже, чем на ALU и при одном ALU сопроцессорный модуль часто простаивает. Тоесть fx8300 и i7 2600 были четырехмодульными с многопоточностью. при чем, в теории, АМДшная многопоточность была лучше, поскольку при простых вычислениях у нас оказывалось настоящих 8 ядер , а при сложных - 4, а у интел и при простых и при сложных вычислениях было по 4 ядра. А проблемы были у фикуса не изза вычислительной мощности ядер, а изза слабой внутрисистемной шины и контроллера памяти, которые не могли нагрузить эти ядра данными для обработки. Отсуда и кукурузный разгон фикуса, когда народ гнал скорость вычислений, а не скорость подачи данных. Отсюда и хреновая производительность в играх, где ядра много обмениваются информацией между собой. В редактировании видео FX уделывал даже i7 2600к, поскольку на внутрисистемную шину в такой задаче было мало нагрузки.
В видеокартах такой большой нагрузки на внутриситемную шину нет, там латентности практически не играют роли, а играет роль Пропускная Способность Памяти (ПСП). , поскольку ядра мало общаются между собой, а делают много простой и рутинной работы. Ядра в вк еще меньше ядер ALU в центральных процессорах и предназначены только для узких задач. И тут 256 бит передачи за такт при частоте тактов 8000 миллионов в секунду у 580 полнее нагрузит видеопроцессор, чем 192 бита за такт при 7000 миллионов тактов в секунду у 1060. Настройки текстур при любом объеме текстур требуют одинакового количества вычислительных тактов процессора, но при этом более качественные текстуры должны иметь больше места в памяти и быстрее подгружаться.
6
-
@Executor_II У нее не супербыстрая память. У неё память с принципиально другой конструкцией. Обычная планка памяти ддр4 передает по 64 бита за такт с частотой 2133 миллиона тактов в секунду. перемножаем 64 на 2133 миллиона - получим ПСП, пропускную способность памяти. Поставим двухканал, две планки - будут передаваться 128 бит за такт. У ДДР3 базовая частота в двое ниже, 1066, но если поставить проц с поддержкой четырехканала, мы получим 256 бит за такт и ПСП будет идентична двухканалу 2133. Память у обычных видеокарт - это слегка модифицированная ДДР4, больше латентность, но больше частота. А вот память у веги - медленная, многослойная, дорогая в печати, но передаёт не 64 бита на канал (у 1080ti - 6 каналов, 384 бита ) а сразу 4096 бита за такт, просто этих тактов намного меньше.
5
-
@Executor_II Потребляют энергии - да, больше. И берут не оптимизацией игр, а грубой вычислительной мощью. С точки зрения конечного пользователя, пофиг, как это достигнуто. Но если встретится неоптимизированный ни подо что проект, выгоднее будет голая вычислительная мощь. Но сказать, что горячее нельзя, в обоих случаях, что с 1060, что с 580, ставятся соответствующие системы охлаждения, и в обоих случаях все норм. Главный плюс 480,580 и 590 над 1060 - это не чип, а 8 гигов более быстрой памяти, что позволяет использовать более качественные текстуры и поднять качество этой настройки в играх.
4
-
3
-
@Executor_II На самом деле, там много больше разницы, чем просто соотношение растровых и шейдерных блоков. Тоесть, у нвидии блоков меньше, но работают они чаще, у них больше частота. Дальше, есть такое понятие, как аппаратная поддержка инструкций. Например, нам надо "A * B". Процессору нужно знать три вещи, что такое "A", что такое "B" и что такое "*" . Все эти данные процессор берет из памяти. Но, поскольку мы часто умножаем, то мы можем записать умножение на сам чип, на постоянной основе. Тоесть, проц подгружает из памяти только "A" и"B", а что такое умножить "*" он уже знает. Тоесть, мы получим профит от аппаратной поддержки. Такой поддержки больше у Нвидии. НО! НО! НО! За все надо платить, и за то, что чип будет знать, как умножать, нам нужно будет расплачиваться транзисторами, которые на самом кристале будут лишнее занимать место и хранить условие однотипных задач, которое можно занять чем - нибудь другим. Например - лишними вычислительными ядрами. А условие каждый раз подгружать из памяти. Тогда нам потребуется память большего объема и скорости, но кристалл будет занят более полезными модулями, чем устройствами хранения дополнительных данных. А это уже подход АМД. По этому, пока мы умножаем - будут быстрее карты нвидии, а как мы перейдем к другим математическим действиям - карты АМД.
В реальных условиях - пока игра оптимизирована и использует DX11 - карты нвидии решают, как только оптимизацию не завезли или не dx11, то решают карты АМД. И тут кроется еще одна проблема АМДшного подхода, - ПАМЯТЬ. Максимальная мощность самой мощной видеокарты определяется памятью, а поскольку память у АМД используется интенсивнее, самая топовая ВК от АМД будет слабее самого топа от Нвидии. Но на среднеценовые ВК это не распространяется.
Разумеется, это теоретическая картина, по факту, аппаратную поддержку юзают и Нвидиа и АМД, просто Нвидиа её юзает интенсивнее.
3