Comments by "Ygorij" (@Ygorij) on "PRO Hi-Tech" channel.

  1. 6
  2. 6
  3. 6
  4. 6
  5. 6
  6. 6
  7.  @Executor_II  Разное соотношение блоков и у Нвидиевских блоков. Есть шейдерные блоки, есь растровые, есть новомодные, по отслеживанию лучей. При чем в новых ВК этого поколения соотношение тоже изменилось соотношение растровых и текстурных блоков. Просто такое соотношение диктуется потребностью, не все блоки одинаково нагружены, и смысла тратить ценные транзисторы на невостребованные блоки нет, лучше из потратить на нужные блоки. Так же и с фикусом. Там были до 4 модулей, в каждом из которых по 2 ALU на 1 FPU. ALU - это маленькое быстрое ядро, похожее на ядро ARM. А FPU - это сопроцессор, способный выполнять сложные вычисления за небольшое количество тактов и занимает он на кристале гораздо больше места. Плотность транзисторов того времени не позволяла разместить больше 4 ядер за приемлимую себестоимость ни интел, ни АМД. Интел поставила дополнительный планировщик инструкций, получив технологию многопоточности (это, кстати, АМДшная технология, которую те запатентовали в 99 году), а АМД поставила второй маленький ALU модуль. И тоже получила многопоточность. Суть в том, что нагрузка на FPU в два раза ниже, чем на ALU и при одном ALU сопроцессорный модуль часто простаивает. Тоесть fx8300 и i7 2600 были четырехмодульными с многопоточностью. при чем, в теории, АМДшная многопоточность была лучше, поскольку при простых вычислениях у нас оказывалось настоящих 8 ядер , а при сложных - 4, а у интел и при простых и при сложных вычислениях было по 4 ядра. А проблемы были у фикуса не изза вычислительной мощности ядер, а изза слабой внутрисистемной шины и контроллера памяти, которые не могли нагрузить эти ядра данными для обработки. Отсуда и кукурузный разгон фикуса, когда народ гнал скорость вычислений, а не скорость подачи данных. Отсюда и хреновая производительность в играх, где ядра много обмениваются информацией между собой. В редактировании видео FX уделывал даже i7 2600к, поскольку на внутрисистемную шину в такой задаче было мало нагрузки. В видеокартах такой большой нагрузки на внутриситемную шину нет, там латентности практически не играют роли, а играет роль Пропускная Способность Памяти (ПСП). , поскольку ядра мало общаются между собой, а делают много простой и рутинной работы. Ядра в вк еще меньше ядер ALU в центральных процессорах и предназначены только для узких задач. И тут 256 бит передачи за такт при частоте тактов 8000 миллионов в секунду у 580 полнее нагрузит видеопроцессор, чем 192 бита за такт при 7000 миллионов тактов в секунду у 1060. Настройки текстур при любом объеме текстур требуют одинакового количества вычислительных тактов процессора, но при этом более качественные текстуры должны иметь больше места в памяти и быстрее подгружаться.
    6
  8. 5
  9. 5
  10. 5
  11. 5
  12. 5
  13. 5
  14. 5
  15. 5
  16. 5
  17. 5
  18. 5
  19. 5
  20. 5
  21. 5
  22. 4
  23. 4
  24. 4
  25. 4
  26. 4
  27. 4
  28. 4
  29. 4
  30.  @MaksimFranz  Поясню теперь за необходимость возвращения к плану. Рынок - это не оптимизированная система, как плохая игра, который жрет слишком много ресурсов впустую. 1 пример. Мы производим стиральные машины с рыночными характеристиками, тоесть, кучей свистелок, но работающую лет 5, вместо надежной стиралки, работающей 20 лет. Тратим трудовые и природные ресурсы впустую. А с точки зрения плановой экономики важно не что-бы ты купил стиралку, а что-бы она просто у тебя была. И мы делаем стиралку на 20 лет службы, а остальное время просто отдыхаем, например, уменьшая пенсионный возраст (как в СССР, пенсия с 50 для женщин и с 55 для мужчин) 2 пример. Мы произвели партию автомобилей но не все продали. С точки зрения рынка - мы не можем раздать нуждающимся, это обвалит цену. А с плановой экономикой мы можем их раздать без проблем . Можете просто загуглить "кладбища новых автомобилей", все станет видно наглядно. А время, не потраченное на производство просто прогулять, а ресурсы - оставить потомкам.
    4
  31.  @MaksimFranz  3 пример. Мы строим квартиры, но не продаем их, а выдаем гражданам по месту их работы, что-бы они на работу не ездили. А ходили пешком. И вот у нас экономия времени, экономия топлива и экономия транспортных средств. 4 пример. Упаковка. Нам не нужна куча упаковки при плане,номенклатура товаров меньше и нет смысла в кричащей упаковке "Купи меня". Экономим ресурсы и людское время на создание упаковок. 5 пример. Куча дублирующихся товаров в производстве, создающих лишь видимость разнообразия. У нас в магазине 5 видов йогурта, кислый, сладкий, с фруктами, с огурцами и дешевый разбавленный. Но от кучи разных производителей. Не проще ли произвести централизованно, без бренда? Могу еще с десяток оптимизаций привести. До кучи можно привести еще традиционные преимущества, вроде устранения социального неравенста и доступа к более качественому образованию, что может дать миру большее количество ученых и дать человечеству немного более высокий технологический уровень.
    4
  32. 4
  33. 4
  34. 4
  35.  @zipski  Вот, теперь я дома, у своего ПК, а не у телефона. Попытаюсь объяснить на пальцах. И так, любые математические операции можно разложить на более простые, вплоть до трех, сложения, вычитания (переноса) и деления. Например, 5х5 можно разложить на 5+5+5+5+5. Тоесть, мы можем создать процессорное ядро, умеющее только три базовых действия, но очень быстро. Или сделать ядро, которое может делать эти три и ещё умножать. Но оно будет чуть больше по размерам. И, условно, создать процессор на 40 простых ядер или 30 сложных. Номинально, процессор на 40 ядер будет делать куда больше операций на такт. Круто. Но умножать то они не умеют, и если нам надо будет умножение заменять сложением, эти 40 ядер завершат свою работу позже, для умножения 5х5 им надо совершить 4 действия, а умножающему - всего одно. Плюс, нам надо скомпилировать такой код соответственно. Под простое ядро такой код будет занимать больше объема, а это больше нагрузки на подсистему памяти. Тоесть, номинально более быстрое ядро оказалось медленнее. Так вот, АРМ ядро поддерживает около 250 математических операций (инструкций), а х86 - более тысячи. Да, мы можем вместо, скажем, 4 ядер х86 запихнуть 16 ядер АРМ. Но считать они будут медленнее, поскольку им потребуется больше операций. Плюс, на кристале нам потребуется больше кеша, код то стал больше. Так что ядер АРМ мы уместим чуть меньше или у нас будет чуть меньше кеша, чем нам нужно. Но это еще не всё. Дело в том, что х86 может работать суперскалярно, а АРМ - нет (не совсем, есть исключенье). Тоесть, ядро х86 может одновременно юзать несколько логических модулей, предназначенных для разных математических действий. Это делает х86 даже в простых операциях не на много медленнее АРМ. Еще раз, понятнее. пока АРМ делает однообразную простую работу, он быстрее. Но как он столкнется со сложными задачами - то он окажется медленнее. Плюс - ему нужно будет больше памяти и её пропускной способности. Видео редактирует АРМ быстрее х86, браузит - тоже. Если посмотреть презентацию эпла, как раз на это эпл и делает акцент. А вот в играх и расчетах физики АРМ сливает. Вот только в ПК видео редактирует видеокарта,которая еще быстрее АРМ, там количество ядер тысячами измеряется, а браузят современные х86 и без того хорошо, что нам не нужно ускорение браузинга. Что касается компиляции под АРМ, то тут ни каких проблем. Кроме того, что машинный код из исходного получается больше по объему. Переход ПК на АРМ - это шаг назад в развитии вычислительной техники. А вот что реально было бы полезно, так это внедрение ядер RISC V в х86 процессоры, в качестве вспомогательных блоков, что сделает ЦП больше похожими на графические. В ГПУ у нас 4 вида ядер +, часто, АСИКи (совсем простые но шустрые ядра под одну задачу). В ЦП у нас 2 вида ядер, х86 и х87. К ним бы добавились еще RISC V.
    4
  36. 4
  37. 4
  38. 4
  39. 4
  40. 4
  41. 4
  42. 4
  43. 4
  44. 4
  45. 3
  46. 3
  47. 3
  48. 3
  49. 3
  50. 3