Сообщение от HolyDel
вот вопрос:
как вы считаете, создание второго буфера для меша, состоящего лишь из позиций, может ускорить shadow pass? ведь локальность данных повысится?
|
Всё зависит от того как устроен кеш на видеокартах.
Например когда я делал софтвеер рейкастинг была немного другая но схожая проблема - самым узким местом была скорость памяти.
Всё из за того что я сделал многопроходную обработку "шейдерами" (имеется ввиду функции выполняющие примерно то что делают пиксельные шейдеры).
Из за этого одна часть буфера изображения вытесняла из кеша другую часть.
Надо было же делать по другому: нужно было все операции которые требовались над пикселем сделать сразу, пока все данные находились в кеше, тем самым требовалось бы один раз прочитать исходный буфер из памяти и один раз записать результат в память. Теоретически факт того что у каждого ядра свой кеш 2 уровня это еще больше ускорило бы обработку данных.
У видеокарт нет таких проблем - там быстрая память, так что сложно однозначно сказать как будет - нужно делать эксперимент или искать доки на видеокарты.