Извините, ничего не найдено.

Не расстраивайся! Лучше выпей чайку!
Регистрация
Справка
Календарь

Вернуться   forum.boolean.name > Общие темы > Болтовня

Болтовня Разговоры на любые темы (думайте, о чем пишите)

Ответ
 
Опции темы
Старый 04.11.2016, 20:40   #31
ingko
Мерцающий
 
Аватар для ingko
 
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений
(для 3,030 пользователей)
Ответ: Тест OpenCL

Провёл еще экспресс-тест в Vegas Pro 12/ FullHD-ролик на 3 минуты 50 секунд, 24 кадра в секунду.
--
Рендеринг только на CPU
--

--
Рендеринг с OpenCL
--

--
Рендеринг с CUDA
--

--

Выводы делайте сами.
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
(Offline)
 
Ответить с цитированием
Старый 04.11.2016, 20:53   #32
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений
(для 369 пользователей)
Ответ: Тест OpenCL

Выводы делайте сами.
Эмм...переключатель CPU/OpenCL/CUDA сломался?
(Offline)
 
Ответить с цитированием
Эти 2 пользователя(ей) сказали Спасибо DarkInside за это полезное сообщение:
h1dd3n (04.11.2016), Randomize (04.11.2016)
Старый 04.11.2016, 20:55   #33
ingko
Мерцающий
 
Аватар для ingko
 
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений
(для 3,030 пользователей)
Ответ: Тест OpenCL

Сообщение от DarkInside Посмотреть сообщение
Эмм...переключатель CPU/OpenCL/CUDA сломался?
Да нет... Вот, так у меня реально работают CUDA и OpenCL
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
(Offline)
 
Ответить с цитированием
Старый 05.11.2016, 06:13   #34
RegIon
Элита
 
Аватар для RegIon
 
Регистрация: 16.01.2010
Адрес: Новосибирск
Сообщений: 2,157
Написано 502 полезных сообщений
(для 1,012 пользователей)
Ответ: Тест OpenCL

CUDA не на много быстрее OpenCL.
Обычно выйгрыш не более 13%.
https://habrahabr.ru/post/96122/
__________________
Сайт: http://iexpo.ml
(Offline)
 
Ответить с цитированием
Старый 05.11.2016, 06:33   #35
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений
(для 369 пользователей)
Ответ: Тест OpenCL

Сообщение от RegIon Посмотреть сообщение
CUDA не на много быстрее OpenCL.
Обычно выйгрыш не более 13%.
https://habrahabr.ru/post/96122/
Да, эту статью видел, но это только одна статья и для одной видюхи. Много статей пересмотрел, где-то прирост почти в 2 раза.
В этой же статье пишут:
В работе A Performance Comparison of CUDA and OpenCL говорится о том, что производительность ядра OpenCL проигрывает CUDA от 13% до 63%
(Offline)
 
Ответить с цитированием
Старый 05.11.2016, 12:10   #36
ingko
Мерцающий
 
Аватар для ingko
 
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений
(для 3,030 пользователей)
Ответ: Тест OpenCL

Ребят, а мне что делать??? Это что-то с дровами или с кодеками?
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
(Offline)
 
Ответить с цитированием
Старый 05.11.2016, 16:11   #37
Randomize
[object Object]
 
Аватар для Randomize
 
Регистрация: 01.08.2008
Адрес: В России
Сообщений: 4,355
Написано 2,471 полезных сообщений
(для 6,853 пользователей)
Ответ: Тест OpenCL

Сообщение от ingko Посмотреть сообщение
Ребят, а мне что делать??? Это что-то с дровами или с кодеками?
Ты ведь выбирая Cuda/OpenCL ещё видяху перетыкал, да?
У меня, например, вегас не даёт запустить рендер при выборе OpenCL - нужна атишка.
__________________
Retry, Abort, Ignore? █
Intel Core i7-9700 4.70 Ghz; 64Gb; Nvidia RTX 3070
AMD Ryzen 7 3800X 4.3Ghz; 64Gb; Nvidia 1070Ti
AMD Ryzen 7 1700X 3.4Ghz; 8Gb; AMD RX 570
AMD Athlon II 2.6Ghz; 8Gb; Nvidia GTX 750 Ti
(Offline)
 
Ответить с цитированием
Старый 05.11.2016, 19:31   #38
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений
(для 369 пользователей)
Ответ: Тест OpenCL

Вспомнил, почему я на Intel + Nvidia перешел... 3 часа безуспешных свистоплясок с драйверами AMD. Цель была посмотреть прирост c DualGraphics и без него.
Млять, я одного не понимаю, как люди могут эффективную работу ядер реализовать, если не могут нормальный инсталлятор для драйверов собрать.
Инсталлятор ставит драва от другой видюхи, после ребута лезут ошибки, а откатить нормально их не получается, только если вручную ковыряться.
В итоге получилось запустить только на DualGraphics HD7640G + HD8570M и отдельно на процессоре. Отдельно на HD8570M и отдельно на встроенном графическом ядре ну никак не запустить. Отключаешь DualGraphics - винда просит драйвера на HD8570M, начинаешь устанавливать - инсталлятор обратно включает DualGraphics и говорит, что драйвера не подходят.
В общем, AMD A-серия полный шлак для вычислений.
A8-4500U - ждал 7 минут, он что-то там считал, не зависал, но так и не дождался.
DualGraphics HD7640G + HD8570M - 86 сек.
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
St_AnGer (05.11.2016)
Старый 05.11.2016, 19:57   #39
ingko
Мерцающий
 
Аватар для ingko
 
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений
(для 3,030 пользователей)
Ответ: Тест OpenCL

Сообщение от Randomize Посмотреть сообщение
Ты ведь выбирая Cuda/OpenCL ещё видяху перетыкал, да?
У меня, например, вегас не даёт запустить рендер при выборе OpenCL - нужна атишка.
А зачем видяшку перетыкать? У меня Nvidia как стояла, как и стоит. А OpenCL, я так понял, обрабатывал проц, вместе со встроенным видео-ядром.

Мне просто не ясно, почему у меня CUDA так слабо работает. Карточка, в лучшем случае, нагружается на 20 %... Почему так?
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
(Offline)
 
Ответить с цитированием
Старый 08.11.2016, 11:37   #40
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений
(для 369 пользователей)
Ответ: Тест OpenCL

AMD FX-4100 Quad Core - 14 минут.
(Offline)
 
Ответить с цитированием
Старый 09.11.2016, 11:56   #41
ingko
Мерцающий
 
Аватар для ingko
 
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений
(для 3,030 пользователей)
Ответ: Тест OpenCL

Сообщение от DarkInside Посмотреть сообщение
AMD FX-4100 Quad Core - 14 минут.
Минут??? Му-ха-ха!!!
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
(Offline)
 
Ответить с цитированием
Старый 09.11.2016, 20:19   #42
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений
(для 369 пользователей)
Ответ: Тест OpenCL

Чёт я запутался в типах (точнее в их названиях в разных языках):
float = float32 - с этим понятно
float64 = double - с этим тоже
float96, float128, float2, double2 - шо такое? особенно интересно про последние 2.
char, uchar - целые, но чем они от int отличаются? для длинных int eсть же long
(Offline)
 
Ответить с цитированием
Старый 09.11.2016, 20:29   #43
impersonalis
Зануда с интернетом
 
Аватар для impersonalis
 
Регистрация: 04.09.2005
Сообщений: 14,014
Написано 6,798 полезных сообщений
(для 20,935 пользователей)
Ответ: Тест OpenCL

Сообщение от DarkInside Посмотреть сообщение
char, uchar - целые, но чем они от int отличаются? для длинных int eсть же long
1 байт
wchar - 2 байта
int - 4
__________________
http://nabatchikov.com
Мир нужно делать лучше и чище. Иначе, зачем мы живем? tormoz
А я растила сына на преданьях
о принцах, троллях, потайных свиданьях,
погонях, похищениях невест.
Да кто же знал, что сказка душу съест?
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (09.11.2016)
Старый 09.11.2016, 20:36   #44
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений
(для 369 пользователей)
Ответ: Тест OpenCL

Понял. А floatN, doubleN (float2, double2) - шо такое?

float2 представляет короткий вектор 2 чисел с плавающей точкой.
Чет не пойму. Для чего они применяются? В Си их вроде нет, они в OpenCL исходниках встречаются.

Еще какой-то atomic...

UPD: про атомик вроде понял. floatN, doubleN - это из той же серии? Просто гуглеж привел на atomic, но я пока не понял, это связанные вещи или не совсем.
Доольно простой пример, где нужен атомик над float — построение гистограммы для любых float значений. Скажем, имея большое количество записей о спортсменах, вы хотите найти средний вес в зависимости от роста — тогда вам сначала нужно построить гистограмму 'рост'->'суммарный вес всех спортсменов с таким ростом', и тут уже без атомик не обойтись, а вес вполне может быть float.

да, в большинстве случаев это — построение гистограмм. могу привести пару примеров из своих симуляций:

1. есть множество силовых точек, связанных «резинками» (например, как в таких задачах en.wikipedia.org/wiki/Force-directed_graph_drawing или в задачах на симуляцию физики мягкого тела (мой случай))

при условии, что количество резинок, связанных с одной силовой точкой, может быть произвольным, и на каждом шаге симуляции нужно «повлиять» на каждую силовую точку вектором силы каждой растянутой «резинки», связанной с силовой точкой — стандартный способ избежать atomic float'ов, когда kernel совершает проход по множеству точек, и каждая точка неконкурентно аккумулирует вектора сил всех связанных с ней резинок — не подходит (количество резинок у каждой силовой точки значительно отличается, что будет запирать синхронные WARPы. к тому же, необходимо будет использовать динамические списки резинок — т.е. гораздо более сложный код менеджмента модели).

при наличии atomic float'ов — мы просто совершаем пробег по множеству резинок, каждая из которых добавляет свой вектор силы к обоем силовым точкам, к которым привязана (через atomicAdd float). т.к. две резинки могут одновременно попытаться добавить свой вектор силы к одной и той же силовой точке, без atomic float'ов такой подход не работает.

приятно то, что atomic float'ы в современных nvidia картах настолько производительно реализованы, что в большинстве случаев попытки обойти их использование более хитрым и производительным алгоритмом приведут к уменьшению производительности.

т.е. при желании решать реальные задачи, а не фигурно извращаться с архитектурой GPGPU — atomic float'ы + CUDA + современные nvidia GPU (и чем дальше, тем лучше с этим) позволяют просто писать SIMD код в лоб, при этом имея производительность на грани теоретического максимума.

— это наиболее простой и понятный пример применения atomic float'ов.
(Offline)
 
Ответить с цитированием
Старый 09.11.2016, 21:30   #45
RegIon
Элита
 
Аватар для RegIon
 
Регистрация: 16.01.2010
Адрес: Новосибирск
Сообщений: 2,157
Написано 502 полезных сообщений
(для 1,012 пользователей)
Ответ: Тест OpenCL

В OpenCL(CUDA) наверно что-то типа GLSL все же.
float2, 3,4 - вектора (структуры на 2,3,4 флоата)
float 96,128 - битность.
atomic - потокозащищенные типы (что бы не трахаться с синхронизацией), так как OpenCL или CUDA - многопоточны. На то у куда и до 19к ядер.
http://ru.cppreference.com/w/cpp/atomic/atomic
__________________
Сайт: http://iexpo.ml
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (09.11.2016)
Ответ


Опции темы

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.


Часовой пояс GMT +4, время: 21:22.


vBulletin® Version 3.6.5.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
Style crйe par Allan - vBulletin-Ressources.com