|
Болтовня Разговоры на любые темы (думайте, о чем пишите) |
02.11.2016, 01:30
|
#1
|
Разработчик
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений (для 369 пользователей)
|
Тест OpenCL
Разбираюсь в вычислениях на GPU. И как-то всё запутано. Судя по тестам, разные видюхи показывают совершенно разные результаты с OpenCL и CUDA. А для кодирования/декодирования видео вообще говорят Intel с их Quick Sync всех порвет.
Интересует вопрос выбора видеокарты и технологий под:
а) преобладающие int вычисления
б) преобладающие float вычисления
в) преобладающие double вычисления
Как я понял (точнее совсем ничего не понял), для float CUDA быстрее, чем OpenCL, но для double лучше AMD брать (соответственно OpenCL)?
Не могу понять, какие параметры видеокарты на какие виды вычислений влияют?
В архиве тест OpenCL с преобладающими int и float, потестите, кому не лень. https://yadi.sk/d/jMMvIEK4xxEqa
Запускал на двух ноутах:
GT650M - 73 сек
GT840M - 80 сек
i7 3612QM - 92 сек
i5 5200U - 80 сек (тут тоже не понял, почему i5 быстрее 4-ядерного i7)
То есть слабенькие ноутбучные видюхи практически никакого прироста не дают по сравнению с i5/i7. С CUDA что-то изменится?
Пошел запускать на серваке:
Tesla C2075 - 8 сек в 10 раз прирост (а по гигафлопсам у теслы 1288 против 640 у 650M), хотя Tesla же заточена на double, количество cuda ядер примерно такое-же, как на ноутбучной видюхе, частоты даже ниже, чем на ноуте. Что здесь решает? может ширина шины 384 бит против 128 на ноуте? Как влияют 2 Xeon e5 2620, установленные на серваке, на GPU вычисления? К сожалению, на самих xeon тест не получилось запустить.
В общем, надо мне собрать оптимальное железо цена/скорость для int и float вычислений и определиться, какие технологии использовать и на чем считать (cpu или gpu) - в голове пока каша.
Последний раз редактировалось DarkInside, 04.11.2016 в 04:09.
|
(Offline)
|
|
02.11.2016, 02:59
|
#2
|
Быдлокодер
Регистрация: 05.07.2009
Адрес: Проспит
Сообщений: 5,023
Написано 2,312 полезных сообщений (для 5,349 пользователей)
|
Ответ: Тест OpenCL
Запустил по умолчанию, Palit GF GTS 450 1 Гб - ~42 сек.
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
02.11.2016, 04:01
|
#3
|
Бывалый
Регистрация: 23.11.2011
Сообщений: 863
Написано 334 полезных сообщений (для 866 пользователей)
|
Ответ: Тест OpenCL
i7 6700hq 22.656
gtx960m 40.125
Могу сделать мини сайт, пусть тулза отправляет данные, а там таблица будет
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
02.11.2016, 05:15
|
#4
|
Разработчик
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений (для 369 пользователей)
|
Ответ: Тест OpenCL
Мда, похоже выигрыш от GPU-вычислений только на топовых десктопных видюхах можно поиметь. В принципе Тесла С2075 можно найти бу на eBay за 14-17 т.р., поставить 2 в SLI и должно считать за 4 сек. Но вот черт его знает, может за эти деньги проще топовый Xeon (или 2) или i7 поставить и оно считать будет также или даже быстрее. Вот был бы какой-нибудь онлайн-сервис, где можно было выбрать различную конфигурацию оборудования и проверить производительность своей проги...пусть даже платный, думаю, им пользовались бы.
Могу сделать мини сайт, пусть тулза отправляет данные, а там таблица будет
|
Это не моя тулза, полных сходников нет, просто примерно знаю, что и как там рассчитывается и это очень похоже на мою задачу.
|
(Offline)
|
|
02.11.2016, 12:15
|
#5
|
Мерцающий
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений (для 3,030 пользователей)
|
Ответ: Тест OpenCL
Я вот, тоже не разобрался, как работают CUDA-ядра, и дают ли они вообще какое-нибудь преимущество перед голом рендерингом на CPU. Особой разницы я не заметил.
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
|
(Offline)
|
|
02.11.2016, 13:07
|
#6
|
Терабайт исходников
Регистрация: 13.09.2008
Сообщений: 3,947
Написано 2,189 полезных сообщений (для 6,051 пользователей)
|
Ответ: Тест OpenCL
как работают CUDA-ядра, и дают ли они вообще какое-нибудь преимущество перед голом рендерингом на CPU
|
их много. пикселей/вертексов/треугольников тоже много. параллельность выигрывает.
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
02.11.2016, 13:21
|
#7
|
Чудо-кот
Регистрация: 22.02.2011
Сообщений: 901
Написано 480 полезных сообщений (для 1,471 пользователей)
|
Ответ: Тест OpenCL
AMD R9 290 - 8 сек
i7-5820K 3.30GHz - 92 сек
GeForce 940M - 77 сек
i3-505U 2.0GHz - 99 сек
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
02.11.2016, 14:55
|
#8
|
Разработчик
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений (для 369 пользователей)
|
Ответ: Тест OpenCL
Это уже интереснее Похоже правда Nvidia ограничивает OpenCL, чтобы юзали CUDA. У AMD, конечно, ALU больше и частота выше, но не может же Nvidia так отставать.
i7-5820K 3.30GHz - 92 сек - 6 ядер
i7 6700hq 22.656 - 4 ядра
i7 3612QM - 92 сек - 4 ядра
i5 5200U - 80 сек - 2 ядра
|
Вот это мне совсем непонятно. Интересно посмотреть на что-то типа AMD FX 9590 или A10-7870K.
их много. пикселей/вертексов/треугольников тоже много. параллельность выигрывает.
|
Думаю, это не совсем так, много подводных камней, благодаря которым 4-ядерный i7 уделывает 484-ядерный GTX.
Последний раз редактировалось DarkInside, 04.11.2016 в 04:10.
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
02.11.2016, 16:21
|
#9
|
Мерцающий
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений (для 3,030 пользователей)
|
Ответ: Тест OpenCL
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
03.11.2016, 11:22
|
#10
|
Терабайт исходников
Регистрация: 13.09.2008
Сообщений: 3,947
Написано 2,189 полезных сообщений (для 6,051 пользователей)
|
Ответ: Тест OpenCL
GTX 970 - 16 сек
Думаю, это не совсем так, много подводных камней, благодаря которым 4-ядерный i7 уделывает 484-ядерный GTX.
|
зависит от задачи. не стоит забывать ещё, что на видюхах по-прежнему хватает fixed function зашитых в железе быстрых вещей, как то фильтрация, антиалясинг, да даже растеризация треугольников.
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
03.11.2016, 13:54
|
#11
|
Бывалый
Регистрация: 23.11.2011
Сообщений: 863
Написано 334 полезных сообщений (для 866 пользователей)
|
Ответ: Тест OpenCL
Сообщение от DarkInside
Это уже интереснее Похоже правда Nvidia ограничивает OpenCL, чтобы юзали CUDA. У AMD, конечно, ALU больше и частота выше, но не может же Nvidia так отставать.
Вот это мне совсем непонятно. Интересно посмотреть на что-то типа AMD FX 9590 или A10-7870K.
Думаю, это не совсем так, много подводных камней, благодаря которым 4-ядерный i7 уделывает 484-ядерный GTX.
|
Очень странно,
i7-5820K 3.30GHz - 92 сек - 6 ядер
i7 6700hq 22.656 - 4 ядра
http://cpu.userbenchmark.com/Compare...K/m34954vs2579
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
03.11.2016, 14:50
|
#12
|
Элита
Регистрация: 16.01.2010
Адрес: Новосибирск
Сообщений: 2,158
Написано 502 полезных сообщений (для 1,012 пользователей)
|
Ответ: Тест OpenCL
Как на CPU запустить, а то всегда только на видяхе запускает.
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
03.11.2016, 15:48
|
#13
|
Разработчик
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений (для 369 пользователей)
|
Ответ: Тест OpenCL
Как на CPU запустить, а то всегда только на видяхе запускает.
|
Там в списке должно отображаться всё OpenCL-совместимое оборудование, иногда CPU не подхватывается. Качать драйвера с поддержкой OpenCL отсюда отсюда https://software.intel.com/en-us/art...opencl-drivers
UPD: Чем отличаются вычисления на шейдерах GLSL (WebGL использует)?
Последний раз редактировалось DarkInside, 04.11.2016 в 04:09.
|
(Offline)
|
|
Сообщение было полезно следующим пользователям:
|
|
04.11.2016, 04:07
|
#14
|
Разработчик
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений (для 369 пользователей)
|
Ответ: Тест OpenCL
Intel HD Graphics 4000 - 50 сек
Вспомнил, что у меня еще есть встроенная видюха. Установил Intel SDK for OpenCL отсюда https://software.intel.com/en-us/art...opencl-drivers
Там же есть программа для обновления драйверов Intel (для тех, у кого OpenCL не видит CPU).
После перезагрузки в списке появился еще один i7 (но это с видюхой). Встроенная HD Graphics 4000 уделала дискретную GT 650M. Я теперь не уверен, с какой видюхой запускать тяжелые приложения и вообще нужна ли дискретная видеокарточка на ноутбуке. Пойду теперь качать драйвера и SDK Nvidia.
Возможно i7 6700hq - 22.656 как раз с графическим ядром был запущен (HD Graphics 530), а i7-5820K 3.30GHz - 92 сек - чистый CPU без встроенного видеоядра.
Головоломка разгадана
Последний раз редактировалось DarkInside, 04.11.2016 в 05:10.
|
(Offline)
|
|
Эти 2 пользователя(ей) сказали Спасибо DarkInside за это полезное сообщение:
|
|
04.11.2016, 05:06
|
#15
|
Разработчик
Регистрация: 08.08.2011
Сообщений: 505
Написано 191 полезных сообщений (для 369 пользователей)
|
Ответ: Тест OpenCL
Едрить колотить, обновил драйверы Nvidia - минус 5 сек.
В общем, если писать пользовательское приложение с OpenCL, надо писать еще один менеджер, который будет проводить тест, какое оборудование работает быстрее и на нём запускать, постоянно проверять новые драйверы и если новые драйверы работают медленнее, то откатываться на старые. Вообще непонятно, какой без этого всего толк и почему профессиональный софт от Adobe и Autodesk этого не делает.
А тут еще всплывают всякие альтернативы OpenCL типа DirectCompute и шейдерные GLSL-вычисления и разница производительности при использовании разных технологий на разном железе скачет в 10 раз и вообще не предсказуема, ибо регулируется не характеристиками железа, а маркетинговыми соображениями.
В общем, полный бардак.
|
(Offline)
|
|
Ваши права в разделе
|
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения
HTML код Выкл.
|
|
|
Часовой пояс GMT +4, время: 06:33.
|