Извините, ничего не найдено.

Не расстраивайся! Лучше выпей чайку!
Регистрация
Справка
Календарь

Вернуться   www.boolean.name > Общие темы > Болтовня

Болтовня Разговоры на любые темы (думайте, о чем пишите)

Ответ
 
Опции темы
Старый 01.11.2016, 22:30   #1
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 07.08.2011
Сообщений: 504
Написано 190 полезных сообщений
(для 368 пользователей)
Тест OpenCL

Разбираюсь в вычислениях на GPU. И как-то всё запутано. Судя по тестам, разные видюхи показывают совершенно разные результаты с OpenCL и CUDA. А для кодирования/декодирования видео вообще говорят Intel с их Quick Sync всех порвет.
Интересует вопрос выбора видеокарты и технологий под:
а) преобладающие int вычисления
б) преобладающие float вычисления
в) преобладающие double вычисления
Как я понял (точнее совсем ничего не понял), для float CUDA быстрее, чем OpenCL, но для double лучше AMD брать (соответственно OpenCL)?
Не могу понять, какие параметры видеокарты на какие виды вычислений влияют?
В архиве тест OpenCL с преобладающими int и float, потестите, кому не лень. https://yadi.sk/d/jMMvIEK4xxEqa
Запускал на двух ноутах:
GT650M - 73 сек
GT840M - 80 сек
i7 3612QM - 92 сек
i5 5200U - 80 сек (тут тоже не понял, почему i5 быстрее 4-ядерного i7)
То есть слабенькие ноутбучные видюхи практически никакого прироста не дают по сравнению с i5/i7. С CUDA что-то изменится?
Пошел запускать на серваке:
Tesla C2075 - 8 сек в 10 раз прирост (а по гигафлопсам у теслы 1288 против 640 у 650M), хотя Tesla же заточена на double, количество cuda ядер примерно такое-же, как на ноутбучной видюхе, частоты даже ниже, чем на ноуте. Что здесь решает? может ширина шины 384 бит против 128 на ноуте? Как влияют 2 Xeon e5 2620, установленные на серваке, на GPU вычисления? К сожалению, на самих xeon тест не получилось запустить.
В общем, надо мне собрать оптимальное железо цена/скорость для int и float вычислений и определиться, какие технологии использовать и на чем считать (cpu или gpu) - в голове пока каша.

Последний раз редактировалось DarkInside, 04.11.2016 в 01:09.
(Offline)
 
Ответить с цитированием
Старый 01.11.2016, 23:59   #2
Arton
Быдлокодер
 
Аватар для Arton
 
Регистрация: 05.07.2009
Адрес: Проспит
Сообщений: 4,536
Написано 1,990 полезных сообщений
(для 4,748 пользователей)
Ответ: Тест OpenCL

Запустил по умолчанию, Palit GF GTS 450 1 Гб - ~42 сек.
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (02.11.2016)
Старый 02.11.2016, 01:01   #3
tirarex
Бывалый
 
Аватар для tirarex
 
Регистрация: 23.11.2011
Сообщений: 863
Написано 334 полезных сообщений
(для 866 пользователей)
Ответ: Тест OpenCL

i7 6700hq 22.656
gtx960m 40.125

Могу сделать мини сайт, пусть тулза отправляет данные, а там таблица будет
__________________
Asus rog gl552vw (i7 6700 16gb gtx960m2gb 250gb ssd)

̶M̶s̶i̶ ̶g̶e̶6̶2̶ ̶(̶i̶7̶-̶5̶7̶0̶0̶ ̶1̶2̶g̶b̶ ̶r̶a̶m̶ ̶9̶6̶0̶m̶ ̶2̶g̶b̶ ̶1̶2̶8̶g̶b̶ ̶s̶s̶d̶)̶ - Умер
̶R̶a̶d̶e̶o̶n̶ ̶H̶D̶4̶6̶5̶0̶ ̶2̶g̶b̶ ̶,̶ ̶c̶o̶r̶e̶2̶d̶u̶o̶ ̶t̶6̶5̶0̶0̶ ̶2̶.̶1̶G̶h̶z̶ ̶4̶g̶b̶ ̶r̶a̶m̶ ̶-̶м̶а̶м̶о̶н̶т̶ ̶ Отдан матери
̶I̶n̶t̶e̶l̶ ̶Z̶3̶7̶3̶5̶F̶ ̶1̶.̶3̶-̶1̶.̶8̶g̶h̶z̶ ̶2̶g̶b̶ ̶r̶a̶m̶ ̶-̶ ̶п̶л̶а̶н̶ш̶е̶т̶ Отдан матери
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (02.11.2016)
Старый 02.11.2016, 02:15   #4
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 07.08.2011
Сообщений: 504
Написано 190 полезных сообщений
(для 368 пользователей)
Ответ: Тест OpenCL

Мда, похоже выигрыш от GPU-вычислений только на топовых десктопных видюхах можно поиметь. В принципе Тесла С2075 можно найти бу на eBay за 14-17 т.р., поставить 2 в SLI и должно считать за 4 сек. Но вот черт его знает, может за эти деньги проще топовый Xeon (или 2) или i7 поставить и оно считать будет также или даже быстрее. Вот был бы какой-нибудь онлайн-сервис, где можно было выбрать различную конфигурацию оборудования и проверить производительность своей проги...пусть даже платный, думаю, им пользовались бы.

Могу сделать мини сайт, пусть тулза отправляет данные, а там таблица будет
Это не моя тулза, полных сходников нет, просто примерно знаю, что и как там рассчитывается и это очень похоже на мою задачу.
(Offline)
 
Ответить с цитированием
Старый 02.11.2016, 09:15   #5
ingko
Мерцающий
 
Аватар для ingko
 
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений
(для 3,030 пользователей)
Ответ: Тест OpenCL

Я вот, тоже не разобрался, как работают CUDA-ядра, и дают ли они вообще какое-нибудь преимущество перед голом рендерингом на CPU. Особой разницы я не заметил.
__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
(Offline)
 
Ответить с цитированием
Старый 02.11.2016, 10:07   #6
Mr_F_
Терабайт исходников
 
Аватар для Mr_F_
 
Регистрация: 13.09.2008
Сообщений: 3,907
Написано 2,157 полезных сообщений
(для 5,843 пользователей)
Ответ: Тест OpenCL

как работают CUDA-ядра, и дают ли они вообще какое-нибудь преимущество перед голом рендерингом на CPU
их много. пикселей/вертексов/треугольников тоже много. параллельность выигрывает.
__________________
бложик | geom.io | твиттер | faded | демо 1 2 | роботы | лайтмаппер
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
h1dd3n (02.11.2016)
Старый 02.11.2016, 10:21   #7
Nerd
Чудо-кот
 
Аватар для Nerd
 
Регистрация: 22.02.2011
Сообщений: 893
Написано 475 полезных сообщений
(для 1,462 пользователей)
Ответ: Тест OpenCL

AMD R9 290 - 8 сек
i7-5820K 3.30GHz - 92 сек
GeForce 940M - 77 сек
i3-505U 2.0GHz - 99 сек
__________________

(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (02.11.2016)
Старый 02.11.2016, 11:55   #8
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 07.08.2011
Сообщений: 504
Написано 190 полезных сообщений
(для 368 пользователей)
Ответ: Тест OpenCL

AMD R9 290 - 8 сек
Это уже интереснее Похоже правда Nvidia ограничивает OpenCL, чтобы юзали CUDA. У AMD, конечно, ALU больше и частота выше, но не может же Nvidia так отставать.

i7-5820K 3.30GHz - 92 сек - 6 ядер
i7 6700hq 22.656 - 4 ядра
i7 3612QM - 92 сек - 4 ядра
i5 5200U - 80 сек - 2 ядра
Вот это мне совсем непонятно. Интересно посмотреть на что-то типа AMD FX 9590 или A10-7870K.

их много. пикселей/вертексов/треугольников тоже много. параллельность выигрывает.
Думаю, это не совсем так, много подводных камней, благодаря которым 4-ядерный i7 уделывает 484-ядерный GTX.

Последний раз редактировалось DarkInside, 04.11.2016 в 01:10.
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
Mr_F_ (03.11.2016)
Старый 02.11.2016, 13:21   #9
ingko
Мерцающий
 
Аватар для ingko
 
Регистрация: 18.04.2006
Сообщений: 5,838
Написано 1,519 полезных сообщений
(для 3,030 пользователей)
Ответ: Тест OpenCL

__________________
Относись к человеку как к себе, иначе...
---
ДАННЫЕ:
qiwi 9150424059
Яндекс-деньги: 410012612648498
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (02.11.2016)
Старый 03.11.2016, 08:22   #10
Mr_F_
Терабайт исходников
 
Аватар для Mr_F_
 
Регистрация: 13.09.2008
Сообщений: 3,907
Написано 2,157 полезных сообщений
(для 5,843 пользователей)
Ответ: Тест OpenCL

GTX 970 - 16 сек

Думаю, это не совсем так, много подводных камней, благодаря которым 4-ядерный i7 уделывает 484-ядерный GTX.
зависит от задачи. не стоит забывать ещё, что на видюхах по-прежнему хватает fixed function зашитых в железе быстрых вещей, как то фильтрация, антиалясинг, да даже растеризация треугольников.
__________________
бложик | geom.io | твиттер | faded | демо 1 2 | роботы | лайтмаппер
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (03.11.2016)
Старый 03.11.2016, 10:54   #11
tirarex
Бывалый
 
Аватар для tirarex
 
Регистрация: 23.11.2011
Сообщений: 863
Написано 334 полезных сообщений
(для 866 пользователей)
Ответ: Тест OpenCL

Сообщение от DarkInside Посмотреть сообщение
Это уже интереснее Похоже правда Nvidia ограничивает OpenCL, чтобы юзали CUDA. У AMD, конечно, ALU больше и частота выше, но не может же Nvidia так отставать.


Вот это мне совсем непонятно. Интересно посмотреть на что-то типа AMD FX 9590 или A10-7870K.


Думаю, это не совсем так, много подводных камней, благодаря которым 4-ядерный i7 уделывает 484-ядерный GTX.

Очень странно,

i7-5820K 3.30GHz - 92 сек - 6 ядер
i7 6700hq 22.656 - 4 ядра

http://cpu.userbenchmark.com/Compare...K/m34954vs2579
__________________
Asus rog gl552vw (i7 6700 16gb gtx960m2gb 250gb ssd)

̶M̶s̶i̶ ̶g̶e̶6̶2̶ ̶(̶i̶7̶-̶5̶7̶0̶0̶ ̶1̶2̶g̶b̶ ̶r̶a̶m̶ ̶9̶6̶0̶m̶ ̶2̶g̶b̶ ̶1̶2̶8̶g̶b̶ ̶s̶s̶d̶)̶ - Умер
̶R̶a̶d̶e̶o̶n̶ ̶H̶D̶4̶6̶5̶0̶ ̶2̶g̶b̶ ̶,̶ ̶c̶o̶r̶e̶2̶d̶u̶o̶ ̶t̶6̶5̶0̶0̶ ̶2̶.̶1̶G̶h̶z̶ ̶4̶g̶b̶ ̶r̶a̶m̶ ̶-̶м̶а̶м̶о̶н̶т̶ ̶ Отдан матери
̶I̶n̶t̶e̶l̶ ̶Z̶3̶7̶3̶5̶F̶ ̶1̶.̶3̶-̶1̶.̶8̶g̶h̶z̶ ̶2̶g̶b̶ ̶r̶a̶m̶ ̶-̶ ̶п̶л̶а̶н̶ш̶е̶т̶ Отдан матери
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (03.11.2016)
Старый 03.11.2016, 11:50   #12
RegIon
Элита
 
Аватар для RegIon
 
Регистрация: 16.01.2010
Адрес: Новосибирск
Сообщений: 2,157
Написано 502 полезных сообщений
(для 1,012 пользователей)
Ответ: Тест OpenCL



Как на CPU запустить, а то всегда только на видяхе запускает.
__________________
Сайт: http://iexpo.ml
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
DarkInside (03.11.2016)
Старый 03.11.2016, 12:48   #13
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 07.08.2011
Сообщений: 504
Написано 190 полезных сообщений
(для 368 пользователей)
Ответ: Тест OpenCL

Как на CPU запустить, а то всегда только на видяхе запускает.
Там в списке должно отображаться всё OpenCL-совместимое оборудование, иногда CPU не подхватывается. Качать драйвера с поддержкой OpenCL отсюда отсюда https://software.intel.com/en-us/art...opencl-drivers

UPD: Чем отличаются вычисления на шейдерах GLSL (WebGL использует)?

Последний раз редактировалось DarkInside, 04.11.2016 в 01:09.
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
Arton (03.11.2016)
Старый 04.11.2016, 01:07   #14
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 07.08.2011
Сообщений: 504
Написано 190 полезных сообщений
(для 368 пользователей)
Ответ: Тест OpenCL

Intel HD Graphics 4000 - 50 сек

Вспомнил, что у меня еще есть встроенная видюха. Установил Intel SDK for OpenCL отсюда https://software.intel.com/en-us/art...opencl-drivers
Там же есть программа для обновления драйверов Intel (для тех, у кого OpenCL не видит CPU).
После перезагрузки в списке появился еще один i7 (но это с видюхой). Встроенная HD Graphics 4000 уделала дискретную GT 650M. Я теперь не уверен, с какой видюхой запускать тяжелые приложения и вообще нужна ли дискретная видеокарточка на ноутбуке. Пойду теперь качать драйвера и SDK Nvidia.

Возможно i7 6700hq - 22.656 как раз с графическим ядром был запущен (HD Graphics 530), а i7-5820K 3.30GHz - 92 сек - чистый CPU без встроенного видеоядра.

Головоломка разгадана
Миниатюры
Нажмите на изображение для увеличения
Название: Безымянный.png
Просмотров: 126
Размер:	47.2 Кб
ID:	22546  

Последний раз редактировалось DarkInside, 04.11.2016 в 02:10.
(Offline)
 
Ответить с цитированием
Эти 2 пользователя(ей) сказали Спасибо DarkInside за это полезное сообщение:
Arton (04.11.2016), ingko (04.11.2016)
Старый 04.11.2016, 02:06   #15
DarkInside
Разработчик
 
Аватар для DarkInside
 
Регистрация: 07.08.2011
Сообщений: 504
Написано 190 полезных сообщений
(для 368 пользователей)
Ответ: Тест OpenCL

Едрить колотить, обновил драйверы Nvidia - минус 5 сек.

В общем, если писать пользовательское приложение с OpenCL, надо писать еще один менеджер, который будет проводить тест, какое оборудование работает быстрее и на нём запускать, постоянно проверять новые драйверы и если новые драйверы работают медленнее, то откатываться на старые. Вообще непонятно, какой без этого всего толк и почему профессиональный софт от Adobe и Autodesk этого не делает.

А тут еще всплывают всякие альтернативы OpenCL типа DirectCompute и шейдерные GLSL-вычисления и разница производительности при использовании разных технологий на разном железе скачет в 10 раз и вообще не предсказуема, ибо регулируется не характеристиками железа, а маркетинговыми соображениями.

В общем, полный бардак.
Миниатюры
Нажмите на изображение для увеличения
Название: nv.png
Просмотров: 123
Размер:	10.1 Кб
ID:	22547  
(Offline)
 
Ответить с цитированием
Ответ


Опции темы

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.


Часовой пояс GMT +1, время: 18:36.


vBulletin® Version 3.6.5.
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd.
Перевод: zCarot
Style crйe par Allan - vBulletin-Ressources.com