![]() |
Тест OpenCL
Разбираюсь в вычислениях на GPU. И как-то всё запутано. Судя по тестам, разные видюхи показывают совершенно разные результаты с OpenCL и CUDA. А для кодирования/декодирования видео вообще говорят Intel с их Quick Sync всех порвет.
Интересует вопрос выбора видеокарты и технологий под: а) преобладающие int вычисления б) преобладающие float вычисления в) преобладающие double вычисления Как я понял (точнее совсем ничего не понял), для float CUDA быстрее, чем OpenCL, но для double лучше AMD брать (соответственно OpenCL)? Не могу понять, какие параметры видеокарты на какие виды вычислений влияют? В архиве тест OpenCL с преобладающими int и float, потестите, кому не лень. https://yadi.sk/d/jMMvIEK4xxEqa Запускал на двух ноутах: GT650M - 73 сек GT840M - 80 сек i7 3612QM - 92 сек i5 5200U - 80 сек (тут тоже не понял, почему i5 быстрее 4-ядерного i7) То есть слабенькие ноутбучные видюхи практически никакого прироста не дают по сравнению с i5/i7. С CUDA что-то изменится? Пошел запускать на серваке: Tesla C2075 - 8 сек :4to: в 10 раз прирост (а по гигафлопсам у теслы 1288 против 640 у 650M), хотя Tesla же заточена на double, количество cuda ядер примерно такое-же, как на ноутбучной видюхе, частоты даже ниже, чем на ноуте. Что здесь решает? может ширина шины 384 бит против 128 на ноуте? Как влияют 2 Xeon e5 2620, установленные на серваке, на GPU вычисления? К сожалению, на самих xeon тест не получилось запустить. В общем, надо мне собрать оптимальное железо цена/скорость для int и float вычислений и определиться, какие технологии использовать и на чем считать (cpu или gpu) - в голове пока каша. |
Ответ: Тест OpenCL
Запустил по умолчанию, Palit GF GTS 450 1 Гб - ~42 сек.
|
Ответ: Тест OpenCL
i7 6700hq 22.656
gtx960m 40.125 Могу сделать мини сайт, пусть тулза отправляет данные, а там таблица будет |
Ответ: Тест OpenCL
Мда, похоже выигрыш от GPU-вычислений только на топовых десктопных видюхах можно поиметь. В принципе Тесла С2075 можно найти бу на eBay за 14-17 т.р., поставить 2 в SLI и должно считать за 4 сек. Но вот черт его знает, может за эти деньги проще топовый Xeon (или 2) или i7 поставить и оно считать будет также или даже быстрее. Вот был бы какой-нибудь онлайн-сервис, где можно было выбрать различную конфигурацию оборудования и проверить производительность своей проги...пусть даже платный, думаю, им пользовались бы.
Цитата:
|
Ответ: Тест OpenCL
Я вот, тоже не разобрался, как работают CUDA-ядра, и дают ли они вообще какое-нибудь преимущество перед голом рендерингом на CPU. Особой разницы я не заметил. :dontknow:
|
Ответ: Тест OpenCL
Цитата:
|
Ответ: Тест OpenCL
AMD R9 290 - 8 сек
i7-5820K 3.30GHz - 92 сек GeForce 940M - 77 сек i3-505U 2.0GHz - 99 сек |
Ответ: Тест OpenCL
Цитата:
Цитата:
Цитата:
|
Ответ: Тест OpenCL
![]() |
Ответ: Тест OpenCL
GTX 970 - 16 сек
Цитата:
|
Ответ: Тест OpenCL
Цитата:
Очень странно, i7-5820K 3.30GHz - 92 сек - 6 ядер i7 6700hq 22.656 - 4 ядра http://cpu.userbenchmark.com/Compare...K/m34954vs2579 |
Ответ: Тест OpenCL
![]() Как на CPU запустить, а то всегда только на видяхе запускает. |
Ответ: Тест OpenCL
Цитата:
UPD: Чем отличаются вычисления на шейдерах GLSL (WebGL использует)? |
Ответ: Тест OpenCL
Вложений: 1
Intel HD Graphics 4000 - 50 сек
Вспомнил, что у меня еще есть встроенная видюха. Установил Intel SDK for OpenCL отсюда https://software.intel.com/en-us/art...opencl-drivers Там же есть программа для обновления драйверов Intel (для тех, у кого OpenCL не видит CPU). После перезагрузки в списке появился еще один i7 (но это с видюхой). Встроенная HD Graphics 4000 уделала дискретную GT 650M. Я теперь не уверен, с какой видюхой запускать тяжелые приложения и вообще нужна ли дискретная видеокарточка на ноутбуке. Пойду теперь качать драйвера и SDK Nvidia. Возможно i7 6700hq - 22.656 как раз с графическим ядром был запущен (HD Graphics 530), а i7-5820K 3.30GHz - 92 сек - чистый CPU без встроенного видеоядра. Головоломка разгадана :-) |
Ответ: Тест OpenCL
Вложений: 1
Едрить колотить, обновил драйверы Nvidia - минус 5 сек.
В общем, если писать пользовательское приложение с OpenCL, надо писать еще один менеджер, который будет проводить тест, какое оборудование работает быстрее и на нём запускать, постоянно проверять новые драйверы и если новые драйверы работают медленнее, то откатываться на старые. Вообще непонятно, какой без этого всего толк и почему профессиональный софт от Adobe и Autodesk этого не делает. А тут еще всплывают всякие альтернативы OpenCL типа DirectCompute и шейдерные GLSL-вычисления и разница производительности при использовании разных технологий на разном железе скачет в 10 раз и вообще не предсказуема, ибо регулируется не характеристиками железа, а маркетинговыми соображениями. В общем, полный бардак. |
Ответ: Тест OpenCL
![]() Поставил OpenCL драйвера. Видно, что старенький i5 уделал в 2 раза старенький 520m |
Ответ: Тест OpenCL
Цитата:
|
Ответ: Тест OpenCL
Хош прикол:
![]() UPнул частоту видеоядра 520m(на деле 540m) до 550m (820Mhz vs 600), а это около 30%. UPD: Поднял до 850 и выиграл еще 5 сек. Вот и думай, каким образом обновление дров повлияло. Дальше гнать опасно. Хотя вроде и не греется. |
Ответ: Тест OpenCL
Это как? Через какую-то утилиту нвидиа? Я бы даже не подумал, что мобильную карту можно гнать :-D Раньше она потребляла 30 Вт впустую, теперь 40 Вт впустую и всё-равно до интела далеко, который в сумме APU потребляет 35 Вт.
Я свою потестирую с CUDA, если нет толка, выпилю при следующей чистке ноута, только батарею зря жрет. В игры не играю. |
Ответ: Тест OpenCL
Цитата:
И как же ты ее выпилишь? У меня она вообще распаяна на мать. Да и смысл. Когда я тест на CPU запустил, то у меня враз нагрузка 100% на всех потоках. А на видяхе когда, то комп и не знает, что его как-то нагрузили, а для Photoshop это как раз критично и без GPU ускорения я его даже боюсь запускать. Да если уж совсем приспичило, то можно нагрузить все враз. (100 + 150) / 4 = 62.5 для моего случая Прога: https://nvworld.ru/utilities/inspector/ Мне ее можно гнать еще огого, только охлаждай, иначе на 70 градусах сбрасывает частоту. ![]() |
Ответ: Тест OpenCL
Intel(R) Core(TM)2 Quad CPU Q9400 @ 2.66GHz 511 Mb - 782 ms
GeForce GTX 275 896 Mb - time: 61579 ms |
Ответ: Тест OpenCL
AMD R9 nano: 5 922 ms
Intel i5-3570K: 364 547 ms В обоих случаях система с кучей открытых окон (но вроде тяжёлого процессинга не было). Подозреваю, что что-то не так с конфигурацией софта на моей стороне. Цитата:
|
Ответ: Тест OpenCL
Вложений: 1
Цитата:
Цитата:
Интересно, а если одновременно запускать код и на intel и на nvidia, есть от этого смысл? У меня процессор грузится на 9-13%, когда работает Nvidia, а остальные 87% пусть грузит HD Graphics. UPD: Запустил, так и получается 69 сек за выполнение двойного расчета, то есть ~35 сек, никаких конфликтов :-D Не, тогда не буду выпиливать, буду параллельно всё железо грузить. Цитата:
И победителем становится AMD R9 nano: 5 922 ms :-D Цитата:
http://forum.boolean.name/showpost.p...8&postcount=14 . |
Ответ: Тест OpenCL
Цитата:
Но тут нужно смотреть внимательно на то, что тебе, собственно, нужно. И искать наиболее подходящее под требования по цене, производительности, энергопотреблению и поддержке CUDA, если таковая нужна. R9 nano даже сейчас не сильно дешёвая карточка; с вычислениями и старая-добрая R9 290 отлично справится, и за ощутимо меньшие деньги. Цитата:
~1030 GFLOPS SP ~515 GFLOPS DP R9 290: ~4848 GFLOPS SP ~606 GFLOPS DP Так что да, ещё как может. По голым флопсам АМД уже много поколений лидирует в картах одного ценового сегмента. |
Ответ: Тест OpenCL
Цитата:
А есть монстры типа NVIDIA TITAN X (Pascal), в тестах 12.5 Teraflops, примерно 40к руб за бу. |
Ответ: Тест OpenCL
Цитата:
Название драйвера, который скачал было: "OpenCL™ Runtime 16.1.1 for Intel® Core™ and Intel® Xeon® Processors for Windows* (64-bit & 32-bit)". Слово Core наверно не просто так там. :dontknow: |
Ответ: Тест OpenCL
Цитата:
|
Ответ: Тест OpenCL
Цитата:
Вот страницы с которой качал - https://software.intel.com/en-us/art...opencl-drivers |
Ответ: Тест OpenCL
Цитата:
|
Ответ: Тест OpenCL
Господи, поставил дрова и получил абсолютный рекорд по температуре проца!
-- ![]() |
Ответ: Тест OpenCL
Провёл еще экспресс-тест в Vegas Pro 12/ FullHD-ролик на 3 минуты 50 секунд, 24 кадра в секунду.
-- Рендеринг только на CPU -- ![]() -- Рендеринг с OpenCL -- ![]() -- Рендеринг с CUDA -- ![]() -- Выводы делайте сами. |
Ответ: Тест OpenCL
Цитата:
|
Ответ: Тест OpenCL
Цитата:
|
Ответ: Тест OpenCL
|
Ответ: Тест OpenCL
Цитата:
В этой же статье пишут: Цитата:
|
Ответ: Тест OpenCL
Ребят, а мне что делать??? Это что-то с дровами или с кодеками?
|
Ответ: Тест OpenCL
Цитата:
У меня, например, вегас не даёт запустить рендер при выборе OpenCL - нужна атишка. |
Ответ: Тест OpenCL
Вспомнил, почему я на Intel + Nvidia перешел... 3 часа безуспешных свистоплясок с драйверами AMD. Цель была посмотреть прирост c DualGraphics и без него.
Млять, я одного не понимаю, как люди могут эффективную работу ядер реализовать, если не могут нормальный инсталлятор для драйверов собрать. Инсталлятор ставит драва от другой видюхи, после ребута лезут ошибки, а откатить нормально их не получается, только если вручную ковыряться. В итоге получилось запустить только на DualGraphics HD7640G + HD8570M и отдельно на процессоре. Отдельно на HD8570M и отдельно на встроенном графическом ядре ну никак не запустить. Отключаешь DualGraphics - винда просит драйвера на HD8570M, начинаешь устанавливать - инсталлятор обратно включает DualGraphics и говорит, что драйвера не подходят. В общем, AMD A-серия полный шлак для вычислений. A8-4500U - ждал 7 минут, он что-то там считал, не зависал, но так и не дождался. DualGraphics HD7640G + HD8570M - 86 сек. |
Ответ: Тест OpenCL
Цитата:
Мне просто не ясно, почему у меня CUDA так слабо работает. Карточка, в лучшем случае, нагружается на 20 %... Почему так? |
Ответ: Тест OpenCL
AMD FX-4100 Quad Core - 14 минут.
|
Ответ: Тест OpenCL
Цитата:
|
Ответ: Тест OpenCL
Чёт я запутался в типах (точнее в их названиях в разных языках):
float = float32 - с этим понятно float64 = double - с этим тоже float96, float128, float2, double2 - шо такое? особенно интересно про последние 2. char, uchar - целые, но чем они от int отличаются? для длинных int eсть же long |
Ответ: Тест OpenCL
Цитата:
wchar - 2 байта int - 4 |
Ответ: Тест OpenCL
Понял. А floatN, doubleN (float2, double2) - шо такое?
Цитата:
Еще какой-то atomic... UPD: про атомик вроде понял. floatN, doubleN - это из той же серии? Просто гуглеж привел на atomic, но я пока не понял, это связанные вещи или не совсем. Цитата:
|
Ответ: Тест OpenCL
В OpenCL(CUDA) наверно что-то типа GLSL все же.
float2, 3,4 - вектора (структуры на 2,3,4 флоата) float 96,128 - битность. atomic - потокозащищенные типы (что бы не трахаться с синхронизацией), так как OpenCL или CUDA - многопоточны. На то у куда и до 19к ядер. http://ru.cppreference.com/w/cpp/atomic/atomic |
Ответ: Тест OpenCL
Цитата:
Что вот это, например, значит: Цитата:
|
Ответ: Тест OpenCL
Цитата:
это просто структуры типа double2 { double x; doubole y; } с перегруженными операторами =, () и т.д https://www.khronos.org/registry/cl/...DataTypes.html в доках написано, что double16 - 16 компонентный вектор. Все из-за того, что операции над ними одношаговые. Т.е простое сложение 16ти double происходить так же как и 1го. http://www.informit.com/articles/art...32873&seqNum=3 На, почитай про них: http://www.informit.com/articles/art...32873&seqNum=3 Это такой Matlab, только OpenCL. |
Ответ: Тест OpenCL
Нашел CPU i7-6700 (инженерный). Продавец прогнал тест, заснял видео - 19 сек. Все 8 потоков загружены на 100%. Температура 83 градуса. Частота 3.9. Проц определяется как i7-0000. Посоветуйте, стоит ли брать инженерный?
|
Ответ: Тест OpenCL
|
Ответ: Тест OpenCL
|
Ответ: Тест OpenCL
Победил я CUDA! :) Просто в настройках драйверов надо принудительно указать, что надо использовать CUDA-ядра в Вегасе. :cool:
-- ![]() |
Ответ: Тест OpenCL
Распиши, где, как указывать
|
Ответ: Тест OpenCL
Цитата:
-- ![]() |
Ответ: Тест OpenCL
Цитата:
|
Часовой пояс GMT +4, время: 08:05. |
vBulletin® Version 3.6.5.
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Перевод: zCarot