forum.boolean.name

forum.boolean.name (http://forum.boolean.name/index.php)
-   Болтовня (http://forum.boolean.name/forumdisplay.php?f=25)
-   -   Тест OpenCL (http://forum.boolean.name/showthread.php?t=20464)

DarkInside 09.11.2016 22:11

Ответ: Тест OpenCL
 
Цитата:

float2, 3,4 - вектора (структуры на 2,3,4 флоата)
Вектор в смысле матрица-вектор из одной строки (типа массивы из float/double)? Как их использовать?

Что вот это, например, значит:
Цитата:

double2 coord;
coord = (double2)( station.x + degrees(dd), 90.0 - ss )
Типа у нас массив coord из 2-х значений, первое значение = station.x + degrees(dd), второе значение = 90.0 - ss. Так?

RegIon 10.11.2016 07:27

Ответ: Тест OpenCL
 
Цитата:

Сообщение от DarkInside (Сообщение 309907)
Вектор в смысле матрица-вектор из одной строки (типа массивы из float/double)? Как их использовать?

Что вот это, например, значит:


Типа у нас массив coord из 2-х значений, первое значение = station.x + degrees(dd), второе значение = 90.0 - ss. Так?

Ну да.
это просто структуры типа
double2 {
double x;
doubole y;
}

с перегруженными операторами =, () и т.д

https://www.khronos.org/registry/cl/...DataTypes.html

в доках написано, что double16 - 16 компонентный вектор.

Все из-за того, что операции над ними одношаговые. Т.е простое сложение 16ти double происходить так же как и 1го.
http://www.informit.com/articles/art...32873&seqNum=3

На, почитай про них:
http://www.informit.com/articles/art...32873&seqNum=3
Это такой Matlab, только OpenCL.

DarkInside 10.11.2016 18:16

Ответ: Тест OpenCL
 
Вложений: 1
Кстати, если кому интересно, набросал для себя такую табличку для выбора видеокарты под GPU-вычисления.

1. Данные о производительности с двойной точностью сложно найти в описаниях многих видеокарт, а если они и есть, то они теоретические. Поэтому для двойной производительности брал результаты бенчмарка Binomial Option Pricing - FP64 - SiSoft Sandra.

2. Предполагается, что у нас смешанные вычисления: половина float, половина double. Поэтому я взял 50 на 50, можете брать свои пропорции.

3. Цены брал на бу самые низкие avito/aliexpress/eBay (+ доставка), поэтому иногда может быть не логично, что видеокарты более высокого класса стоят дешевле.

4. Некоторые видюхи считал в SLI/CrossFire, чтобы хоть как-то уравнять цены или производительность. По 2 штуки, т.к. многие видеокарты двухслотовые, 3-4 просто не влезут. Нашел экспериментальные данные, что в OpenCL с двумя видюхами теряется примерно 15%, поэтому домножал на коэффициент 0,85 при 2 шт. 3 шт ~0,8; 4 шт ~0,75. Кроме Tesla M2090 - т.к. это по сути плата расширения, а не видеокарта, они работают по отдельности, а не в общем массиве SLI/CrossFire.

5. Т.к. преполагается, что видюхи загружены по максимуму, за потребление мощности можно взять TDP, более достоверных данных всё-равно не найти.

6. В итоге оценивал по стоимости за 1 ТФл. С коэффициентом амортизации 1/3 (допустим видюхи будут актуальны 3 года). Учитывая, что через 3 года мы сможем их продать, допустим за 0,5 цены.
(0,5 * Стоимость видюхи / (3 года * 31536000 сек в году) + TDP*10^(-3) * Среднюю цену за 1 кВт*ч / 3600 сек) / Производительность в ТФлопсах.

7. Предполагается, что сервак работает 24 часа в сутки. Средняя цена за 1 кВт*ч = ((Дневной тариф (у нас сейчас 3,92) * 16 часов + ночной тариф (2,26) * 8 часов) / 24 часа) * 1,07 (для 3х лет эксплуатации , тк на 7% в год по статистике растут тарифы).

8. Оптимальным вариантом оказалась R9 nano в основном благодаря низкому TDP. А HD 7990 выдает бешеные результаты в вычислениях с двойной точностью. А если хочется CUDA, то из недорогих можно выбрать GTX 780Ti. Ну и можно выбирать по табличке исходя из нужной производительности, цены, которую вы готовы потратить, версии OpenCL/CUDA и т.д.

9. Ну и не забываем, что всё может измениться при изменении цен, если вы найдете дешевле.


DarkInside 11.11.2016 18:41

Ответ: Тест OpenCL
 
Нашел CPU i7-6700 (инженерный). Продавец прогнал тест, заснял видео - 19 сек. Все 8 потоков загружены на 100%. Температура 83 градуса. Частота 3.9. Проц определяется как i7-0000. Посоветуйте, стоит ли брать инженерный?

Arton 11.11.2016 19:38

Ответ: Тест OpenCL
 
Цитата:

Сообщение от DarkInside (Сообщение 309987)
Нашел CPU i7-6700 (инженерный). Продавец прогнал тест, заснял видео - 19 сек. Все 8 потоков загружены на 100%. Температура 83 градуса. Частота 3.9. Проц определяется как i7-0000. Посоветуйте, стоит ли брать инженерный?

Что такое «инженерный» ЦП?

DarkInside 11.11.2016 19:52

Ответ: Тест OpenCL
 
Цитата:

Что такое «инженерный» ЦП?
Образец, который интел бесплатно рассылает производителям матплат до начала продаж. Может быть ничем не хуже серийного, но в 2 раза дешевле, а может быть с критическими багами. Такой ЦП не предназначен для продажи, не имеет серийного номера и гравировки на крышке, но для китайцев это не проблема, поэтому на алиэкспресс часто можно нарваться на такой.

ingko 15.11.2016 17:06

Ответ: Тест OpenCL
 
Победил я CUDA! :) Просто в настройках драйверов надо принудительно указать, что надо использовать CUDA-ядра в Вегасе. :cool:
--

DarkInside 15.11.2016 17:20

Ответ: Тест OpenCL
 
Распиши, где, как указывать

ingko 15.11.2016 18:53

Ответ: Тест OpenCL
 
Цитата:

Сообщение от DarkInside (Сообщение 310130)
Распиши, где, как указывать

Собственно вот: добавляешь Ехешник и ставишь галку, усё! :crazy:
--

tirarex 17.11.2016 21:17

Ответ: Тест OpenCL
 
Цитата:

Сообщение от DarkInside (Сообщение 309987)
Нашел CPU i7-6700 (инженерный). Продавец прогнал тест, заснял видео - 19 сек. Все 8 потоков загружены на 100%. Температура 83 градуса. Частота 3.9. Проц определяется как i7-0000. Посоветуйте, стоит ли брать инженерный?

С учетом того что мобильный i7 6700hq на 3,3ггц выдал всего на 3 секунды больше результат, результат странный.


Часовой пояс GMT +4, время: 16:52.

vBulletin® Version 3.6.5.
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Перевод: zCarot