Извините, ничего не найдено.

DarkInside · 09.11.2016, 22:11

float2, 3,4 - вектора (структуры на 2,3,4 флоата)

Вектор в смысле матрица-вектор из одной строки (типа массивы из float/double)? Как их использовать?

Что вот это, например, значит:

double2 coord;
coord = (double2)( station.x + degrees(dd), 90.0 - ss )

Типа у нас массив coord из 2-х значений, первое значение = station.x + degrees(dd), второе значение = 90.0 - ss. Так?

RegIon · 10.11.2016, 07:27

Сообщение от DarkInside

Вектор в смысле матрица-вектор из одной строки (типа массивы из float/double)? Как их использовать?

Что вот это, например, значит:

Типа у нас массив coord из 2-х значений, первое значение = station.x + degrees(dd), второе значение = 90.0 - ss. Так?

Ну да.
это просто структуры типа
double2 {
double x;
doubole y;
}

с перегруженными операторами =, () и т.д

https://www.khronos.org/registry/cl/...DataTypes.html

в доках написано, что double16 - 16 компонентный вектор.

Все из-за того, что операции над ними одношаговые. Т.е простое сложение 16ти double происходить так же как и 1го.
http://www.informit.com/articles/art...32873&seqNum=3

На, почитай про них:
http://www.informit.com/articles/art...32873&seqNum=3
Это такой Matlab, только OpenCL.

DarkInside · 10.11.2016, 18:16

Кстати, если кому интересно, набросал для себя такую табличку для выбора видеокарты под GPU-вычисления.

1. Данные о производительности с двойной точностью сложно найти в описаниях многих видеокарт, а если они и есть, то они теоретические. Поэтому для двойной производительности брал результаты бенчмарка Binomial Option Pricing - FP64 - SiSoft Sandra.

2. Предполагается, что у нас смешанные вычисления: половина float, половина double. Поэтому я взял 50 на 50, можете брать свои пропорции.

3. Цены брал на бу самые низкие avito/aliexpress/eBay (+ доставка), поэтому иногда может быть не логично, что видеокарты более высокого класса стоят дешевле.

4. Некоторые видюхи считал в SLI/CrossFire, чтобы хоть как-то уравнять цены или производительность. По 2 штуки, т.к. многие видеокарты двухслотовые, 3-4 просто не влезут. Нашел экспериментальные данные, что в OpenCL с двумя видюхами теряется примерно 15%, поэтому домножал на коэффициент 0,85 при 2 шт. 3 шт ~0,8; 4 шт ~0,75. Кроме Tesla M2090 - т.к. это по сути плата расширения, а не видеокарта, они работают по отдельности, а не в общем массиве SLI/CrossFire.

5. Т.к. преполагается, что видюхи загружены по максимуму, за потребление мощности можно взять TDP, более достоверных данных всё-равно не найти.

6. В итоге оценивал по стоимости за 1 ТФл. С коэффициентом амортизации 1/3 (допустим видюхи будут актуальны 3 года). Учитывая, что через 3 года мы сможем их продать, допустим за 0,5 цены.
(0,5 * Стоимость видюхи / (3 года * 31536000 сек в году) + TDP*10^(-3) * Среднюю цену за 1 кВт*ч / 3600 сек) / Производительность в ТФлопсах.

7. Предполагается, что сервак работает 24 часа в сутки. Средняя цена за 1 кВт*ч = ((Дневной тариф (у нас сейчас 3,92) * 16 часов + ночной тариф (2,26) * 8 часов) / 24 часа) * 1,07 (для 3х лет эксплуатации , тк на 7% в год по статистике растут тарифы).

8. Оптимальным вариантом оказалась R9 nano в основном благодаря низкому TDP. А HD 7990 выдает бешеные результаты в вычислениях с двойной точностью. А если хочется CUDA, то из недорогих можно выбрать GTX 780Ti. Ну и можно выбирать по табличке исходя из нужной производительности, цены, которую вы готовы потратить, версии OpenCL/CUDA и т.д.

9. Ну и не забываем, что всё может измениться при изменении цен, если вы найдете дешевле.

DarkInside · 11.11.2016, 18:41

Нашел CPU i7-6700 (инженерный). Продавец прогнал тест, заснял видео - 19 сек. Все 8 потоков загружены на 100%. Температура 83 градуса. Частота 3.9. Проц определяется как i7-0000. Посоветуйте, стоит ли брать инженерный?

Arton · 11.11.2016, 19:38

DarkInside · 11.11.2016, 19:52

ingko · 15.11.2016, 17:06

Победил я CUDA!

Просто в настройках драйверов надо принудительно указать, что надо использовать CUDA-ядра в Вегасе.

--

DarkInside · 15.11.2016, 17:20

Распиши, где, как указывать

ingko · 15.11.2016, 18:53

Сообщение от DarkInside

Распиши, где, как указывать

Собственно вот: добавляешь Ехешник и ставишь галку, усё!

--

tirarex · 17.11.2016, 21:17

Сообщение от DarkInside

Нашел CPU i7-6700 (инженерный). Продавец прогнал тест, заснял видео - 19 сек. Все 8 потоков загружены на 100%. Температура 83 градуса. Частота 3.9. Проц определяется как i7-0000. Посоветуйте, стоит ли брать инженерный?

С учетом того что мобильный i7 6700hq на 3,3ггц выдал всего на 3 секунды больше результат, результат странный.