Кстати, если кому интересно, набросал для себя такую табличку для выбора видеокарты под GPU-вычисления.
1. Данные о производительности с двойной точностью сложно найти в описаниях многих видеокарт, а если они и есть, то они теоретические. Поэтому для двойной производительности брал результаты бенчмарка Binomial Option Pricing - FP64 - SiSoft Sandra.
2. Предполагается, что у нас смешанные вычисления: половина float, половина double. Поэтому я взял 50 на 50, можете брать свои пропорции.
3. Цены брал на бу самые низкие avito/aliexpress/eBay (+ доставка), поэтому иногда может быть не логично, что видеокарты более высокого класса стоят дешевле.
4. Некоторые видюхи считал в SLI/CrossFire, чтобы хоть как-то уравнять цены или производительность. По 2 штуки, т.к. многие видеокарты двухслотовые, 3-4 просто не влезут. Нашел экспериментальные данные, что в OpenCL с двумя видюхами теряется примерно 15%, поэтому домножал на коэффициент 0,85 при 2 шт. 3 шт ~0,8; 4 шт ~0,75. Кроме Tesla M2090 - т.к. это по сути плата расширения, а не видеокарта, они работают по отдельности, а не в общем массиве SLI/CrossFire.
5. Т.к. преполагается, что видюхи загружены по максимуму, за потребление мощности можно взять TDP, более достоверных данных всё-равно не найти.
6. В итоге оценивал по стоимости за 1 ТФл. С коэффициентом амортизации 1/3 (допустим видюхи будут актуальны 3 года). Учитывая, что через 3 года мы сможем их продать, допустим за 0,5 цены.
(0,5 * Стоимость видюхи / (3 года * 31536000 сек в году) + TDP*10^(-3) * Среднюю цену за 1 кВт*ч / 3600 сек) / Производительность в ТФлопсах.
7. Предполагается, что сервак работает 24 часа в сутки. Средняя цена за 1 кВт*ч = ((Дневной тариф (у нас сейчас 3,92) * 16 часов + ночной тариф (2,26) * 8 часов) / 24 часа) * 1,07 (для 3х лет эксплуатации , тк на 7% в год по статистике растут тарифы).
8. Оптимальным вариантом оказалась R9 nano в основном благодаря низкому TDP. А HD 7990 выдает бешеные результаты в вычислениях с двойной точностью. А если хочется CUDA, то из недорогих можно выбрать GTX 780Ti. Ну и можно выбирать по табличке исходя из нужной производительности, цены, которую вы готовы потратить, версии OpenCL/CUDA и т.д.
9. Ну и не забываем, что всё может измениться при изменении цен, если вы найдете дешевле.