У ATM-lab действительно самая быстрая либа, правда платная.
Там короче энтити объединяются в 1 меш и потом либа используя прямой доступ к памяти двигает уже очевидно сюрфейсы, насколько понял (знать бы эти оффсеты...
)
Если платная не устраивает ищи либу которая может разделять время и подстраиваться, те допустим по 10 частиц за цикл или по 20 она сама решает в зависимости от загруженности. Иначе большого количества чстиц не получишь, а получишь тормоза (не имею ввиду ник). Правда таких либ я пока не видел.
Напишите плиз