perf: параллельный расчёт физики через OpenMP by kranks-uga · Pull Request #40 · ElectroZybr/LatticeLab

kranks-uga · 2026-05-25T15:39:51Z

Добавил параллельное выполнение физики через OpenMP. симуляция теперь
использует все ядра процессора.

Что изменено:
расчёт сил между атомами (ForceField.cpp)
построение списка соседей (NeighborList.cpp)
шаг интегратора (VerletScheme.cpp)
подключение OpenMP в сборке (CMakeLists.txt)

Главная сложность была в том, что расчёт сил использует третий закон
Ньютона — каждая пара атомов пишет силу сразу в два места одновременно.
Поэтому я решил создать буфер на каждый поток дабы не было гонки данных.
В конце всё суммируеться

Ожидаемое ускорение: 4–8× на 8-ядерном процессоре при 50k+ атомов.(Сам я не проверял)

applicate2628 · 2026-05-28T09:09:19Z

Я бы использовал OneAPI TBB, он быстрее и стабильнее, хоть и новая зависимость, но хорошую вычислительную систему без OneAPI сложно представить.

kranks-uga · 2026-05-28T10:37:38Z

perf: replace OpenMP with Intel oneAPI TBB

Перешел на TBB.
Адаптировал под новый World из main

ElectroZybr · 2026-05-31T10:12:01Z

Судя по тестам и симуляции, прирост к производительости x2 при 100% загрузке проца. Видимо довольно большой оверхед на распаралливание, или боттлнек по памяти. На маленьких сценах оверхед хорошо видно, дальше немного лучше. А вот интеграция похоже перестала векторизоваться, только паралель

Merged main into perf/openmp-physics to resolve broken build caused by partial World architecture adoption in the TBB commit. TBB parallelization and vectorization fixes (ivdep + __restrict__ in lambda captures) preserved. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

kranks-uga · 2026-05-31T14:18:12Z

Я сам, не понял в чем проблема потому решил оботиться к claude.
Мы с ним покумекали и пришли к вываду что это потолок памяти, она просто не может пропускать такой обем данных у меня x3D и у меня тоже только x2 к скорости. И выходит что скорость L3 не хватает на все потоки. Я могу переделать систему хранения атамов, но это будет слишком большое изменение так как оно затронет вообще все. А так если автор не против, то я сделаю.

perf: параллельный расчёт физики через OpenMP

65edde9

Iosif2321 mentioned this pull request May 27, 2026

Баги Windows/physics/save-load/CI #44

Draft

perf: replace OpenMP with TBB, adapt to World architecture

4df58ea

kranks-uga and others added 2 commits May 31, 2026 16:23

perf: restore vectorization in TBB integrator lambdas

0daf2aa

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

perf: параллельный расчёт физики через OpenMP#40

perf: параллельный расчёт физики через OpenMP#40
kranks-uga wants to merge 4 commits into
ElectroZybr:mainfrom
kranks-uga:perf/openmp-physics

kranks-uga commented May 25, 2026

Uh oh!

applicate2628 commented May 28, 2026

Uh oh!

kranks-uga commented May 28, 2026

Uh oh!

ElectroZybr commented May 31, 2026

Uh oh!

kranks-uga commented May 31, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

kranks-uga commented May 25, 2026

Uh oh!

applicate2628 commented May 28, 2026

Uh oh!

kranks-uga commented May 28, 2026

Uh oh!

ElectroZybr commented May 31, 2026

Uh oh!

kranks-uga commented May 31, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

kranks-uga commented May 31, 2026 •

edited

Loading