Optimize `merge_sort` algorithm for largest data sizes #1977

SergeyKopienko · 2024-12-19T09:06:23Z

In this PR we extends the approach from #1933 to merge_sort algorithm.

…introduce new function __find_start_point_in Signed-off-by: Sergey Kopienko <[email protected]>

…introduce __parallel_merge_submitter_large for merge of biggest data sizes Signed-off-by: Sergey Kopienko <[email protected]>

…using __parallel_merge_submitter_large for merge data equal or greater then 4M items Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

…fix compile error Signed-off-by: Sergey Kopienko <[email protected]>

…fix Kernel names Signed-off-by: Sergey Kopienko <[email protected]>

…rename template parameter names in __parallel_merge_submitter Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

…fix review comment Signed-off-by: Sergey Kopienko <[email protected]>

…introduce __starting_size_limit_for_large_submitter into __parallel_merge Signed-off-by: Sergey Kopienko <[email protected]>

…renames Signed-off-by: Sergey Kopienko <[email protected]>

…introduce _split_point_t type Signed-off-by: Sergey Kopienko <[email protected]>

…remove usages of std::make_pair Signed-off-by: Sergey Kopienko <[email protected]>

…optimize evaluation of split-points on base diagonals Signed-off-by: Sergey Kopienko <[email protected]>

…renames Signed-off-by: Sergey Kopienko <[email protected]>

…extract eval_split_points_for_groups function Signed-off-by: Sergey Kopienko <[email protected]>

…extract run_parallel_merge function Signed-off-by: Sergey Kopienko <[email protected]>

…using SLM bank size to define chunk in the eval_nd_range_params function Signed-off-by: Sergey Kopienko <[email protected]>

…using SLM bank size to define chunk in the eval_nd_range_params function (16) Signed-off-by: Sergey Kopienko <[email protected]>

…restore old implementation of __find_start_point Signed-off-by: Sergey Kopienko <[email protected]>

…rename: base_diag_part -> steps_between_two_base_diags Signed-off-by: Sergey Kopienko <[email protected]>

…fix review comment Signed-off-by: Sergey Kopienko <[email protected]>

…fix an error in __parallel_merge_submitter_large::eval_split_points_for_groups Signed-off-by: Sergey Kopienko <[email protected]>

…onals is too short Signed-off-by: Sergey Kopienko <[email protected]>

…erge_submitter_large` into one `__parallel_merge_submitter` (#1956)

…fix review comment: remove extra condition check from __find_start_point_in Signed-off-by: Sergey Kopienko <[email protected]>

…fix review comment: fix condition check in __find_start_point_in Signed-off-by: Sergey Kopienko <[email protected]>

…apply GitHUB clang format Signed-off-by: Sergey Kopienko <[email protected]>

….h - trace Kernel's execution time info

…declare local variables outside of the loop in __serial_merge

…rge_sort.h - Simple using 32 Kb of base diagonals for every merging part + calc max amount of base diagonals" This reverts commit bdb68d3.

….h - calcs get_max_base_diags_count

….h - trace Kernel's execution time info

….h - remove duplicated creation of DropViews

….h - fix comment in __lookup_sp

…trace merge Kernel's execution time info

….h - calcs get_max_base_diags_count

…trace merge Kernel's execution time info

# Conflicts: # include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl_merge_sort.h

….h - log __n_sorted state in __merge_sort_global_submitter::operator()

….h - declare __n_sorted as const in __merge_sort_global_submitter::eval_nd_range_params

….h - fix comments for get_max_base_diags_count

….h - remove hard-coded numbers from get_max_base_diags_count

danhoeflinger · 2025-01-23T02:23:29Z