add issimilar and get_cannonical_stats

finch-tensor · Dec 19, 2024 · 5896d1a · 5896d1a
1 parent c894dc8
commit 5896d1a
Show file tree

Hide file tree

Showing 5 changed files with 176 additions and 16 deletions.
diff --git a/src/Finch.jl b/src/Finch.jl
@@ -280,7 +280,7 @@ include("interface/einsum.jl")
 include("Galley/Galley.jl")
 using .Galley
 
-export galley_scheduler
+export galley_scheduler, GalleyOptimizer, GalleyExecutorCode, GalleyExecutor
 
 @deprecate default fill_value
 @deprecate redefault! set_fill_value!

diff --git a/src/Galley/FinchCompat/executor.jl b/src/Galley/FinchCompat/executor.jl
@@ -41,8 +41,9 @@ function (ctx::GalleyOptimizer)(prgm)
     julia_prgm
 end
 
-function Finch.set_options(ctx::GalleyOptimizer; estimator=DCStats)
+function Finch.set_options(ctx::GalleyOptimizer; estimator=DCStats, verbose=false)
     ctx.estimator=estimator
+    ctx.verbose=verbose
     return ctx
 end
 
@@ -53,4 +54,82 @@ The galley scheduler uses the sparsity patterns of the inputs to optimize the co
 The first set of inputs given to galley is used to optimize, and the `estimator` is used to
 estimate the sparsity of intermediate computations during optimization.
 """
-galley_scheduler(; verbose = false, estimator=DCStats) = Finch.LogicExecutor(GalleyOptimizer(verbose=verbose, estimator=estimator); verbose=verbose)
+galley_scheduler(; verbose = false, estimator=DCStats) = GalleyExecutor(GalleyOptimizer(verbose=verbose, estimator=estimator); verbose=verbose)
+
+
+"""
+    GalleyExecutor(ctx::GalleyOptimizer, tag=:global, verbose=false)
+
+Executes a logic program by compiling it with the given compiler `ctx`. Compiled
+codes are cached, and are only compiled once for each program with the same
+structure. The `tag` argument is used to distinguish between different
+use cases for the same program structure.
+"""
+@kwdef struct GalleyExecutor
+    ctx::GalleyOptimizer
+    tag
+    verbose
+end
+
+Base.:(==)(a::GalleyExecutor, b::GalleyExecutor) = a.ctx == b.ctx && a.verbose == b.verbose
+Base.hash(a::GalleyExecutor, h::UInt) = hash(GalleyExecutor, hash(a.ctx, hash(a.verbose, h)))
+
+GalleyExecutor(ctx::GalleyOptimizer; tag = :global, verbose = false) = GalleyExecutor(ctx, tag, verbose)
+function Finch.set_options(ctx::GalleyExecutor; tag = ctx.tag, verbose = ctx.verbose, kwargs...)
+    GalleyExecutor(Finch.set_options(ctx.ctx; kwargs...), tag, verbose)
+end
+
+# To make sure that "similar" tensors get "similar"
+function get_stats_dict(ctx::GalleyOptimizer, prgm)
+    deferred_prgm = Finch.defer_tables(:prgm, prgm)
+    expr_stats_dict = Dict()
+    for node in PostOrderDFS(deferred_prgm)
+        if node.kind == table
+            expr_stats_dict[node.tns.ex] = ctx.estimator(node.tns.imm, [i.name for i in node.idxs])
+        end
+    end
+    return expr_stats_dict
+end
+
+galley_codes = Dict()
+function (ctx::GalleyExecutor)(prgm)
+    (f, code) = if ctx.tag == :global
+        cur_stats_dict = get_stats_dict(ctx.ctx, prgm)
+        stats_list = get!(galley_codes, (ctx.ctx, ctx.tag, Finch.get_structure(prgm)), [])
+        valid_match = nothing
+        for (stats_dict, f_code) in stats_list
+            if all(issimilar(cur_stats, stats_dict[cur_expr], 4) for (cur_expr, cur_stats) in cur_stats_dict)
+                valid_match = f_code
+            end
+        end
+        if isnothing(valid_match)
+            thunk = Finch.logic_executor_code(ctx.ctx, prgm)
+            valid_match = (eval(thunk), thunk)
+            push!(stats_list, (cur_stats_dict, valid_match))
+        end
+        valid_match
+    else
+        get!(galley_codes, (ctx.ctx, ctx.tag, Finch.get_structure(prgm))) do
+            thunk = Finch.logic_executor_code(ctx.ctx, prgm)
+            (eval(thunk), thunk)
+        end
+    end
+    if ctx.verbose
+        println("Executing:")
+        display(code)
+    end
+    return Base.invokelatest(f, prgm)
+end
+
+"""
+    GalleyExecutorCode(ctx)
+
+Return the code that would normally be used by the GalleyExecutor to run a program.
+"""
+struct GalleyExecutorCode
+    ctx
+end
+
+function (ctx::GalleyExecutorCode)(prgm)
+    return Finch.logic_executor_code(ctx.ctx, prgm)
+end
diff --git a/src/Galley/Galley.jl b/src/Galley/Galley.jl
@@ -25,7 +25,7 @@ export PlanNode, Value, Index, Alias, Input, MapJoin, Aggregate, Materialize, Qu
 export Scalar, Σ, Mat, Agg
 export DCStats, NaiveStats, TensorDef, DC, insert_statistics
 export naive, greedy, pruned, exact
-export GalleyOptimizer, galley_scheduler
+export GalleyOptimizer, GalleyExecutor, GalleyExecutorCode, galley_scheduler
 
 IndexExpr = Symbol
 TensorId = Symbol

diff --git a/src/Galley/TensorStats/tensor-stats.jl b/src/Galley/TensorStats/tensor-stats.jl
@@ -141,6 +141,12 @@ copy_stats(stat::Nothing) = nothing
 end
 
 get_def(stat::NaiveStats) = stat.def
+get_cannonical_stats(stat::NaiveStats, rel_granularity=4) = NaiveStats(copy_def(stat.def), geometric_round(rel_granularity, stat.cardinality))
+
+# This function assumes that stat1 and stat2 have ONLY differ in the value of their DCs.
+function issimilar(stat1::NaiveStats, stat2::NaiveStats, rel_granularity)
+    return abs(log(rel_granularity, stat1.cardinality) - log(rel_granularity, stat2.cardinality)) <= 1
+end
 
 function estimate_nnz(stat::NaiveStats; indices = get_index_set(stat), conditional_indices=Set{IndexExpr}())
     return stat.cardinality / get_dim_space_size(stat, conditional_indices)
@@ -244,6 +250,41 @@ end
 
 copy_stats(stat::DCStats) = DCStats(copy_def(stat.def), copy(stat.idx_2_int), copy(stat.int_2_idx),  Set{DC}(dc for dc in stat.dcs))
 DCStats(x) = DCStats(TensorDef(x), Dict{IndexExpr, Int}(), Dict{Int, IndexExpr}(), Set{DC}())
+
+# Return a stats object where values have been geometrically rounded.
+function get_cannonical_stats(stat::DCStats, rel_granularity=4)
+    new_dcs = Set{DC}()
+    for dc in stat.dcs
+        push!(new_dcs, DC(dc.X, dc.Y, geometric_round(rel_granularity, dc.d)))
+    end
+    return DCStats(copy_def(stat.def), copy(stat.idx_2_int), copy(stat.int_2_idx), new_dcs)
+end 
+
+# Check whether two tensors have similar sparsity distributions.
+# This function assumes that stat1 and stat2 have ONLY differ in the value of their DCs.
+function issimilar(stat1::DCStats, stat2::DCStats, rel_granularity)
+    if length(stat1.dcs) < 50
+        for dc1 in stat1.dcs
+            for dc2 in stat2.dcs
+                if dc1.X == dc2.X && dc1.Y == dc2.Y && abs(log(rel_granularity, dc1.d) - log(rel_granularity, dc2.d)) > 1
+                    return false
+                end
+            end
+        end
+    else
+        dc_dict = Dict{DCKey}()
+        for dc1 in stat1.dcs
+            dc_dict[get_dc_key(dc1)] = dc1.d
+        end
+        for dc2 in stat2.dcs 
+            if abs(log(rel_granularity, dc_dict[get_dc_key(dc2)]) - log(rel_granularity, dc2.d)) > 1
+                return false
+            end
+        end
+    end
+    return true
+end
+
 get_def(stat::DCStats) = stat.def
 get_index_bitset(stat::DCStats) = SmallBitSet(Int[stat.idx_2_int[x] for x in get_index_set(stat)])
 
@@ -454,13 +495,23 @@ function _vector_structure_to_dcs(indices::Vector{Int}, s::Tensor)
 end
 
 function _matrix_structure_to_dcs(indices::Vector{Int}, s::Tensor)
-    X = Tensor(Dense(Element(0)))
-    Y = Tensor(Dense(Element(0)))
+    n_j, n_i = size(s)
+    d_ij = Scalar(0)
+    @finch begin
+        d_ij .= 0
+        for i =_
+            for j =_
+                d_ij[] += s[j, i]
+            end
+        end
+    end
+
+    X = d_ij[]/n_i < .1 ? Tensor(SparseList(Element(0))) : Tensor(Dense(Element(0)))
+    Y = d_ij[]/n_j < .1 ? Tensor(Sparse(Element(0))) : Tensor(Dense(Element(0)))
     d_i = Scalar(0)
     d_j = Scalar(0)
     d_i_j = Scalar(0)
     d_j_i = Scalar(0)
-    d_ij = Scalar(0)
     @finch begin
         X .= 0
         Y .= 0
@@ -472,11 +523,9 @@ function _matrix_structure_to_dcs(indices::Vector{Int}, s::Tensor)
         end
         d_i .= 0
         d_i_j .= 0
-        d_ij .= 0
         for i=_
             d_i[] += X[i] > 0
             d_i_j[] <<max>>= X[i]
-            d_ij[] += X[i]
         end
         d_j .= 0
         d_j_i .= 0
@@ -496,9 +545,22 @@ function _matrix_structure_to_dcs(indices::Vector{Int}, s::Tensor)
 end
 
 function _3d_structure_to_dcs(indices::Vector{Int}, s::Tensor)
-    X = Tensor(Dense(Element(0)))
-    Y = Tensor(Dense(Element(0)))
-    Z = Tensor(Dense(Element(0)))
+    n_k, n_j, n_i = size(s)
+    d_ijk = Scalar(0)
+    @finch begin
+        d_ijk .= 0
+        for i =_
+            for j =_
+                for k =_
+                    d_ijk[] += s[k, j, i]
+                end
+            end
+        end
+    end
+    X = d_ijk[]/n_i < .1 ? Tensor(SparseList(Element(0))) : Tensor(Dense(Element(0)))
+    Y = d_ijk[]/n_j < .1 ? Tensor(Sparse(Element(0))) : Tensor(Dense(Element(0)))
+    X = d_ijk[]/n_k < .1 ? Tensor(Sparse(Element(0))) : Tensor(Dense(Element(0)))
+
     d_i = Scalar(0)
     d_j = Scalar(0)
     d_k = Scalar(0)
@@ -557,10 +619,25 @@ end
 
 
 function _4d_structure_to_dcs(indices::Vector{Int}, s::Tensor)
-    X = Tensor(Dense(Element(0)))
-    Y = Tensor(Dense(Element(0)))
-    Z = Tensor(Dense(Element(0)))
-    U = Tensor(Dense(Element(0)))
+    n_l, n_k, n_j, n_i = size(s)
+    d_ijkl = Scalar(0)
+    @finch begin
+        d_ijk .= 0
+        for i =_
+            for j =_
+                for k =_
+                    for l =_
+                        d_ijkl[] += s[l, k, j, i]
+                    end
+                end
+            end
+        end
+    end
+    X = d_ijkl[]/n_i < .1 ? Tensor(SparseList(Element(0))) : Tensor(Dense(Element(0)))
+    Y = d_ijkl[]/n_j < .1 ? Tensor(Sparse(Element(0))) : Tensor(Dense(Element(0)))
+    X = d_ijkl[]/n_k < .1 ? Tensor(Sparse(Element(0))) : Tensor(Dense(Element(0)))
+    U = d_ijkl[]/n_l < .1 ? Tensor(Sparse(Element(0))) : Tensor(Dense(Element(0)))
+
     d_i = Scalar(0)
     d_j = Scalar(0)
     d_k = Scalar(0)

diff --git a/src/Galley/utility-funcs.jl b/src/Galley/utility-funcs.jl
@@ -214,3 +214,7 @@ function count_stored(A)
         return sum(pattern!(A))
     end
 end
+
+function geometric_round(b, x)
+    b^(floor(log(b, x))+.5)
+end