Skip to content

Latest commit

 

History

History
196 lines (159 loc) · 6.9 KB

Lambda.md

File metadata and controls

196 lines (159 loc) · 6.9 KB

十分钟魔法练习:λ 演算

By 「玩火」 改写 「ofey404」

前置技能:lua 基础,ADT

local class = require("lib").class
local inherit = require("lib").inherit

Intro

程序员们总是为哪种语言更好而争论不休,而强悍的大佬也为自己造出语言而感到高兴。造语言也被称为程序员的三大浪漫之一。这样一项看上去高难度的活动总是让萌新望而生畏,接下来我要介绍一种世界上最简单的图灵完备语言并给出 100 行 lua 代码的解释器实现。让萌新也能体验造语言的乐趣。

λ演算

1936年,丘奇(Alonzo Church)提出了一种非常简单的计算模型,叫λ演算(Lambda Calculus)。

一些不严谨的通俗理解:

λ表达式中的函数定义 (λ x. E) 就是定义了数学上的函数 f(x)=E ,只不过没有名字, λ 代表一个函数定义的开始,而 . 左边的是函数的自变量,可以是任意符号,这里用了 x. 的右边是函数的内容 E ,可以是任意 λ 表达式。

而函数应用 F X 就是对于一个数学上的函数 F 求值 F(X)F 就是函数, X 就是参数。比如 (λ x. x) 就是 f(x)=x ,比如 (λ x. (x x)) 可以表示为 f(x) = x(x) ,其中 x 应当是个函数,不过这在数学里面是不允许的,而 ((λ x. (x x)) y) 就可以表示为数学上的 f(x) = x(x), f(y) 也就是 y(y)

和传统数学函数最不一样的是λ演算里面的函数可以在任何位置被定义并且没有名字,并且可以被当作变量传递也可以作为函数的计算结果。

一个λ表达式有三种组成可能:变量 x 、函数定义 (λ x. E) 、函数应用 (F X) 。其中 x 是一个抽象的符号, E, F, X 是 λ 表达式。注意这是递归的定义,我们可以通过组合三种形式来构造复杂的 λ 表达式。比如 ((λ x. (x x)) y) 整体是一个函数应用,其 F 是函数定义 (λ x. (x x))Xy ,而 (λ x. (x x)) 函数定义的 x 是变量 xE(x x)

λ表达式的计算也称为归约 (reduce) ,只需要将函数应用整体变换,变换结果为其作为函数定义的第一项 F (也就是 (λ x. E) ) 中 E 里出现的所有自由x 替换为其第二项 X ,也就是说 ((λ x. E) X) 会被归约为 E(x → X) ,。听上去挺复杂,举个最简单的例子 ((λ x. (x x)) y) 可以归约为 (y y) 。我这里提到了自由的 x ,意思是说它不是任何λ函数定义的自变量,比如 (λ x. (x t)) 中的 x 就是不自由的, t 就是自由的。

函数定义有比函数应用更低的优先级,也就是说是 (λ x. (x x)) 可以写成 (λ x. x x) 。函数应用是左结合的,所以 ((x x) x) 可以写成 (x x x)

解释器

首先,我们要用 ADT 定义出 λ 表达式的数据结构:

local Expr = class('Expr', {})

-- Value 变量
local Val = inherit(Expr, 'Val', {
    symbol = nil,
    uuid = nil,
    __tostring = function(self) return self.symbol end,
    __eq = function(self, b)
        if self.type ~= "Expr:Val" or b.type ~= "Expr:Val" then
            return false
        end
        return self.uuid == b.uuid
    end
})
local function newVal(s, id) return Val:new{symbol = s, uuid = id} end

-- Function 函数定义
local Fun = inherit(Expr, 'Fun', {
    argument = nil,
    expr = nil,
    __tostring = function(self)
        return table.concat {
            "", tostring(self.argument), ". ", tostring(self.expr), ")"
        }
    end
})
local function newFun(s, a)
    if type(s) == "string" then return Fun:new{argument = newVal(s), expr = a} end
    return Fun:new{argument = s, expr = a}
end

-- Apply 函数应用
local App = inherit(Expr, 'App', {
    func = nil,
    expr = nil,
    __tostring = function(self)
        return table.concat {
            "(", tostring(self.func), " ", tostring(self.expr), ")"
        }
    end
})
local function newApp(e1, e2) return App:new{func = e1, expr = e2} end

注意到上面代码中 Val 有一个类型为 UUID 的字段,同时 equals 函数只比较 id 字段,这个字段是用来区分相同名字的不同变量的。如果不做区分那么对于下面的 λ 表达式:

λ z. (λ x. (λ z. x)) z

会被规约成

λ z. (λ z. z)

然而实际上最内层的 z 最开始是被最外层的函数定义定义的,而这里它被内层的函数定义错误地捕获(Capture)了,所以正确的规约结果应该是:

λ z'. (λ z. z')

然后就可以构造 λ 表达式了,比如 (λ x. x (λ x. x)) y 就可以这样构造:

local expr = newApp(newFun("x", newApp(newVal("x"), newFun("x", newVal("x")))),
                    newVal("y"))

然后就可以定义归约函数 reduce 和应用自由变量函数 apply 还有用来生成 UUIDgenUUID 函数和 applyUUID 函数:

local random = math.random
local function uuid()
    local template ='xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx'
    return string.gsub(template, '[xy]', function (c)
        local v = (c == 'x') and random(0, 0xf) or random(8, 0xb)
        return string.format('%x', v)
    end)
end

function Val:reduce()
    return self
end

function Val:apply(val, expr)
    if self == val then
        return expr
    end
    return self
end

function Val:genUUID()
    return self
end

function Val:applyUUID(val)
    if self.symbol == val.symbol then
        return newVal(self.symbol, val.id)
    end
    return self
end

function Fun:reduce()
    return self
end

function Fun:apply(val, expr)
    if val == self.argument then
        return self
    end
    return newFun(self.argument, self.expr:apply(val, expr))
end

function Fun:genUUID()
    if self.argument.uuid == nil then
        local v = newVal(self.argument.symbol, uuid())
        return newFun(v, self.expr:applyUUID(v):genUUID())
    end
    return newFun(self.argument, self.expr:genUUID())
end

function Fun:applyUUID(val)
    if (self.argument.symbol == val.symbol) then
        return self        
    end
    return newFun(self.argument, self.expr:applyUUID(val))
end

function App:reduce()
    local fr = self.func:reduce()
    if (fr.type == "Expr:Fun") then
        return fr.expr:apply(fr.argument, self.expr):reduce()
    end
    return newApp(fr, self.expr)
end

function App:apply(val, expr)
    return newApp(self.func:apply(val, expr), self.func:apply(val, expr))
end

function App:genUUID()
    return newFun(self.func:genUUID(), self.expr:genUUID())
end

function App:applyUUID(val)
    return newFun(self.func:applyUUID(val), self.expr:applyUUID(val))
end

print(expr)
print(expr:reduce())
-- ((λ x. (x (λ x. x))) y)  ->  (y y)

注意在 reduce 一个表达式之前应该先调用 genUUID 来生成变量标签否则会抛出空指针异常。

以上就是 100 行 lua 写成的解释器啦!