Lua はスクリプト言語ですが、関数型言語の機能も備えています。Lua は関数を変数に代入したり、引数として渡すことができます。また、値として関数を返すこともできるので、関数を作る関数を定義することも簡単にできます。
関数を引数として受け取る関数を「汎関数 (functional)」とか「高階関数 (higher order function)」と呼びます。Lua は高階関数を簡単に定義することができます。今回はよく使われる高階関数として、マッピング、フィルター、畳み込み (縮約) について説明します。
まず最初に、引数の関数 fn に配列の要素を渡して呼び出し、その結果を配列に格納して返す関数を作ってみましょう。このような操作を「マッピング (写像)」といいます。なお、関数に引数を与えて呼び出すことを、関数型言語では「適用」といいます。本稿でも関数呼び出しの意味で適用を使うことにします。プログラムをリスト 1 に示します。
リスト 1 : マッピング function map(fn, ary) local a = {} for i = 1, #ary do table.insert(a, fn(ary[i])) end return a end
受け取った関数を呼び出す場合、Lua では特別なことを行う必要はありません。引数 fn を fn(ary[i]) のように関数として使うと、Lua は fn の値を関数として呼び出します。関数を渡す場合も簡単です。関数が定義されている変数を渡すだけでいいのです。実行例を示しましょう。
> function p(a) print(table.unpack(a)) end > p({1,2,3,4}) 1 2 3 4 > a = {1,2,3,4,5} > function square(x) return x * x end > p(map(square, a)) 1 4 9 16 25
配列を要素を表示するために関数 p を定義します。そして、引数を 2 乗する関数 square を定義します。この関数を map に渡すと、要素を 2 乗した新しい配列を返します。このように、Lua は高階関数を簡単に定義することができます。
フィルター (filter) は配列の要素に関数を適用し、関数が真を返す要素を配列に格納して返す関数です。関数型言語では、真または偽を返す関数のことを「述語 (predicate)」といいます。ここでは簡単な例題として、述語が真を返す要素を削除する関数 remove_if を作ってみましょう。関数名は Common Lisp から拝借しました。
リスト 2 : 要素の削除 function remove_if(fn, ary) local a = {} for i = 1, #ary do if not fn(ary[i]) then table.insert(a, ary[i]) end end return a end
map と同様に remove_if も簡単です。fn(ary[i]) が真ならば x を配列 a に加えません。偽ならば ary[i] を配列に加えるだけです。簡単な実行例を示します。
> function evenp(x) return x % 2 == 0 end > function oddp(x) return x % 2 ~= 0 end > p(remove_if(evenp, {1,2,3,4,5,6})) 1 3 5 > p(remove_if(oddp, {1,2,3,4,5,6})) 2 4 6
最初の例では偶数の要素が削除されます。次の例では奇数の要素が削除されます。
もちろん、フィルターも簡単に定義することができます。remove_if とは逆に、述語が真を返すとき要素を配列に追加し、偽を返すときは配列に加えません。
リスト 3 : フィルター function filter(fn, ary) local a = {} for i = 1, #ary do if fn(ary[i]) then table.insert(a, ary[i]) end end return a end
簡単な実行例を示しましょう。
> p(filter(evenp, {1,2,3,4,5,6})) 2 4 6 > p(filter(oddp, {1,2,3,4,5,6})) 1 3 5
2 つの引数を取る関数 f と配列を引数に受け取る関数 fold を考えます。fold は配列の各要素に対して関数 f を図 1 のように適用します。
(1) {a1, a2, a3, a4, a5} => f( f( f( f( a1, a2 ), a3 ), a4 ), a5 ) (2) {a1, a2, a3, a4, a5} => f( a1, f( a2, f( a3, f( a4, a5 ) ) ) ) 図 1 : 関数 fold の動作
関数 f を適用する順番で 2 通りの方法があります。図 1 (1) は配列の先頭から f を適用し、図 1 (2) は配列の後ろから f を適用します。たとえば、関数 f が単純な加算関数とすると、fold の結果はどちらの場合も配列の要素の和になります。
f(x, y) = x + y の場合 fold() => a1 + a2 + a3 + a4 + a5
このように、fold は配列のすべての要素を関数 f を用いて結合します。このような操作を「縮約」とか「畳み込み」といいます。また、fold の引数に初期値 g を指定することがあります。この場合、fold は図 2 に示す動作になります。
(1) [a1, a2, a3, a4, a5] => f( f( f( f( f( g, a1 ), a2 ), a3 ), a4 ), a5 ) (2) [a1, a2, a3, a4, a5] => f( a1, f( a2, f( a3, f( a4, f( a5, g ) ) ) ) ) 図 2 : fold の動作 (2)
ここでは簡単な例題として、図 2 (1) の動作を行う関数 fold_left と、図 2 (2) の動作を行う関数 fold_right を作ってみましょう。
プログラムは次のようになります。
リスト 4 : 畳み込み function fold_left(fn, init, ary) local a = init for i = 1, #ary do a = fn(a, ary[i]) end return a end function fold_right(fn, init, ary) local a = init for i = #ary, 1, -1 do a = fn(ary[i], a) end return a end
fold_left, fold_right の引数 fn が適用する関数、init が初期値、ary が配列です。最初にローカル変数 a を init で初期化します。fold_left はfor ループで ary の要素を先頭から一つずつ取り出し、fn(a, ary[i]) を実行します。fold_left は変数 a の値を fn の返り値に更新することで、図 2 (1) の動作を実現しています。
たとえば、ary が {1, 2, 3} で init が 0 とします。最初は fn(0, 1) が実行され、その返り値が a にセットされます。次は fn(a, 2) が実行されますが、これは fn(fn(0, 1), 2) と同じことです。そして、その結果が a にセットされます。最後に fn(a, 3) が実行されますが、これは fn(fn(fn(0, 1), 2), 3) となり、図 2 (1) と同じ動作になります。
fold_left の場合、配列の要素が関数 fn の第 2 引数になり、第 1 引数にはこれまでの処理結果が渡されます。これに対し、fold_right の場合は逆になり、関数 fn の第 1 引数に配列の要素が渡されて、これまでの処理結果は第 2 引数に渡されます。これで図 2 (2) の動作を実現することができます。
簡単な実行例を示します。
> function add(x, y) return x + y end > fold_left(add, 0, {1,2,3,4,5,6}) 21 > fold_right(add, 0, {1,2,3,4,5,6}) 21
fold_left, fold_right に関数 add を渡すと、配列の要素の合計値を求めることができます。畳み込みは 2 引数の関数と組み合わせると、いろいろな処理を実現することができます。
高階関数を使うようになると、数を 2 乗する square のような小さな関数をいちいち定義するのが面倒になります。とくに、その高階関数でしか使わないのであれば、なおさらそう思うでしょう。Lua には Lisp のラムダ式 (lambda) のような「匿名関数 (anonymous function)」という名前のない関数が用意されています。
匿名関数は次のように定義します。
function(仮引数, ...) 処理A; ...; 処理Z end
匿名関数は Lisp / Scheme のラムダ式と同様に、関数 (クロージャ) を生成して返します。Lua は匿名関数をそのまま実行することができますし、関数の引数に匿名関数を渡すこともできます。簡単な例を示しましょう。
> (function(x) return x * x end)(10) 100 > p(map(function(x) return x * x end, {1,2,3,4,5})) 1 4 9 16 25
map 関数を使う場合、わざわざ square を定義しなくてもいいので簡単です。このように、匿名関数は高階関数と組み合わせて使うと便利です。
また、function による関数定義は、匿名関数を使って次のように書き直すことができます。
リスト 5 : function による関数定義 function square(x) return x * x end
リスト 6 : 匿名関数による関数定義 square = function(x) return x * x end
匿名関数の実行例を示します。
> square = function(x) return x * x end > square function: 0x7fffda8c11e0 > square(10) 100
このように、匿名関数で関数オブジェクトを生成し、その値を変数 square にセットすれば、square(10) のように関数として呼び出すことができます。これは Scheme の関数定義とよく似ています。
ここで、もう少し詳しくローカル変数の規則を見てみましょう。変数 x を表示する関数 foo を定義します。
> function foo() print(x) end > x = 10 > x 10 > foo() 10
foo には変数 x を定義していないので、foo を実行した場合グローバル変数の値を探しにいきます。それでは foo1 という関数から foo を呼び出す場合を考えてみましょう。foo1 には引数 (ローカル変数) x を定義します。この場合、foo はどちらの値を表示するのでしょうか。実際に試してみましょう。
> function foo1(x) foo() end > foo1(100) 10
グローバル変数の値を表示しました。このように、foo1 で定義されているローカル変数 x は、foo からアクセスすることはできません。図 3 を見てください。
図 3 では、変数の有効範囲を枠で表しています。foo1 で定義したローカル変数 x は、関数 foo1 の枠の中でのみ有効です。もしも、この枠で変数が見つからない場合は、ひとつ外側の枠を調べます。この場合、関数定義の枠しかないので、ここで変数が見つからない場合はグローバル変数を調べます。
foo は関数定義の枠しかありません。そこに変数 x が定義されていないので、グローバル変数を調べることになります。このように、foo から foo1 の枠を超えて変数 x にアクセスすることはできないのです。これを「レキシカルスコープ」といいます。レキシカルには文脈上いう意味があり、変数が定義されている範囲内 (枠内) でないと、その変数にアクセスすることはできません。
┌─────── Lua system ───────┐ │ │ │ グローバル変数 x ←────┐ │ │ │ │ │ ┌→┌─ 関数 foo ──────┐ │ │ │ │ │ ┌──────┼─┘ │ │ │ │ print x │ │ │ │ └────────────┘ │ │ │ ┌─ 関数 foo1: x ────┐ │ │ │ │ │ │ │ └─┼─ foo() │ │ │ └────────────┘ │ │ │ └────────────────────┘ 図 3 : レキシカルスコープ
それでは、匿名関数の場合はどうでしょうか。リスト 7 を見てください。
リスト 7 : リストの要素を n 倍する function times_element(n, ary) return map(function(x) return x * n end, ary) end
> p(times_element(10, {1,2,3,4,5})) 10 20 30 40 50
匿名関数の仮引数は x だけですから、変数 n はグローバル変数をアクセスすると思われるかもしれません。ところが、変数 n は関数 times_element の引数 n をアクセスするのです。図 4 を見てください。
┌─────── Lua system ──────┐ │ │ │ ┌─ times_element : n l ─┐ │ │ │ ↑ │ │ │ │ └─┐ │ │ │ │ ┌ function : x ─┐│ │ │ │ │ │ ↑ ││ │ │ │ │ │ ┌──┘ ││ │ │ │ │ │ x * n ││ │ │ │ │ │ └──┼┘ │ │ │ │ └────────┘ │ │ │ └─────────────┘ │ │ │ └───────────────────┘ 図 4 : 匿名関数の変数
ポイントは匿名関数が関数 times_element 内で定義されているところです。変数 n は関数の引数として定義されていて、その有効範囲は関数の終わりまでです。匿名関数はその範囲内に定義されているため、変数 n にアクセスすることができるのです。つまり、関数内で定義された匿名関数は、そのとき有効なローカル変数にもアクセスすることができるわけです。
もうひとつ簡単な例題を示しましょう。指定した文字 c が先頭にある文字列を、リストから削除する関数を作ってみましょう。最初に実行例を示します。
> p(remove_string('a', {'abc', 'def', 'agh', 'ijk'})) def ijk
配列に格納された文字列の中で、a から始まる文字列を削除します。この処理は remove_if と匿名関数を使うと簡単に定義できます。
リスト 8 : 先頭文字が c の文字列を削除 function remove_string(c, ary) return remove_if(function(x) return c == string.sub(x,1,1) end, ary) end
sub は文字列 x から部分文字列を取り出す関数です。文字列の操作関数はハッシュ string にまとめられています。詳細は Lua のリファレンスをお読みください。匿名関数の中で remove_string の引数 c をアクセスできるので、このような定義が可能になります。
JavaScript は関数の中で別の関数を定義することができます。つまり、関数のネスト(入れ子)ができるわけです。入れ子の関数は局所的な関数として扱われるので、定義された関数の中でのみ有効です。他の関数から呼び出すことはできません。また、入れ子の関数は、匿名関数のように定義された関数のローカル変数にアクセスすることができます。
簡単な例として、入れ子の関数を使ってリスト 7 の times_element を書き直してみましょう。リスト 9 を見てください。
リスト 9 : リストの要素を n 倍する (2) function times_element(n, ary) local function _times(x) return x * n end return map(_times, ary) end
入れ子関数の定義は local を指定するだけで、あとは今までの関数定義と同じです。関数定義の中で、別の関数が定義されているだけです。関数 _times は times_element 内で定義されているので、_times から times_element の引数 n を参照することができます。
ちなみに、リスト 9 の処理は匿名関数を使って次のように書き換えることもできます。
リスト 10 : リストの要素を n 倍する (3) function times_element(n, ary) local _times = function(x) return x * n end return map(_times, ary) end
ただし、再帰定義の場合は注意が必要です。最初に、local でローカル変数を定義し、そのあとでその変数に匿名関数を代入します。
local func func = function(x) ...; return func() end
local func = 式 とした場合、ローカル変数 func が生成されるのは式を評価したあとになるので、式の中で func を再帰呼び出しすることはできません。ご注意ください。