お気楽 Common Lisp プログラミング入門

funarg 問題

今回は拙作のページ「Common Lisp で作る micro Scheme」で取り上げた「funarg 問題 (Function Argument Problem)」についてもう少し詳しく説明します。

なお、説明の都合上、処理系には xyzzy Lisp (CLtL1) を使っています。ANSI Common Lisp では動作しないプログラムがありますが、あしからずご了承ください。ご指摘いただいた g000001 さんに深く感謝いたします。

●funarg 問題とは？

Common Lisp は関数を変数に代入したり、高階関数に渡したり、関数の返り値として関数を返すこともできます。一般に、プログラミング言語において数値など基本的なデータと同じように扱うことができるデータを「一等値」とか「第一級オブジェクト (first class object)」といいます。

特に、一等値として扱うことができる関数のことを「第一級関数 (first-class function)」といいます。funarg 問題は関数を一等値として扱うときに生じる問題です。

たとえば、次のリストを見てください。

リスト : リストの要素を n 倍する

(defun times-element (n xs)
  (mapcar (lambda (x) (* x n)) xs))

リスト : 引数に n を加算する関数を返す

(defun make-adder (n) (lambda (x) (+ n x)))

times-element と make-adder のラムダ式には変数 n が使われています。ラムダ式の中で変数 n は定義されていません。このような変数を「自由変数」といいます。Common Lisp は「レキシカルスコープ」なので、自由変数の解釈はプログラムの文脈から決定することができます。この場合、times-element と make-adder の引数 n を参照することになります。

ところが、昔の Lisp は「ダイナミックスコープ」なので、自由変数の解釈は関数を実行する順番に左右され、プログラムの文脈だけでは決定することができません。このように、自由変数の取り扱いが曖昧になると、funarg 問題が発生します。

●function と quote の違い

高階関数に関数を渡すとき、Common Lisp では function 特殊形式 (#') を使います。大昔の Lisp は #' がなくて、quote ( ' ) で関数を渡していました。ANSI Common Lisp 以前の Lisp や xyzzy Lisp の場合、クォートでも関数を渡すことができます ^[*1]。次の例を見てください (xyzzy Lisp での実行例です)。

(mapcar '(lambda (x) (* x x)) '(1 2 3 4))
=> (1 4 9 16)
(mapcar '+ '(1 2 3) '(4 5 6))
=> (5 7 9)

ただし、クォートで関数を渡す場合、次のようなプログラムは動作しません。

(defun times-element (n xs)
  (mapcar '(lambda (x) (* n x)) xs))
=> times-element
(times-element 10 '(1 2 3 4))
=> 変数が定義されていません: n

ラムダ式内の変数 n は自由変数です。Ｃ言語のように、局所関数や匿名関数がない言語であれば、自由変数を大域変数として処理すればいいでしょう。ところが、関数型言語では関数を高階関数に渡すことができますし、返り値として関数を返すこともできます。自由変数を大域変数として処理すると困ってしまいます。

関数を返す場合も同様です。

(defun make-adder (n)
  '(lambda (x) (* n x)))
=> make-adder
(setq a (make-adder 10))
=> (lambda (x) (* n x))
(funcall a 1)
=> 変数が定義されていません: n

このように Common Lisp の場合、クォートを使って関数を渡したり返り値として返すと、レキシカルスコープが働かないので、外側の関数の引数やレキシカル変数にアクセスすることはできません。

-- note --------
[*1] ANSI Common Lisp の場合、'(lambda ...) を関数として渡すことはできません。SBCL での実行例を示します。

* (mapcar '(lambda (x) (* x x)) '(1 2 3 4 5))

debugger invoked on a SB-KERNEL:CASE-FAILURE in thread
#<THREAD "main thread" RUNNING {10005E85B3}>:
  (LAMBDA (X) (* X X)) fell through ETYPECASE expression.
  Wanted one of (FUNCTION SYMBOL).

Type HELP for debugger help, or (SB-EXT:EXIT) to exit from SBCL.

restarts (invokable by number or by possibly-abbreviated name):
  0: [ABORT] Exit debugger, returning to top level.

(SB-KERNEL:%COERCE-CALLABLE-TO-FUN (LAMBDA (X) (* X X)))
0] a

* (mapcar '+ '(1 2 3) '(4 5 6))

(5 7 9)

●ダイナミックスコープで動作する場合

ところが、昔の Lisp は変数を「ダイナミックスコープ」で管理しているので、times-element は動作するのです。Common Lisp の場合、defvar で宣言された変数はダイナミックスコープで管理されます。次の例を見てください (xyzzy Lisp での実行例です)。

(defun times-element (n xs)
  (mapcar '(lambda (x) (* n x)) xs))
=> times-element
(defvar n)
=> n
(times-element 10 '(1 2 3 4))
=> (10 20 30 40)

ダイナミックスコープの場合、呼び出された関数から呼び出し元の関数で定義された局所変数にアクセスすることができます。ラムダ式は times-element -> mapcar の順番に呼び出されているので、times-element の引数 n の値を参照することができるわけです。

●ダイナミックスコープでも動作しない場合

この例では動作しましたが、ダイナミックスコープでは動作しない場合もあります。たとえば、mapcar の定義で変数 n が使われていると、ダイナミックスコープでは times-element の引数 n を隠蔽してしまうので、プログラムは正常に動作しません。次の例を見てください (xyzzy Lisp での実行例です)。

(defun my-mapcar (n xs)
  (if (null xs)
      'nil
    (cons (funcall n (car xs)) (my-mapcar n (cdr xs)))))
=> my-mapcar

(my-mapcar '(lambda (x) (* x x)) '(1 2 3 4))
=> (1 4 9 16)

(defun times-element (n xs)
  (my-mapcar '(lambda (x) (* n x)) xs))
=> times-element

(times-element 10 '(1 2 3 4))
=> 不正なデータ型です: (lambda (x) (* n x)): number

ダイナミックスコープは一本の連想リストで変数を管理していると考えてください。これを「環境 (environment)」と呼ぶことにしましょう。関数呼び出しは times-element -> my-mapcar -> ラムダ式の順番で行われます。times-element を呼び出すとき、引数 n と xs が環境に追加されます。

環境 : ((n . 10) (xs 1 2 3 4))

次に、my-mapcar を呼び出しますが、このとき引数 n と xs が環境に追加されます。

環境 : ((n lambda (x) (* n x)) (xs 1 2 3 4) (n . 10) (xs 1 2 3 4))

最後にラムダ式を評価しますが、このとき引数 x が環境に追加されます。

環境 : ((x . 1) (n lambda (x) (* n x)) (xs 1 2 3 4) (n . 10) (xs 1 2 3 4))

ダイナミックスコープで変数を参照するとき、環境を先頭から線形探索します。ラムダ式の本体は (* n x) ですね。環境を線形探索して最初に見つかる値は、n が (lambda (x) (* n x)) で、x が 1 になります。n は数値ではないのでエラーが発生します。また、make-adder もダイナミックスコープでは動作しません。返されたラムダ式を評価するとき、make-adder の評価は終わっているので、環境に引数 n の情報は残っていないのです。

このように、関数を定義するときの環境と実行するときの環境が異なると、プログラムが正常に動作しない場合があるのです。これが Lisp における funarg 問題のひとつです。

●クロージャの導入

このような funarg 問題を解決するため、昔の Lisp (LISP 1.5, 1962 年) で導入されたのが function 式 (#') です。参考文献 2 『ＣプログラムブックⅢ』によると、function 式を評価すると次のような funarg 形式が返されるそうです。

(funarg <lambda 式> <環境>)

funarg 形式は実行する関数本体 (ラムダ式) と、function 式を評価したときの環境を格納したものです。その後、これを「クロージャ (closure)」と呼ぶようになりました。ただし、LISP 1.5 はダイナミックスコープなので、クロージャに格納される環境はダイナミックスコープのままであることに注意してください。

実をいうと、昔の Lisp にはもう一つ問題があって、小出さんの「セマンティックウェブ・ダイアリー」によると、『昔の Lisp は現在なら動的変数と呼ばれるものであり，そのために非常にわざとらしくプログラムすると，Lisp をコンパイルしないで実行した場合とコンパイルして実行した結果が異なるコードを書くことができて，これをFUNARG問題という名前で呼んでいた』とのことです。

これはインタプリタとコンパイラで異なるスコープ規則を使っていたためです。コンパイラはダイナミックスコープでも作成できますが、性能を上げるにはレキシカルスコープのほうが有利だからです。Common Lisp - Wikipedia によると、『ZetaLisp や Franz Lisp といった Common Lisp の設計に寄与した LISP系のシステムの多くは、インタプリタ内では動的スコープを、コンパイラ内では構文スコープを使っていた。』とのことです。

funarg 問題を解決するには、スコープ規則をレキシカルスコープにそろえる必要がありました。そして、クロージャを使うとインタプリタでも簡単にレキシカルスコープを実装することができます。レキシカルスコープを採用した最初の Lisp 処理系が Scheme です。Scheme は関数 (局所変数やラムダ式も含む) をクロージャとして統一して扱うことで、第一級関数とレキシカルスコープを実現しています。

ちなみに、拙作のページ「Common Lisp で作る micro Scheme」と「Scheme で作る micro Scheme」で作成した処理系もクロージャを使ってレキシカルスコープを実現しています。

このへんの事情は次のページが参考になると思います。

なぜSchemeはstatic scopeで設計されているのでしょうか, (Shiro さんのコメント)
[メモ]LISP 1.5 での FUNARG 導入から第一級オブジェクトとしてのクロージャの発見まで, (水谷さん)
A Definition of Closures - クロージャの定義, (原著) Neal Gafter さん, (訳) selflearnウィキさん

その後、レキシカルスコープは Common Lisp にも採用されました。Common Lisp は function (#') を使うかぎり funarg 問題は発生しません。参考文献 3 『COMMON LISP 第 2 版』 (CLtL2) 99 ページより引用します。

『function fn
function の値は常に fn の関数解釈である。fn はあたかも関数呼び出しの関数の位置に現れているかのように解釈される。特に fn がシンボルであれば、そのシンボルに関する関数定義が返される。symbol-funcion を参照せよ。もし fn がラムダ式であれば、レキシカルクロージャが返される。つまり、関数として呼び出されると、適切にレキシカルスコープの規則に従っているようにラムダ式の本体を実行する。』

●クロージャは環境を保持する

もう少し具体的に説明しましょう。クロージャはそのときに有効なレキシカル変数とその値も取り出して保存します。ここでは、レキシカル変数は環境に格納されていると考えてください。次の例を見てください。

 (defun foo (a)            ───────
   (let ((b 20))           ─────  ↑
                                 ↑    │a
     ・・１・・                  │b   │
                                 │    │    (foo 10) を評価した場合
     (mapcar #'(lambda (c) ──  │    │ => #<lexical-closure:...> 
                           ↑c   │    │      Ｓ式 (lambda (c) ..... ) 
       ・・２・・          ↓    ↓    │      環境 ((b . 20) (a . 10))
             ) b))         ─────  │
                                       │
    ・・３・・                         ↓
             )             ───────

                    図 : function の評価とクロージャ

(foo 10) を評価することを考えてみましょう。トップレベルで関数を定義するとき、レキシカル変数は定義されていないので、環境は空リストになります。関数を定義するときもクロージャが生成され、そのときの環境が保持されると考えてもらってもかまいません。関数を評価するときは、クロージャに保持されている環境の下で行います。

(foo 10) を評価するとき、最初に実引数が評価されてその結果が仮引数に束縛されます。これが環境に追加されます。

環境 : ((a . 10))

次に let を評価すると、定義されているレキシカル変数が環境に追加されます。

環境 : ((b . 20) (a . 10))

次に mapcar を評価します。mapcar はトップレベルで定義された関数とすると、mapcar を評価するときの環境は空リストになります。次に実引数が評価されて、仮引数と値が環境に追加されます。このとき、function 特殊形式 (#') が評価されてクロージャが生成され、そのときの環境がクロージャに保存されます。たとえば、mapcar の仮引数名を fn と xs とすると、環境は次のようになります。

環境 : ((fn . #<lexical-closure <ラムダ式> ((b . 20) (a. 10))>) (xs ...))

クロージャに保持された環境には foo の引数 a と let と定義したレキシカル変数 b が格納されます。

次に、mapcar の中で関数 fn を評価します。fn はクロージャなので、保持されている環境の下でラムダ式を評価します。まず引数の値がセットされますね。たとえば、c に 30 がセットされたとしましょう。すると、クロージャに保持されている環境に (c . 30) が追加されます。

環境 : ((c . 30) (b . 20) (a . 10))

ラムダ式の本体はこの環境で評価されるため、ラムダ式の引数 c 以外の自由変数、つまり foo の引数や let で定義されたレキシカル変数にアクセスすることができるわけです。また、mapcar で生成された環境とは別であることにも注意してください。ダイナミックスコープのように、mapcar で定義された変数が foo の引数や変数を隠蔽することはありません。これでレキシカルスコープを実現することができます。

●クロージャを使用するときの注意点

このように、クロージャが保持するのは「環境」なので、変数の値を書き換えることができるプログラミング言語でクロージャを使うときには注意が必要です。次のリストを見てください。

リスト : 繰り返しで複数の関数を生成

(defun make-func ()
  (do ((func nil)
       (i 0 (1+ i)))
      ((>= i 5) func)
    (push (lambda () (print i)) func)))

make-func はラムダ式でクロージャを 5 つ生成し、それをリストに格納して返します。ラムダ式の中はレキシカル変数 i を表示します。期待する結果は 4 3 2 1 0 と表示されることです。ところが、実行結果は次のようになりました。

* (dolist (f (make-func)) (funcall f))

5
5
5
5
5
NIL

関数 make-func を評価するとき、その環境にレキシカル変数 func と i が追加されます。生成する 5 つのクロージャはこの環境を保持することになります。つまり、make-func と生成するクロージャは環境を共有しているのです。make-func で変数の i の値を書き換えると、当然ですがクロージャで保持している i の値も変わります。したがって、どのクロージャでも変数 i の値は make-func が書き換えた 5 になるのです。

この場合、再帰呼び出しを使うとうまくいきます。

リスト : 再帰呼び出しで複数の関数を生成

(defun make-func1 (i &optional (func nil))
  (if (>= i 5)
      func
    (make-func1 (1+ i) (cons (lambda () (print i)) func))))

関数 make-func1 を再帰呼び出しするたびに新しい環境が生成され、そこに引数 i が追加されます。クロージャはこの環境を保持するので、個々のクロージャに保存される環境は別のものになり、参照する変数 i の値は make-func1 を呼び出したときの値になります。

それでは実行してみましょう。

* (dolist (f (make-func1 0)) (funcall f))

4
3
2
1
0
NIL

正常に動作していますね。なお、Common Lisp の do は tagbody と go を使った繰り返しに変換されますが、Scheme の do は末尾再帰に変換されます。したがって、Scheme ではこのようなプログラムも do で動作することに注意してください。

Gauche で実行例を示します。

リスト : Scheme の do での動作

(define (make-func)
  (do ((func '())
       (i 0 (+ i 1)))
      ((>= i 5) func)
    (push! func (lambda () (print i)))))

gosh> (define f (make-func))
f
gosh> (dolist (x f) (x))
4
3
2
1
0
()

なお、SML/NJ, OCaml, Haskell などの関数型言語は、関数の引数や変数の値を書き換えることができません。手続き型言語は代入により変数の値を書き換えることができますが、純粋な関数型言語に代入操作はありません。当然ですが、クロージャに保存された変数の値も書き換えることはできません。ご注意くださいませ。

●参考文献・URL

黒川利明, 『LISP 入門』, 培風館, 1982
小西弘一, 清水剛, 『ＣプログラムブックⅢ』, アスキー, 1986
Guy L. Steele Jr. (著), 井田昌之 (翻訳監修), 『COMMON LISP 第 2 版』, 共立出版, 1991