今回は micro Scheme のコンパイラバージョンを Scheme で作ってみましょう。
一般に、コンパイラの作成はとても難しいと思われていますが、小さな Lisp 処理系のコンパイラであれば、それほど難しいことではありません。特に、仮想マシン上で動作する小さな Lisp 処理系の場合、思っているよりも簡単にコンパイラを作成することができます。今回は SECD マシンという仮想マシン上で動作するコードを生成し、そのコードを Scheme で実行することにします。
SECD マシンは 1963年 に Peter J. Landin が設計した仮想マシンで、もともとは「ラムダ計算 (lambda calculus)」で用いられるラムダ式を評価するためのものです。ラムダ計算は、文字λを使って関数を表す「λ記法」という表記法を用いた抽象的な計算モデルで、1930 年代に A. Church によって考案されました。ラムダ計算は Lisp, Scheme, ML, Haskell など多くの関数型言語の基礎理論として、大きな役割を果たしています。
実際に SECD マシンをベースにした処理系には、1980 年に Peter Henderson が作成した Lispkit Lisp があります。SECD マシンの実装については、Skelet 氏の SECD Mania (http://skelet.ludost.net/sec/index.html) が参考になります。
実用的な処理系では、PalmOS で動作する LispMe (Scheme, http://www.lispme.de/lispme/index_en.html) があります。日本では、森脇淳氏と林祥一氏による SECDR-Scheme (http://www.maroon.dti.ne.jp/nagar17/mulasame/) がとても参考になります。
SECD マシンは S, E, C, D という 4 つのレジスタ (変数) を持った仮想マシンです。
これらのレジスタはリストを保持します。スタックは値を一時的に保存するために使われます。たとえば、1 + 2 を計算する場合、数値 1 と 2 をスタックに追加します。次に、加算処理を行いますが、スタックから数値 1 と 2 を取り出して 1 + 2 を計算し、その値 3 をスタックに追加します。
このように、スタックを使って計算を行う機械を「スタックマシン (stack machine)」といいます。SECD 仮想マシンはスタックマシンの一種になります。スタックマシンをベースにしたプログラミング言語では Forth が有名です。また、Java の仮想マシンもスタックマシンをベースにしています。
実行する仮想マシンの命令は C レジスタのリストに格納されていて、それを先頭から順番に取り出して、その命令を実行します。局所変数の値は E レジスタのリストから求めます。D レジスタは条件分岐と関数呼び出しを行うとき、その後の処理を継続するため S, E. C レジスタの値を保存するために使用します。
今回作成する SECD 仮想マシンの命令と機能概要を下表に示します。
命令 | 機能概要 |
---|---|
ld (i . j) | E レジスタの i 番目のフレームの j 番目の要素をスタックに積む |
ldc const | 定数 const をスタックに積む |
ldg sym | 大域変数 sym の値をスタックに積む |
ldf code | code からクロージャを生成してスタックに積む |
args n | スタックから n 個の値を取り出してリストに格納し、そのリストをスタックに積む |
app | スタックに積まれているクロージャと引数リストを取り出して関数呼び出しを行う |
rtn | 関数呼び出しから戻る |
sel ct cf | スタックトップの値が真ならば ct を実行する。偽ならば cf を実行する |
join | 条件分岐から合流する |
pop | スタックトップの値を取り除く |
def sym | スタックトップの値を大域変数 sym にセットする |
stop | 仮想マシンの実行を停止する |
これらの命令は Henderson の SECD マシンを参考にしていますが、まったく同じではありません。micro Scheme の仕様にあわせて、新しい命令を追加したり不要な命令を削除しています。なお、今回作成する micro Scheme の仕様は、拙作のページ「Scheme で作る micro Scheme」で作成したインタプリタと同じです。また、今回のプログラムでもエラーチェックはほとんど行っていません。あしからずご了承ください。
命令の動作は 4 つのレジスタ (S, E, C, D) の状態遷移で表すことができます。ここで、各命令の動作について詳しく説明することにしましょう。各レジスタの値はドットリストで表すことにします。
ld はレジスタ E から局所変数の値 v を求めてスタックに積む命令です。
s e (ld (i . j) . c) d => (v . s) e c d v = (get-lvar e i j)
ld の次の命令はドットペア (i . j) で、局所変数の位置を i と j で表しています。今回のプログラムでは関数 get-lvar で局所変数の値を求めます。
micro Scheme の場合、局所変数はラムダ式で定義されます。局所変数はラムダ式ごとにリストにまとめて環境にセットします。これをフレームといいます。i がフレームの位置、j がフレームの中の変数の位置を表します。
簡単な例を示しましょう。次の図を見てください。
(1) ((lambda (a b) ...) 1 2) E: ((1 2)) (2) ((lambda (a b c) ((lambda (d e) ...) 4 5)) 1 2 3) E: ((4 5) (1 2 3))
(1) の場合、フレームは一つしかありません。変数 a の位置は (0 . 0) で値は 1 になり、b の位置は (0 . 1) で値は 2 になります。(2) の場合、フレームは 2 つあります。この場合、各変数の位置と値は次のようになります。
a : (1 . 0), 値 = 1 b : (1 . 1), 値 = 2 c : (1 . 2), 値 = 3 d : (0 . 0), 値 = 4 e : (0 . 1), 値 = 5
局所変数の位置はコンパイルの時に求めます。
ldc は定数 const をスタックに、ldg は大域変数 sym の値をスタックに積む命令です。
s e (ldc const . c) d => (const . s) e c d
s e (ldg sym . c) d => (v . s) e c d v = (get-gvar sym)
micro Scheme の場合、自己評価フォームまたはクオート (quote) の引数を定数として扱います。大域変数 sym の値は関数 get-gvar で求めます。
ldf はクロージャを生成して、それをスタックに積む命令です。
s e (ldf code . c) d => ((closure code e) . s) e c d
具体的に説明すると、ldf はラムダ式 (lambda (a ...) body ...) を処理する命令です。ldf の次の命令 code は、ラムダ式の本体 (body ...) をコンパイルしたものです。それと環境 e をリストに格納してクロージャを生成します。今回のプログラムではリストの先頭にタグ closure を付加して、それがクロージャであることを表しています。
args はスタックから n 個の値を取り出してリストに格納して、それをスタックに積む命令です。
(v1 ... vn . s) e (args n . c) d => (vs . s) e c d vs = (list v1 ... vn)
関数を呼び出すとき引数を評価しますが、その返り値はスタックに格納されます。たとえば、n 個の引数がある場合、スタックには v1 から vn までの値が格納されています。それをスタックから取り出してリスト vs に格納し、それをスタックに積むのが args の役目です。このあと、関数 (closure または primitive) をスタックに積み、app という命令で関数を呼び出します。
app はスタックに積まれた関数と引数のリストを取り出して、その関数を呼び出す命令です。
((closure code env) vs . s) e (app . c) d => () (vs . env) code ((s e c) . d)
((primitive #<func>) vs . s) e (app . c) d => (v . s) e c d v = (apply #<func> vs)
関数がクロージャ (closure) の場合、クロージャ内のコード code を環境 (vs . env) の元で実行します。env はクロージャに保存されている環境で、vs が関数の引数を格納したリストです。そして、呼び出し元の実行環境、つまり関数呼び出しから戻ってきた後に実行する処理 (継続) をダンプに保存します。これは s, e, c を保存すれば OK です。
関数が primitive の場合、#<func> は Scheme の関数なので、apply で関数を呼び出して、その返り値 v をスタックに追加するだけです。
rtn はクロージャの呼び出しから戻るための命令です。
(v . s) e (rtn . c) ((s' e' c') . d) => (v . s') e' c' d
クロージャの返り値 v はスタックに保存されています。それを取り出して、ダンプに保存されているスタック s' に追加します。そして、ダンプに保存されている環境 e' とコード c' を元に戻します。
sel と join はシンタックス形式 if を実現するための命令です。
(v . s) e (sel ct cf . c) d = v (真) => s e ct (c . d) = v (偽) => s e cf (c . d)
s e (join . ()) (c . d) => s e c d
sel の次に then 節のコード ct があり、その次に else 節のコード cf があります。スタックトップの値 v が真 (not #f) の場合は ct を実行します。偽 (#f) の場合は cf を実行します。このとき、if のあとに実行する命令 c をダンプに保存します。app と違って s と e を保存する必要はありません。ct と cf の最後は必ず join 命令で終了します。join 命令はダンプに保存されている命令 c を取り出し、if のあとの命令を実行します。
pop はスタックトップの値を取り除く命令です。
(v . s) e (pop . c) d => s e c d
def はシンタックス形式 define を実現するための命令です。
(v . s) e (def sym . c) d => (sym . s) e c d
def は大域変数 sym をスタックトップの値 v に束縛します。
stop は仮想マシンの実行を停止する命令です。
(v . s) e (stop . c) d => 仮想マシン vm を停止して v を返す
仮想マシンを関数 vm とすると、vm は stop を実行するとスタックトップの値 v を返します。
それでは micro Scheme のコンパイラを作りましょう。コンパイラの構成はインタプリタとほとんど同じです。インタプリタは与えられた S 式をその場で評価しますが、コンパイラは S 式を仮想マシンの命令 (プログラム) に翻訳するだけです。そして、翻訳されたプログラムを仮想マシンで実行するわけです。
プログラムは次のようになります。
リスト : micro Scheme コンパイラ ;;; S 式をコンパイルする (define (compile expr) (comp expr '() '(stop))) ;;; コンパイラ本体 (define (comp expr env code) (cond ((self-evaluation? expr) ; 自己評価フォーム (list* 'ldc expr code)) ((symbol? expr) ; 変数 (let ((pos (location expr env))) (if pos ;; 局所変数 (list* 'ld pos code) ;; 大域変数 (list* 'ldg expr code)))) ((eq? (car expr) 'quote) (list* 'ldc (cadr expr) code)) ((eq? (car expr) 'if) (let ((t-clause (comp (caddr expr) env '(join))) (f-clause (if (null? (cdddr expr)) (list 'ldc '*undef 'join) (comp (cadddr expr) env '(join))))) (comp (cadr expr) env (list* 'sel t-clause f-clause code)))) ((eq? (car expr) 'lambda) (let ((body (comp-body (cddr expr) (cons (cadr expr) env) '(rtn)))) (list* 'ldf body code))) ((eq? (car expr) 'define) (comp (caddr expr) env (list* 'def (cadr expr) code))) (else ; 関数呼び出し (complis (cdr expr) env (list* 'args (length (cdr expr)) (comp (car expr) env (cons 'app code)))))))
関数 compile は S 式 expr をコンパイルして、その結果を返します。実際の処理は関数 comp で行います。引数 expr がコンパイルする S 式、env が局所変数の環境、code がコンパイルされたコードです。S 式の末尾からコンパイルしていくことに注意してください。
expr が自己評価フォームの場合、expr をそのままスタックに積みます。命令は (ldc expr) になります。それを code の先頭に追加します。関数 list* は list とよく似ていますが、複数の要素が与えられた場合はドットリストになります。ようするに、Common Lisp の関数 list* と同様の動作になります。
list* は R7RS-small の標準関数ではありませんが、多くの Scheme 処理系でサポートされています。SRFI-1 では cons* という関数が同じ動作をします。以下に list* の定義と実行例を示します。
リスト : ドットリストの生成 (define (list* . xs) (if (null? (cdr xs)) (car xs) (cons (car xs) (apply list* (cdr xs)))))
gosh[r7rs.user]> (list* 1) 1 gosh[r7rs.user]> (list* 1 2) (1 . 2) gosh[r7rs.user]> (list* 1 2 3) (1 2 . 3)
expr がシンボルの場合、関数 location で環境 env に expr があるか探索します。見つかった場合、location はフレームの位置と変数の位置を格納したドットリストを返します。expr は局所変数なので、生成するコードは (list* 'ld pos code) となります。見つからない場合は大域変数なので、コードは (list* 'ldg expr code) となります。
expr がリストで先頭要素が quote の場合は、2 番目の要素を定数として扱います。コードは (list* 'ldc (cadr expr) code) になります。expr の先頭要素が if の場合、最初に then 節と else 節をコンパイルします。このとき、最後の命令は必ず join に設定します。
else 節がない場合は *undef* を返すので、コードは (list* 'ldc '*undef* 'join) になります。あとは、コード (list* 'sel t-clause f-clause code) を生成し、そこに test 節を評価するコードを追加します。これは (cadr expr) を comp でコンパイルするだけです。
expr の先頭要素が lambda の場合はクロージャを生成します。最初にラムダ式の本体を comp でコンパイルして、生成されたコードを body にセットします。このとき、ラムダ式の仮引数を環境 env に追加します。クロージャは関数呼び出しされるので、最後の命令は rtn になることに注意してください。あとは、コード (list* 'ldf body code) を生成するだけです。
expr の先頭要素が define の場合は、2 番目の要素を大域変数として設定します。コード (list* 'def (cadr expr) code) を生成し、そこに 3 番目の要素 (caddr expr) を評価するコードを追加します。これは (caddr expr) を comp でコンパイルするだけです。
最後の else 節は関数呼び出しのコードを生成します。関数 complis は引数を評価するコードを生成します。評価結果はスタックに積まれるので、args でスタックの値をリストに格納するコードが必要になります。そして、先頭要素 (car expr) を評価するコードを comp で生成し、それを app で関数呼び出しします。
引数を評価するコードを生成する関数 complis は簡単です。次のリストを見てください。
リスト : 引数を評価するコードを生成 (define (complis expr env code) (if (null? expr) code (comp (car expr) env (complis (cdr expr) env code))))
コンパイルは後ろから行いますが、生成されるコードは引数を先頭から順番に評価していきます。そして、その結果はスタックに積まれます。
ラムダ式本体のコンパイルも簡単です。プログラムは次のようになります。
リスト : ラムダ式本体のコンパイル (define (comp-body body env code) (if (null? (cdr body)) (comp (car body) env code) (comp (car body) env (list* 'pop (comp-body (cdr body) env code)))))
ラムダ式の本体は複数の S 式を定義することができます。それを順番に評価していき、最後に評価した S 式の結果がラムダ式の返り値になります。各々の S 式は comp でコンパイルするだけですが、スタックに積まれた返り値を取り除くため、その後ろに命令 pop を追加します。最後尾の S 式をコンパイルするとき、その後ろに pop を追加する必要はありません。
局所変数はフレームの位置とフレーム内の要素の位置で表します。簡単な例を示しましょう。次の図を見てください。
(1) ((lambda (a b) ...) 1 2) env: ((a b)) (2) ((lambda (a b c) ((lambda (d e) ...) 4 5)) 1 2 3) env: ((d e) (a b c))
(1) の場合、フレームは一つしかありません。変数 a の位置は (0 . 0) となり、b の位置は (0 . 1) になります。(2) の場合、フレームは 2 つあります。この場合、各変数の位置は次のようになります。
a : (1 . 0) b : (1 . 1) c : (1 . 2) d : (0 . 0) e : (0 . 1)
プログラムは次のようになります。
リスト : 局所変数の位置を求める ;;; 変数の位置を求める (define (position-var sym ls) (let loop ((i 0) (ls ls)) (cond ((null? ls) #f) ((symbol? ls) (if (eq? sym ls) (- (+ i 1)) #f)) ((eq? sym (car ls)) i) (else (loop (+ i 1) (cdr ls)))))) ;;; フレームと変数の位置を求める (define (location sym ls) (let loop ((i 0) (ls ls)) (if (null? ls) #f (let ((j (position-var sym (car ls)))) (if j (cons i j) (loop (+ i 1) (cdr ls)))))))
関数 position-var はフレーム内の変数の位置を求めます。named let で先頭から順番に要素を比較します。見つからない場合は #f を返します。ls がドットリストの場合、最後のシンボルは可変個の引数を表しています。これを負の整数で表すことにします。簡単な例を示しましょう。
(1) (lambda x ...) x : (0 . -1) (2) (lambda (a . x) ...) a : (0 . 0) x : (0 . -2) (3) (lambda (a b c . x) ...) a : (0 . 0) b : (0 . 1) c : (0 . 2) x : (0 . -4)
このように、可変個引数の位置は - (仮引数の総数) になります。
関数 location は position-var を呼び出して i 番目のフレームに変数 sym があるか調べます。見つけた場合は (i . j) を返します。見つからない場合は次のフレームを探します。全てのフレームを探しても見つからない場合は #f を返します。
それでは、実際にコンパイルしてみましょう。自己評価フォームと quote は ldc 命令にコンパイルされます。
gosh[r7rs.user]> (compile 1) (ldc 1 stop) gosh[r7rs.user]> (compile '(quote a)) (ldc a stop)
if は sel と join 命令にコンパイルされます。
gosh[r7rs.user]> (compile '(if #t 'a 'b)) (ldc #t sel (ldc a join) (ldc b join) stop) gosh[r7rs.user]> (compile '(if #f 'a)) (ldc #f sel (ldc a join) (ldc *undef join) stop)
ラムダ式は ldf に、局所変数のアクセスは ld にコンパイルされます。
gosh[r7rs.user]> (compile '(lambda (x) x)) (ldf (ld (0 . 0) rtn) stop) gosh[r7rs.user]> (compile '(lambda () 1 2 3 4 5)) (ldf (ldc 1 pop ldc 2 pop ldc 3 pop ldc 4 pop ldc 5 rtn) stop)
ラムダ式本体も正しくコンパイルされています。
関数呼び出しは args と app 命令にコンパイルされます。
gosh[r7rs.user]> (compile '(car '(a b c))) (ldc (a b c) args 1 ldg car app stop) gosh[r7rs.user]> (compile '((lambda (x) x) 'a)) (ldc a args 1 ldf (ld (0 . 0) rtn) app stop) gosh[r7rs.user]> (compile '((lambda (x y) (cons x y)) 'a 'b)) (ldc a ldc b args 2 ldf (ld (0 . 0) ld (0 . 1) args 2 ldg cons app rtn) app stop)
(car '(a b c)) の car は大域変数として扱われるので、大域変数の値を求める命令 ldg にコンパイルされます。ラムダ式を呼び出す場合は、ldf でクロージャを生成してから、それを呼び出します。関数を呼び出す前に引数が評価されて、その結果がスタックに積まれることに注意してください。それを args 命令でリストに格納します。
define は def 命令にコンパイルされます。
gosh[r7rs.user]> (compile '(define a 'b)) (ldc b def a stop) gosh[r7rs.user]> (compile '(define list (lambda x x))) (ldf (ld (0 . -1) rtn) def list stop)
define と lambda を組み合わせることで関数を定義することができます。
次は仮想マシンを作ります。プログラムは次のようになります。
リスト : 仮想マシン (define (vm s e c d) (case (pop! c) ((ld) (let ((pos (car c))) (vm (cons (get-lvar e (car pos) (cdr pos)) s) e (cdr c) d))) ((ldc) (vm (cons (car c) s) e (cdr c) d)) ((ldg) (vm (cons (get-gvar (car c)) s) e (cdr c) d)) ((ldf) (vm (cons (list 'closure (car c) e) s) e (cdr c) d)) ((app) (let ((clo (car s)) (lvar (cadr s))) (if (eq? (car clo) 'primitive) (vm (cons (apply (cadr clo) lvar) (cddr s)) e c d) (vm '() (cons lvar (caddr clo)) (cadr clo) (cons (list (cddr s) e c) d))))) ((rtn) (let ((save (car d))) (vm (cons (car s) (car save)) (cadr save) (caddr save) (cdr d)))) ((sel) (let ((t-clause (car c)) (e-clause (cadr c))) (if (car s) (vm (cdr s) e t-clause (cons (cddr c) d)) (vm (cdr s) e e-clause (cons (cddr c) d))))) ((join) (vm s e (car d) (cdr d))) ((pop) (vm (cdr s) e c d)) ((args) (let loop ((n (car c)) (a '())) (if (zero? n) (vm (cons a s) e (cdr c) d) (loop (- n 1) (cons (pop! s) a))))) ((def) (let ((sym (car c))) (push! *global-environment* (cons sym (car s))) (vm (cons sym (cdr s)) e (cdr c) d))) ((stop) (car s)) (else (error "unknown opcode"))))
仮想マシン (関数 vm) は SECD 仮想マシンの命令で説明した動作をそのままプログラムしただけです。大域変数は連想リストで表して、変数 *global-environment* に格納します。各々の命令のプログラムは簡単なので説明は割愛いたします。プログラムリストをお読みくださいませ。
局所変数の値を求める関数 get-lvar は次のようになります。
リスト : 局所変数のアクセス ;;; ls の先頭から n 個の要素を取り除く (define (drop ls n) (if (zero? n) ls (drop (cdr ls) (- n 1)))) ;;; 局所変数の値を求める (define (get-lvar e i j) (if (<= 0 j) (list-ref (list-ref e i) j) (drop (list-ref e i) (- (+ j 1)))))
引数 e が環境で、引数 i がフレームの位置、j がフレーム内の変数の位置です。j が 0 以上の場合、通常の引数にアクセスします。(list-ref (list-ref e i) j) で i 番目のフレームの j 番目の要素の値を返します。そうでなければ可変個引数なので、list-ref でフレームを取り出し、drop で先頭から - (j + 1) 個の要素を取り除きます。つまり、通常の引数の個数だけ要素を取り除くわけです。あとはそれをそのまま返すだけです。
大域変数の値を求める関数 get-gvar も簡単です。次のリストを見てください。
リスト : 大域変数のアクセス (define (get-gvar sym) (let ((val (assoc sym *global-environment*))) (if val (cdr val) (error "unbound variable " sym))))
assoc で *global-environment* から sym を探索します。見つけた場合は cdr で値を取り出して返します。見つからない場合は error でエラーを送出します。
最後に read - eval - print - loop (REPL) を作りましょう。次のリストを見てください。
リスト : read-eval-print-loop ;;; 大域変数 (define *global-environment* (list (list 'car 'primitive car) (list 'cdr 'primitive cdr) (list 'cons 'primitive cons) (list 'eq? 'primitive eq?) (list 'pair? 'primitive pair?) )) ;;; read-eval-print-loop (define (repl) (let loop () (display "\n>>> ") (guard (err (else (display "ERROR: ") (display (error-object-message err)) (unless (null? (error-object-irritants err)) (display (car (error-object-irritants err)))) (newline))) (let* ((expr (compile (read))) (v (vm '() '() expr '()))) (when (eof-object? v) (exit)) (display v) (newline))) (loop))) ;;; ファイルの読み込み (for-each (lambda (name) (with-input-from-file name (lambda () (let loop () (let ((output (vm '() '() (compile (read)) '()))) (display output) (newline) (if (not (eof-object? output)) (loop) #f)))))) (cdr (command-line))) ;;; 実行 (repl)
REPL は拙作のページ「Scheme で作る micro Scheme」で作成したインタプリタに例外処理 (guard) を追加しています。そして、read で S 式を読み込んだあと、compile で S 式をコンパイルしてから vm で実行します。
それでは実行してみましょう。
>>> (quote a) a >>> (if #t 'a 'b) a >>> (if #f 'a 'b) b >>> (car '(a b c)) a >>> (cdr '(a b c)) (b c) |
>>> (cons 'a 'b) (a . b) >>> (eq? 'a 'a) #t >>> (eq? 'a 'b) #f >>> (pair? '(a b c)) #t >>> (pair? 'a) #f |
quote, if, car, cdr, cons, eq?, pair? は正常に動作していますね。次は lambda と define を試してみます。
>>> (define a 'b) a >>> a b >>> (lambda (x) x) (closure (ld (0 . 0) rtn) ()) >>> ((lambda (x) x) 'a) a >>> (define list (lambda x x)) list >>> (list 'a 'b 'c 'd 'e) (a b c d e)
define で変数 a を定義して、その値を求めることができます。lambda はクロージャを生成し、ラムダ式で関数呼び出しも可能です。そして、define と lambda を使って関数を定義することができます。
次は、レキシカルスコープとクロージャが正常に動作するか試してみましょう。
>>> (define x 'a) x >>> x a >>> (define foo (lambda () x)) foo >>> (foo) a >>> (define bar (lambda (x) (foo))) bar >>> (bar 'b) a
まず大域変数 x を a に初期化します。次に、関数 foo を定義します。foo の引数はないので、x は大域変数を参照します。したがって、foo を評価すると返り値は a になります。次に、関数 bar から foo を呼び出します。bar は引数 x を受け取ります。(bar 'b) を評価すると a が返ってきます。確かにレキシカルスコープになっています。
foo と bar の値を表示すると次のようになります。
>>> foo (closure (ldg x rtn) ()) >>> bar (closure (args 0 ldg foo app rtn) ())
foo の変数 x は大域変数の値を求める ldg にコンパイルされています。レキシカルスコープでコンパイルされていることが分かります。
今度はクロージャの動作を確かめます。
>>> (define baz (lambda (x) (lambda (y) (cons x y)))) baz >>> (define baz-a (baz 'a)) baz-a >>> (baz-a 'b) (a . b) >>> (baz-a 'c) (a . c)
関数 baz はクロージャを生成して返します。このとき、baz の引数 x の値が保存されます。(baz 'a) の返り値を baz-a にセットすると、baz-a は a と baz-a の引数を組にしたものを返す関数となります。したがって、(baz-a 'b) は (a . b) を、(baz-a 'c) は (a . c) を返します。クロージャも正常に動作していますね。
baz と baz-a の値を表示すると、次のようになります。
>>> baz (closure (ldf (ld (1 . 0) ld (0 . 0) args 2 ldg cons app rtn) rtn) ()) >>> baz-a (closure (ld (1 . 0) ld (0 . 0) args 2 ldg cons app rtn) ((a)))
baz の環境は空リストですが、baz-a の環境は ((a)) となります。(baz-a 'b) を評価するとき、クロージャの環境に (b) が追加され、その下で (cons x y) が評価されます。したがって、x の値は a で y の値が b になるのです。
define で定義する関数は再帰呼び出しが可能です。簡単なリスト操作関数を再帰定義で作ってみました。プログラムリストと実行結果を示します。なお、プログラムと評価結果は拙作のページ「Scheme で作る micro Scheme」と同じです。
リスト : append と reverse ;;; 空リストか (define null? (lambda (x) (eq? x '()))) ;;; 否定 (define not (lambda (x) (if (eq? x #f) #t #f))) ;;; リストの結合 (define append (lambda (xs ys) (if (null? xs) ys (cons (car xs) (append (cdr xs) ys))))) ;;; リストの反転 (define reverse (lambda (ls) (if (null? ls) '() (append (reverse (cdr ls)) (list (car ls))))))
>>> (append '(a b c) '(d e f)) (a b c d e f) >>> (append '((a b) (c d)) '(e f g)) ((a b) (c d) e f g) >>> (reverse '(a b c d e)) (e d c b a) >>> (reverse '((a b) c (d e))) ((d e) c (a b))
リスト : 探索 ;;; リストの探索 (define memq (lambda (x ls) (if (null? ls) #f (if (eq? x (car ls)) ls (memq x (cdr ls)))))) ;;; 連想リストの探索 (define assq (lambda (x ls) (if (null? ls) #f (if (eq? x (car (car ls))) (car ls) (assq x (cdr ls))))))
>>> (memq 'a '(a b c d e)) (a b c d e) >>> (memq 'c '(a b c d e)) (c d e) >>> (memq 'f '(a b c d e)) #f >>> (assq 'a '((a 1) (b 2) (c 3) (d 4) (e 5))) (a 1) >>> (assq 'e '((a 1) (b 2) (c 3) (d 4) (e 5))) (e 5) >>> (assq 'f '((a 1) (b 2) (c 3) (d 4) (e 5))) #f
リスト : 高階関数 ;;; マッピング (define map (lambda (fn ls) (if (null? ls) '() (cons (fn (car ls)) (map fn (cdr ls)))))) ;;; フィルター (define filter (lambda (fn ls) (if (null? ls) '() (if (fn (car ls)) (cons (car ls) (filter fn (cdr ls))) (filter fn (cdr ls)))))) ;;; 畳み込み (define fold-right (lambda (fn a ls) (if (null? ls) a (fn (car ls) (fold-right fn a (cdr ls)))))) (define fold-left (lambda (fn a ls) (if (null? ls) a (fold-left fn (fn a (car ls)) (cdr ls)))))
>>> (map car '((a 1) (b 2) (c 3) (d 4) (e 5))) (a b c d e) >>> (map cdr '((a 1) (b 2) (c 3) (d 4) (e 5))) ((1) (2) (3) (4) (5)) >>> (map (lambda (x) (cons x x)) '(a b c d e)) ((a . a) (b . b) (c . c) (d . d) (e . e)) >>> (filter (lambda (x) (not (eq? x 'a))) '(a b c a b c a b c)) (b c b c b c) >>> (fold-left cons '() '(a b c d e)) (((((() . a) . b) . c) . d) . e) >>> (fold-right cons '() '(a b c d e)) (a b c d e)
今回はここまでです。次回は micro Scheme に伝統的なマクロを追加してみましょう。
;;; ;;; secd.scm : SECD 仮想マシンによる Scheme コンパイラ (R7RS-samll 対応版) ;;; ;;; Copyright (C) 2009-2021 Makoto Hiroi ;;; (import (scheme base) (scheme cxr) (scheme write) (scheme read) (scheme file) (scheme process-context)) ;;; データの追加 (define-syntax push! (syntax-rules () ((_ place x) (set! place (cons x place))))) ;;; データの取得 (define-syntax pop! (syntax-rules () ((_ place) (let ((x (car place))) (set! place (cdr place)) x)))) ;;; ドットリストの生成 (define (list* . xs) (if (null? (cdr xs)) (car xs) (cons (car xs) (apply list* (cdr xs))))) ;;; 変数の位置を求める (define (position-var sym ls) (let loop ((i 0) (ls ls)) (cond ((null? ls) #f) ((symbol? ls) (if (eq? sym ls) (- (+ i 1)) #f)) ((eq? sym (car ls)) i) (else (loop (+ i 1) (cdr ls)))))) ;;; フレームと変数の位置を求める (define (location sym ls) (let loop ((i 0) (ls ls)) (if (null? ls) #f (let ((j (position-var sym (car ls)))) (if j (cons i j) (loop (+ i 1) (cdr ls))))))) ;;; 自己評価フォームか (define (self-evaluation? expr) (and (not (pair? expr)) (not (symbol? expr)))) ;;; S 式をコンパイルする (define (compile expr) (comp expr '() '(stop))) ;;; コンパイラ本体 (define (comp expr env code) (cond ((self-evaluation? expr) ; 自己評価フォーム (list* 'ldc expr code)) ((symbol? expr) ; 変数 (let ((pos (location expr env))) (if pos ;; 局所変数 (list* 'ld pos code) ;; 大域変数 (list* 'ldg expr code)))) ((eq? (car expr) 'quote) (list* 'ldc (cadr expr) code)) ((eq? (car expr) 'if) (let ((t-clause (comp (caddr expr) env '(join))) (f-clause (if (null? (cdddr expr)) (list 'ldc '*undef 'join) (comp (cadddr expr) env '(join))))) (comp (cadr expr) env (list* 'sel t-clause f-clause code)))) ((eq? (car expr) 'lambda) (let ((body (comp-body (cddr expr) (cons (cadr expr) env) '(rtn)))) (list* 'ldf body code))) ((eq? (car expr) 'define) (comp (caddr expr) env (list* 'def (cadr expr) code))) (else ; 関数呼び出し (complis (cdr expr) env (list* 'args (length (cdr expr)) (comp (car expr) env (cons 'app code))))))) ;;; body のコンパイル (define (comp-body body env code) (if (null? (cdr body)) (comp (car body) env code) (comp (car body) env (list* 'pop (comp-body (cdr body) env code))))) ;;; 引数を評価するコードを生成 (define (complis expr env code) (if (null? expr) code (comp (car expr) env (complis (cdr expr) env code)))) ;;; ;;; 仮想マシン ;;; ;;; ls の先頭から n 個の要素を取り除く (define (drop ls n) (if (zero? n) ls (drop (cdr ls) (- n 1)))) ;;; 局所変数の値を求める (define (get-lvar e i j) (if (<= 0 j) (list-ref (list-ref e i) j) (drop (list-ref e i) (- (+ j 1))))) ;;; 大域変数の値を求める (define (get-gvar sym) (let ((val (assoc sym *global-environment*))) (if val (cdr val) (error "unbound variable " sym)))) ;;; 仮想マシンでコードを実行する (define (vm s e c d) (case (pop! c) ((ld) (let ((pos (car c))) (vm (cons (get-lvar e (car pos) (cdr pos)) s) e (cdr c) d))) ((ldc) (vm (cons (car c) s) e (cdr c) d)) ((ldg) (vm (cons (get-gvar (car c)) s) e (cdr c) d)) ((ldf) (vm (cons (list 'closure (car c) e) s) e (cdr c) d)) ((app) (let ((clo (car s)) (lvar (cadr s))) (if (eq? (car clo) 'primitive) (vm (cons (apply (cadr clo) lvar) (cddr s)) e c d) (vm '() (cons lvar (caddr clo)) (cadr clo) (cons (list (cddr s) e c) d))))) ((rtn) (let ((save (car d))) (vm (cons (car s) (car save)) (cadr save) (caddr save) (cdr d)))) ((sel) (let ((t-clause (car c)) (e-clause (cadr c))) (if (car s) (vm (cdr s) e t-clause (cons (cddr c) d)) (vm (cdr s) e e-clause (cons (cddr c) d))))) ((join) (vm s e (car d) (cdr d))) ((pop) (vm (cdr s) e c d)) ((args) (let loop ((n (car c)) (a '())) (if (zero? n) (vm (cons a s) e (cdr c) d) (loop (- n 1) (cons (pop! s) a))))) ((def) (let ((sym (car c))) (push! *global-environment* (cons sym (car s))) (vm (cons sym (cdr s)) e (cdr c) d))) ((stop) (car s)) (else (error "unknown opcode")))) ;;; 大域変数 (define *global-environment* (list (list 'car 'primitive car) (list 'cdr 'primitive cdr) (list 'cons 'primitive cons) (list 'eq? 'primitive eq?) (list 'pair? 'primitive pair?) )) ;;; read-eval-print-loop (define (repl) (let loop () (display "\n>>> ") (guard (err (else (display "ERROR: ") (display (error-object-message err)) (unless (null? (error-object-irritants err)) (display (car (error-object-irritants err)))) (newline))) (let* ((expr (compile (read))) (v (vm '() '() expr '()))) (when (eof-object? v) (exit)) (display v) (newline))) (loop))) ;;; ファイルの読み込み (for-each (lambda (name) (with-input-from-file name (lambda () (let loop () (let ((output (vm '() '() (compile (read)) '()))) (display output) (newline) (if (not (eof-object? output)) (loop) #f)))))) (cdr (command-line))) ;;; 実行 (repl)