知的学習支援システムの基礎

この章で扱う問い

本章で考えたいのは、「学習者の認知構造を踏まえて支援するシステムを実際に作るとき、どのような骨格を組めばよいのか」という問いです。前章で学習活動の設計原理を扱いましたが、それを動的に動かす器が無ければ「学習者ごとに動的に調整する」という実装には至りません。本章はその器——知的学習支援システム(Intelligent Tutoring System, ITS)の標準アーキテクチャと、半世紀にわたる代表的システムの系譜を扱います。ITS や AIED の研究室を志す読者にとっては基礎の見取り図に、近接領域(学習科学・HCI・認知科学)の読者にとっては「自分の関心がどこに接続するか」を確かめる地図になるよう書きました。各システムが「何を新しくしたのか」「何が限界だったのか」を意識して読んでみてください。

ITS の基本アーキテクチャ

第 1 章で述べた通り、ITS は 1970 年代に誕生しました。当時の Computer-Assisted Instruction(CAI) は分岐型ドリルが中心で、学習者が誤れば固定的なフィードバックを返すだけの仕組みでした。これに対し ITS は、教える内容そのものを計算機が「理解」し、学習者の状態を推論したうえで教授戦略を選択する——という野心的な目標を掲げました。その骨格は半世紀を経た現在でも有効であり、現代のディジタルチューターやアダプティブラーニング基盤も、本質的にはこの枠組みの拡張として理解できます。

4 つの構成要素

ITS の標準的アーキテクチャは、4 つのモジュールから構成されます(図 8-1)。

flowchart LR
    domain[ドメインモデル<br/>専門家の知識]
    student[学習者モデル<br/>知識状態]
    pedagogy[教授モデル<br/>教授戦略]
    interface[インタフェース<br/>UI/UX]
    learner((学習者))

    interface -- 提示 --> learner
    learner -- 入力 --> interface
    interface -- 応答 --> student
    student -- 状態 --> pedagogy
    domain -- 知識 --> pedagogy
    pedagogy -- 指示 --> interface
    domain -.参照.-> student

図 8-1: ITS の 4 構成要素アーキテクチャ。学習者を中心に、4 つのモジュールが協調して適応的学習支援を実現する。

ドメインモデル(Domain Model)は、教えるべき内容——概念、原理、スキル——の知識表現です。すなわち「専門家の知識」のモデルであり、第 4 章で扱ったオントロジーや知識表現がここで活用されます。具体的には、概念の階層構造、それらの間の関係、問題を解くための手続き的知識(プロダクションルールやアルゴリズム)、典型的な誤りとその診断方法、問題生成のためのテンプレートや制約などが含まれます。後述する各システムは、この「専門家の知識をどう表現するか」という問いに対し、意味ネットワーク・定性モデル・プロダクションルール・制約・シミュレータといった多様な解答を与えてきました。

学習者モデル(Student / Learner Model)は、個々の学習者の現在の知識状態・理解度・スキルレベルを表現します。これは適応的支援の基盤であり、主に三つのタイプがあります(図 8-2)。オーバレイモデル(Overlay Model)[Carr1977] は、学習者の知識をドメインモデルの部分集合として表現し、各概念・スキルに習得度(0〜1 のスコアなど)を付与するシンプルな方式です。表現は容易ですが、学習者が誤った知識を持っている場合を扱えません。バグモデル(Bug Model)[Burton1982] は、学習者の体系的な誤り(後述する BUGGY のサブトラクションバグなど)を明示的にモデル化し、診断と修正的フィードバックを可能にします。制約ベースモデル(Constraint-Based Model)は、正しい知識を列挙する代わりに、違反してはならない制約を定義します(詳細は後述)。

flowchart TB
    subgraph overlay["(a) オーバレイモデル"]
        o1[概念A: 習得 ✓]
        o2[概念B: 習得 ✓]
        o3[概念C: 未習得 ✗]
        o4[概念D: 習得 ✓]
    end
    subgraph bug["(b) バグモデル"]
        b1[正: 加法]
        b2[誤: 借り算バグ]
        b3[正: 乗法]
        b4[誤: 桁ずれバグ]
    end
    subgraph cbm["(c) 制約ベースモデル"]
        c1[制約1: 満足 ✓]
        c2[制約2: 満足 ✓]
        c3[制約3: 違反 ✗]
        c4[制約4: 満足 ✓]
    end

図 8-2: 学習者モデルの三つのタイプ。(a) オーバレイは習得/未習得、(b) バグモデルは誤りそのもの、(c) 制約ベースは制約違反を表現する。

教授モデル(Pedagogical / Tutoring Model)は、「いつ、何を、どのように教えるか」という教授戦略を担います。学習者の現在の状態に応じた次課題の選択、自力で進めているときには見守り、つまずいたときに介入する判断、学習者のエラーに対するフィードバック生成、助けを求められたときの段階的ヒント提供などを含みます。教授モデルの設計は、教育学・学習科学の知見(第 3 章)に基づきます。

インタフェース(Interface)は、学習者とシステムの相互作用を実現します。単なる入出力ではなく、学習者の認知負荷を下げ動機づけを高める UI/UX 設計が重要です(第 11 章参照)。

これら 4 つのモジュールは、学習者の応答を受けて学習者モデルを更新し、ドメインモデルと併せて教授モデルが次の行動を決定し、それをインタフェース経由で提示する——というサイクルを形成します(図 8-3)。

flowchart TD
    s1[1: 学習者が問題を解く]
    s2[2: 応答を学習者モデルに入力]
    s3[3: 学習者モデルを更新]
    s4[4: 教授モデルが次の行動を決定]
    s5[5: フィードバック・次課題を提示]

    s1 -->|学習者の応答| s2
    s2 --> s3
    s3 -->|知識状態の推定| s4
    s4 --> s5
    s5 -.サイクル繰り返し.-> s1

図 8-3: ITS モジュール間の相互作用サイクル。学習者の応答に基づいてモデルを更新し、適応的支援を提供する。

古典的 ITS システムの系譜

ITS の歴史は、ad-hoc な分岐型 CAI から始まり、1970 年代の知識ベース型対話システム、1980〜90 年代の認知アーキテクチャに基づくモデルトレーシング系、2000 年代以降のシミュレーション・対話・感情を扱う多様な系へと展開してきました。以下、代表的システムを年代順に取り上げ、それぞれが ITS のどの構成要素を新しくしたのかを追っていきます。

SCHOLAR:混合主導対話の誕生(1970)

BBN(Bolt Beranek and Newman)/MIT の Jaime R. Carbonell による SCHOLAR [Carbonell1970scholar] は、しばしば「最初の ITS」と呼ばれます。題材は南米の地理で、ドメイン知識は意味ネットワーク("Argentina is-a country", "capital-of Argentina = Buenos Aires" 等)として表現されました。革新は 混合主導対話(mixed-initiative dialogue)——システムだけでなく学習者からも質問・話題転換ができる——を実現した点にあります。

たとえば次のような対話が想定されていました(原論文の例を再構成)。

SCHOLAR: What is the language of Argentina?
STUDENT: Probably Spanish.
SCHOLAR: Very good. Approximately what is the area of Argentina?
STUDENT: Tell me something about Peru.
SCHOLAR: Peru is a country. It is in South America.
         The capital of Peru is Lima. ...

学習者が「アルゼンチンの首都は?」に「サンパウロ」と誤答すれば、SCHOLAR は意味ネットワークを辿って「いいえ、サンパウロはブラジルの都市です」と返せました。一方で、知識は事実の集合に留まり、深い因果や手続きを扱えないという限界があり——この限界が、次の WHY を生みます。

WHY:ソクラテス的対話とメンタルモデル診断(1977)

Albert Stevens と Allan Collins による WHY [Stevens1977] は、「なぜある地域では雨が多いのか」といった気象学の因果を題材に、ソクラテス的対話(Socratic dialogue)を実装しました。ポイントは、誤答を直接訂正せず、学習者自身の信念から導かれる帰結の矛盾を突くことで、誤った因果モデル(メンタルモデル)の修正を促す点です。Stevens & Collins はチューターが用いる対話戦略を「反例の提示」「事例の一般化を問う」「必要条件と十分条件を区別させる」など、いくつかの Socratic tutoring rules に整理しました。

たとえば学習者が「オレゴンでは米作はできない」と言えば、WHY は「オレゴンとよく似た気候のカリフォルニアで米作ができるのはなぜか?」と反問し、学習者が暗黙に置いている前提(気温だけが米作の条件)を露わにします。WHY は ITS が「対話戦略」を独立した研究対象として扱うべきことを示した一方、自由文の理解に強く依存するため、対話の頑健性を保つのが極めて困難でした。

BUGGY と DEBUGGY:誤りは体系的である(1978)

John Seely Brown と Richard Burton の BUGGYDEBUGGY [Brown1978] は、米国の小学生の引き算における誤りを分析し、子どもの誤りは無作為ではなく 体系的なバグ(systematic bug)——誤った手続きの一貫した適用——であることを示しました。代表的なバグには次のようなものがあります。

  • Smaller-from-Larger バグ:各桁で常に「小さい方の数から大きい方の数を引く」。
  • Borrow-from-Zero バグ:上位桁が 0 のとき、繰り下げ処理を誤ってその 0 を 9 にせず、さらに上位への波及も行わない。
  • Stops-Borrow-at-Zero バグ:0 から繰り下げる必要があるとき、繰り下げ自体をやめてしまう。

BUGGY はこのようなバグを約 100 種類カタログ化し、複数の解答パターンから学習者がどのバグの組み合わせを持つかを診断する手続きを与えました。たとえば次の二問は、同じ Smaller-from-Larger バグが背後にあると診断できます。

  53      82
- 28    - 47
----    ----
  35      45    (正しくは 25 と 35)

BUGGY の貢献は二重です。第一に、学習者モデルとして バグモデル を確立しました。第二に、誤答を「不注意」ではなく「異なるが整合的な手続きの実行」として捉える視点を、認知科学全体に広めました。一方、ライブラリ化されたバグの外側に出る誤り(特に概念誤理解)には弱く、後続の研究は「バグはなぜ生じるのか」という生成論(Repair Theory など)に向かっていきます。

SOPHIE:シミュレーションベース学習の先駆け(1975〜1982)

Brown、Burton、de Kleer による SOPHIE(SOPHisticated Instructional Environment) [Brown1975] は、電子回路(IP-28 電源回路)のトラブルシューティングを教えました。ドメインモデルとして 回路シミュレータ定性的因果モデル の両方を備え、学習者は「R8 を短絡したら Q3 のコレクタ電圧はいくらになるか」「故障は CR6 の短絡だと思うが、確かめたい」といった自然言語に近い問い合わせをシミュレータに投げ、結果を観察できました。これは単なる演習ではなく、仮説生成→測定→反証→修正 という探究的な思考プロセス自体を支援するものであり、後の探究学習・モデルベース学習・PBL 系チューターの原型となりました。SOPHIE-III ではエキスパートが学習者の測定戦略を批評する機能まで備えていました。一方で、領域固有の精緻なシミュレータと知識ベースを必要とするため、他領域への移植コストが極めて高かったのです。

GUIDON / NEOMYCIN:エキスパートシステムを「教えるシステム」に変える困難(1979〜1987)

William Clancey の GUIDON [Clancey1987] は、感染症診断のエキスパートシステム MYCIN のルール群をそのまま教材として、医学生に診断推論を教える試みでした。しかし結果は失敗でした。MYCIN のルールは「診断結論を計算する」ためには最適化されていても、「人間が理解しやすい形で因果と戦略を説明する」ためには整理されていなかったのです。たとえば「グラム陰性菌の同定」というルールには、生物学的因果・経験則・ヒューリスティックな探索戦略・データ取得コストの考慮が、ひとつのルールに圧縮されていました。

この反省から Clancey は NEOMYCIN を再設計し、診断ストラテジー(タスク階層)と領域知識(疾患・症候の関係)を分離しました。さらに教育的説明には、患者データ→仮説→鑑別診断→確証検査という 明示的な診断戦略 を表面化する必要があると論じました。GUIDON / NEOMYCIN の経験は、「専門家の問題解決能力」と「専門家が初学者に教える能力」は別物であり、ITS のドメインモデルは後者のために再構成されなければならない——という、現在まで生きる教訓を残してくれました。

LISP Tutor から Cognitive Tutor へ:認知アーキテクチャに支えられたモデルトレーシング(1980 年代〜)

John Anderson らによる一連のチューター——LISP Tutor(1984)、Geometry Tutor(1985)、そして数学版 Algebra / Cognitive Tutor(1990 年代以降)——は、ITS の歴史における第二の転換点です。これらは Anderson の ACT-R 認知理論 [Anderson1995] に立脚し、ドメインモデルを プロダクションルール の集合として、学習者モデルを「各ルールの習得確率」として表現しました(第 2・9 章参照)。

教授戦略の中核は モデルトレーシング(model tracing)です。学習者が問題を解く各ステップを、ドメインモデルのプロダクションルール集合と逐一照合します。一致するルールがあればそのステップを正しいと認め、どのルールとも一致しなければ即座に介入します。複数のルールに一致する場合は、いずれの解法も許容します。

  • 即座のフィードバック:誤りが定着する前に修正できます。
  • ヒントの段階化:当該ステップに対応するルールから、抽象的→具体的なヒントを生成できます。
  • 知識トレーシング [Corbett1995]:ルール単位の習得確率をベイズ更新することで、習得スキルと未習得スキルを区別できます(第 9 章で詳述)。

Cognitive Tutor は実際に米国の中高で広く採用され、評価研究では従来授業に対して効果量がしばしば 0.3〜1.0σ の範囲で報告されています(領域や評価方法により差は大きいです)。研究室の中の概念実証ではなく、実教室で運用された ITS として、現在に至る Carnegie Learning 社のプラットフォームへと連なるものです。一方、各ステップを記述するプロダクションルールの作成コスト(いわゆる authoring bottleneck)は依然として高く、後の 制約ベースモデリング例題ベース学習 はこれへの応答という側面を持っています。

Andes:物理問題のためのオープンエンドな解法支援(2000 年代)

ピッツバーグ大学・米海軍兵学校で開発された Andes [VanLehn2005] は、大学初年次の力学を題材とした ITS で、紙と鉛筆に近い操作感を保ちつつ、フォース図の作成・式の立式・代数操作を一体的に支援します。Andes はモデルトレーシングを「ステップごとの厳密な系列照合」から緩めて、学習者が任意の順序で図形要素や方程式を入力できる flexible step-based tutoring を実現しました。SLOPES と呼ばれる枠組みでは、学習者の入力が物理的・数学的に妥当か(自由体図に必要な力が揃っているか、立てた式が次元的に正しいか等)を制約として評価し、求めに応じて段階的ヒントを返します。米海軍兵学校での比較実験で、Andes 利用群は従来宿題群より到達度が有意に高いことが報告されました。Andes は、Cognitive Tutor 系の厳密モデルトレーシングと、後述の制約ベースモデリングの中間に位置する設計として位置づけられます。

Error-based Simulation と Monsakun:学習者の「誤った信念」を可視化する(日本発)

日本における代表的な ITS 研究として、広島大学・平嶋らによる二系統が知られています。第一は Error-based Simulation(ES) [Hirashima2009] で、初等力学などの誤概念修正を狙うものです。学習者にまず「自分の予測」を入力させ、シミュレータがその学習者自身の誤った信念どおりに振る舞った場合の世界を可視化します。たとえば「動いている物体には常に進行方向の力が必要」という誤概念を持つ学習者には、その信念に従った場合に起きる非現実的な挙動(手を離した瞬間に物体が止まる等)を見せ、現実との不整合を体感させるわけです。正解を提示する のではなく、学習者の信念の帰結を提示する 点が、伝統的な訂正型フィードバックと根本的に異なります。

第二は モンサクン(Monsakun) [Hirashima2014] で、算数の文章題を 解く のではなく 作らせる(problem posing)プラットフォームです。学習者は与えられた条件(数値、関係、求めるもの)を満たすように、文カードを並べて文章題を構成します。問題作成には文章題の構造(増加・減少・差・比較などの関係スキーマ)を理解していることが必要なため、解くだけでは表面化しない構造的理解の弱さが露わになります。学校現場での長期導入研究も多数行われ、解決能力と作問能力の双方向的な向上が報告されています。両システムは、ITS が「正解への誘導」だけでなく「学習者の思考を外化させる足場」としても機能しうることを示した重要な仕事です。具体例は16章でもう少し詳しく扱います。

AutoTutor:自然言語対話と感情への接近(2000 年代〜)

Arthur Graesser らの AutoTutor [Graesser2004] は、コンピュータリテラシや物理を題材に、人間チューターの対話戦略を計算機上で再現することを目指しました。学習者の自由記述応答に対し、Latent Semantic Analysis(LSA) 等で「期待された解答」「典型的な誤解」との意味的近さを計算し、それに応じて prompthintassertioncorrection といった 対話ムーブ を選択します。アニメーション・エージェントが自然言語で対話を主導する点で、SCHOLAR/WHY の系譜を現代的に拡張したと言えます。後継版(AutoTutor with Affect、Affective AutoTutor)では、表情・姿勢・対話履歴から退屈・混乱・フラストレーションといった 学習感情 を推定し、対話戦略を切り替える研究も行われました。これは第 13 章で扱う情意・動機づけ支援の先駆けでもあります。

モデルトレーシングを概念として整理する

これまでに登場したシステムのうち、Cognitive Tutor 系と Andes は、いずれも「学習者の各ステップをドメイン側の手続き的記述と照合する」というモデルトレーシングの枠組みに属します(図 8-4)。モデルトレーシングは詳細な診断と段階的ガイダンスを可能にする一方、ドメインのすべての解法をプロダクションルールとして記述するコストが課題となります。そのため、適用領域は手順が比較的明確な領域——代数、初等プログラミング、力学の標準問題——が中心となってきました。

flowchart TD
    step["学習者のステップ<br/>例: x = (−b + √(b²−4ac)) / 2a"]
    rules[プロダクションルール集合<br/>すべての正しい解法を記述]
    match[ステップとルールの照合]
    correct[ルールと一致 → 正解]
    error[不一致 → エラー]
    feedback[即座のフィードバック<br/>詳細な診断・段階的ガイダンス]

    step --> rules
    rules --> match
    match --> correct
    match --> error
    correct --> feedback
    error --> feedback

図 8-4: モデルトレーシングのアプローチ。高コストだが詳細な診断と固定的な手順に強い。

制約ベースモデリング

Stellan Ohlsson による 制約ベースモデリング(Constraint-Based Modeling, CBM) [Ohlsson1994] は、モデルトレーシングとは対照的なアプローチを取ります。CBM では「正しい解法をすべて列挙する」のではなく、「違反してはならない制約」を定義します。たとえばデータベース設計のチューター SQL-Tutor では、「主キーは NULL 値を持ってはならない」「外部キーは参照先テーブルに存在する値でなければならない」「第 3 正規形に違反してはならない」といった制約を数百個記述しておき、学習者の解答が制約に違反すれば、違反した制約をフィードバックします(図 8-5)。

flowchart TD
    solution[学習者の解答全体<br/>例: データベース設計]
    constraints[制約集合<br/>違反してはならない条件を列挙]
    check[制約違反のチェック]
    ok[制約を満たす → 正解]
    violation[制約違反 → エラー]
    feedback[フィードバック<br/>違反した制約を指摘]

    solution --> constraints
    constraints --> check
    check --> ok
    check --> violation
    ok --> feedback
    violation --> feedback

図 8-5: 制約ベースモデリングのアプローチ。記述コストが低く、多様な解法を許容できる一方、診断の粒度は粗い。

両アプローチは補完的です。モデルトレーシングは詳細な診断と段階的ガイダンスに優れますが、解法をすべて手続きとして記述するコストが高く、適用は手順が定まった領域に向きます。CBM は記述コストが低く、解法の多様性に対応できますが、診断の粒度が粗くなりがちで、段階的ヒントが難しいという特徴があります。作文・データベース設計・UI 設計・設計図の評価のように「正解が一意でない」領域では CBM が、代数・幾何・初等プログラミングのように手順が明確な領域ではモデルトレーシングが、それぞれ自然に選ばれてきました。

ITS の現代的発展

オープンラーナーモデル(Open Learner Model) [Bull2007] は、従来システム内部に閉じていた学習者モデルを学習者本人に可視化する試みです。学習者は自らの理解状態を客観視でき、メタ認知(第 12 章)が促されます。

協調学習への拡張も進んでいます。複数の学習者がオンラインで協働して問題を解く際、システムは発話・操作のログから相互作用の質を分析し、議論の停滞や役割の偏りを検知してファシリテーションを行います(第 14 章 CSCL)。

2010 年代の MOOCs の普及は、数万〜数十万人規模の学習ログを利用可能にしました。これにより、知識トレーシング・項目反応理論・ニューラルベースの Deep Knowledge Tracing など、データ駆動型の学習者モデリングが実用域に入りました。古典的 ITS が「専門家の知識を手で書く」ことから出発したのに対し、現代のシステムは「大量の学習者の挙動から知識構造を学ぶ」方向と、それを古典的アーキテクチャと統合する方向を、同時に追求しています。

まとめ

本章では、ITS の標準アーキテクチャ(ドメイン・学習者・教授・インタフェース)を骨格として、半世紀にわたる代表的システムの系譜を辿りました。SCHOLAR は意味ネットワーク上の混合主導対話を、WHY はソクラテス的対話戦略を、BUGGY は誤りの体系性とバグモデルを、SOPHIE はシミュレーションベース学習を、GUIDON/NEOMYCIN は「専門家の知識」と「教えるための知識」の差異を、Anderson 系のモデルトレーシング型チューターは認知アーキテクチャに支えられた厳密な追跡と即座のフィードバックを、Andes はその柔軟化を、Error-based Simulation と Monsakun は誤った信念や問題構造を外化する日本発の方向を、AutoTutor は自然言語対話と感情への拡張を、それぞれもたらしました。

これらは決して時代遅れの「歴史」ではなく、現在のディジタルチューターやアダプティブラーニング基盤の中に、意匠を変えて受け継がれています。本書の観点からは、これらのシステムはいずれも 形式化された認知構造(第 6 章)——専門家の知識・学習者の知識状態・教授戦略——を計算機上に書き下す試みとして読み直すことができます。

ここに挙げたシステム群を文献として追ってみたい方には、姉妹編「古池謙人流『研究の進め方』」の文献調査章が役に立ちます——全体像→焦点→ギャップという三段階で読むと、ITS の半世紀の系譜が「自分の問いに直接効く部分」と「歴史的な前提として押さえておく部分」に綺麗に切り分けられるはずです。

次章への橋渡し

本章で繰り返し登場した 学習者モデリング を、次章では中心テーマとして取り上げ、ベイジアン知識トレーシング、項目反応理論、Deep Knowledge Tracing といった具体的手法を整理していきます。

さらに学ぶために

  • Woolf, B. P. (2009). Building Intelligent Interactive Tutors. Morgan Kaufmann.
  • Anderson, J. R., et al. (1995). Cognitive tutors: Lessons learned. Journal of the Learning Sciences, 4(2), 167–207.
  • Ohlsson, S. (1994). Constraint-based student modelling. In Student Modelling (pp. 167–189). Springer.
  • VanLehn, K. (2006). The behavior of tutoring systems. International Journal of Artificial Intelligence in Education, 16(3), 227–265.
  • Sottilare, R. A., et al. (Eds.) (2013–2018). Design Recommendations for Intelligent Tutoring Systems, Vols. 1–6. U.S. Army Research Laboratory.