適応的学習支援の設計

この章で扱う問い

学習者モデルが推定した内的状態は、それ自体では学習を促進してくれません。本章で一緒に考えたいのは、「その推定に基づいて、何をどのタイミングで提示するかを、どう動的に決めるのか」という問いです。教材を出す順序、ヒントの量、難易度、進度の管理——これらすべてを学習者の状態に合わせて変える設計問題が、適応的学習支援です。AIED や ITS、アダプティブラーニング基盤に関心のあるあなたにとっては中核となる章ですし、HCI や教育心理の側から関わるあなたにとっても「適応の限界」を理解する手がかりになるはずです。本章では、適応の粒度（マクロ・ミクロ・即時）と次元（内容・順序・難易度・支援量）の二軸で設計を整理し、過剰適応・自律性・透明性という適応そのものの限界も併せて見ていきます。

適応とは何か：定義と動機づけ

適応的学習支援システムとは、個々の学習者の知識、能力、目標、状況に応じて、学習内容・提示方法・支援水準などを動的に調整するシステムです。「動的に」というのが重要で、事前にコース全体を設計しておくのではなく、学習者の現時点の状態を測りながらその場で次の手を決めます。この意味で適応は、学習者モデルの推定を入力として教育的決定を出力する 制御問題 として定式化できます。

適応への動機づけは Bloom [Bloom1984] の「2シグマ問題」に遡ります。Bloom は、一対一の個別指導と熟達学習（mastery learning）を組み合わせた条件下で学習した生徒が、通常の集団授業を受けた生徒よりも約 2 標準偏差高い成績を示すこと——個別指導群の中央値が一斉授業群の上位約 2 % に到達する——を報告しました。Bloom はこう問います——「集団教育の条件下で、個別指導に近い効果を達成できるか」。すべての学習者に人間の家庭教師を付けることは現実的ではありませんが、コンピュータシステムなら多数の学習者に同時に個別化された支援を提供できます。これが適応的学習支援の社会的・経済的動機です。

VanLehn [VanLehn2011] は、ITS、人間個別指導、通常授業を比較したメタ分析で、ITS の効果量は通常授業に対しておよそ $d \approx 0.76$ 、人間個別指導は $d \approx 0.79$ で、両者の差は統計的に有意ではないと結論づけました。コストとスケーラビリティを考えれば、ITS は個別指導と同等の教育効果を桁違いに広い母集団に提供できる手段、ということになります。本章で扱う適応の設計判断は、すべてこの可能性をどう具体化するかに関わるものです。

適応の粒度：マクロ・ミクロ・即時

Park and Lee [Park2004] はマクロ適応とミクロ適応を区別しましたが、現代の ITS ではこれをさらに「即時適応」まで含めた三層として捉えるのが自然です。三つの層はそれぞれ異なる時間スケールで作動し、異なる情報を必要とし、異なる効果を生みます。

timeline
    title 適応の三つの粒度
    section マクロ (単元・セッション単位)
      診断 : 既習得KCの同定
      順序付け : カリキュラム経路の決定
      習得判定 : 次単元への移行
    section ミクロ (問題単位)
      問題選択 : ZPD内の次問題
      難易度調整 : KCの組合せ調整
    section 即時 (秒単位)
      ヒント : 段階的ヒント
      フィードバック : 即時の正誤と説明

図 10-1: 適応の三つの粒度。長期のカリキュラム編成から、問題ごとの選択、タスク内の即時支援まで、異なる時間スケールで作動する。

マクロ適応：カリキュラムの順序付けと習得判定

マクロ適応は、セッションや単元レベルでの長期的な決定を扱います。学習者の全体的な知識プロファイルと目標に基づき、どのトピックをどの順序で扱うか、どのトピックを習得済みとしてスキップするかを決めます。

具体例として、Brusilovsky et al. [Brusilovsky1996] の ELM-ART は LISP プログラミングの学習で、各ページへのリンクを学習者の前提知識の充足状況に応じて色分けします。緑のリンクは「あなたは前提を満たしているので学習可能」、赤は「前提が未習得なので推奨しない」、黄色は「準備は整っているが既に学習済み」を表します。学習者は自分のペースで進められる一方、システムが知識依存関係に基づいて経路を案内するわけです。これは「適応的ナビゲーション」と呼ばれるマクロ適応の代表例です。

もう一つのマクロ適応の典型は 習得判定（mastery gating） です。Cognitive Tutor は、各 KC の BKT による習得確率（第 9 章参照）が 0.95 を超えるまでその KC を含む問題を出し続け、超えれば次の単元へ進めます。これにより、表面的に課題をこなしただけで穴のある理解のまま先に進むことを防ぎます。一方、習得閾値が高すぎると過剰練習（over-practice）になり、低すぎると基礎不足のまま先に進むことになります。Corbett らの実証研究では、 $0.95$ 閾値はおおむね妥当なバランスを与えますが、KC によってはより低い閾値で十分な定着が得られることも報告されています。

ミクロ適応：次の問題を選ぶ

ミクロ適応は、学習活動内での問題ごとの選択を扱います。基本方針は Vygotsky の発達の最近接領域（ZPD）[Vygotsky1978] ——学習者が自力では解けないが支援があれば解ける範囲——に対応する問題を選ぶことです。簡単すぎる問題（既習得の KC のみ）では学習が起きず、難しすぎる問題（未習得 KC が多すぎる）では学習者が挫折します。経験則として、未習得 KC を 1〜2 個含む問題がよい学習機会となります。

知識追跡を用いる場合、各問題の KC 構成と学習者モデルの習得確率から、その問題が「ちょうど良い」かを評価できます。例えば BKT の習得確率が 0.5〜0.8 程度の KC を一つ含む問題が、学習機会の最適点とされることが多いでしょう。IRT に基づく適応的テスト（CAT）は、推定能力 $\hat{θ}$ に近い難易度 $b_{j}$ を持つ問題を選ぶことで、能力推定の精度を最大化します。学習用途では、評価精度ではなく学習効果を目的関数とするため、わずかに $\hat{θ}$ より高い難易度を選ぶといった調整がなされることもあります。

即時適応：ヒント、フィードバック、足場かけ

即時適応は問題解決のさなかに行われる秒単位の介入です。学習者が誤った操作をすればフラグを立て、ヒントを要求すれば段階的に提供します。Cognitive Tutor の階層化ヒント（hint hierarchy）はその典型で、最初は「次に何を考えるべきか」という方向性を示し、要求されればより具体的な指示、最終的には「ボトムアウトヒント（bottom-out hint）」と呼ばれる答えそのものに近い指示まで提供します。

flowchart TD
    A["難しすぎる領域<br/>(支援があってもできない)"]
    B["ZPD<br/>(支援があればできる領域)"]
    C["自力でできる領域"]
    A --- B --- C
    B -. "学習者は支援を受けてZPDで学習" .-> P["初期 → 中期 → 後期<br/>(支援を徐々に削減＝フェーディング)"]

図 10-2: 発達の最近接領域（ZPD）と支援のフェーディング。学習者の能力向上に応じて、ZPD内で適切な課題を提供し、支援を徐々に削減する。

Wood et al. [Wood1976] はこの即時的な足場かけを「フェーディング（fading）」として概念化しました。最初は詳細な支援を与え、学習者の能力向上に応じて徐々に手を引き、最終的に自律的な問題解決ができるようにします。この設計の鍵は、フェーディングのタイミングを学習者の状態に応じて動的に決めることです。固定的なフェーディングではなく、学習者モデルの推定に基づいて支援の強度をその場で調整するのが、現代の ITS の即時適応です。

適応の次元：何を変えるか

粒度が「いつ」適応するかを規定するのに対し、次元は「何を」適応させるかを規定します。Brusilovsky [Brusilovsky2001] の適応的ハイパーメディアの分類を学習支援文脈に翻訳すると、内容、順序、難易度、支援量という四つの主要次元が浮かび上がります。

内容の適応 は、提示する情報の詳細度・抽象度・例の選び方を学習者に合わせます。例えばプログラミングの「再帰」を教えるとき、初心者には階乗計算を例にスタックの動きを段階的に追い、上級者には「自身を呼び出して問題を分割する」という簡潔な定義で済ませます。同じ概念でも、既有知識によって最適な説明は異なります。医学解剖学の ITS である ANATOM-Tutor は、初心者には器官の基本構造と機能を、上級者には組織学的詳細や臨床的意義まで含めた説明を提供します。設計上の落とし穴は学習者の既有知識を過大評価することで、不確実なときは保守的に易しめの内容から始める方が安全でしょう。

順序の適応 は前述のマクロ適応に対応します。学習者の知識プロファイルに基づき、未習得の前提を先に学ばせ、既習得のトピックはスキップします。先の ELM-ART がその例であり、より一般には知識グラフ上の経路探索問題として定式化できます（第 12 章参照）。

難易度の適応 は、ミクロ適応の中心です。同じ概念を扱う問題でも、変数の数、必要なステップ数、抽象度などで難易度を制御できます。代数の問題で言えば、 $x + 3 = 7$ から $2 x + 3 = 7$ 、 $2 (x + 1) = 4 x - 3$ へと、必要な変形ステップを段階的に増やしていきます。Cognitive Tutor は各問題に必要な KC の集合を事前にタグ付けし、学習者の習得確率と組み合わせて適切な難度の問題を選びます。

支援量の適応 は即時適応に対応します。同じ問題でも、ヒントなしで解かせるか、最初から段階的なヒントを与えるかを学習者ごとに変えられます。メタ認知的に熟達した学習者には最小限の支援で自力解決を促し、未熟な学習者にはより構造化された段階的支援を提供します。この次元の制御がうまくいくかは、学習者のメタ認知状態の推定精度に大きく依存します。

提示モダリティの適応も独立した次元として研究されてきました。視覚的な図示か、テキスト中心の説明か、音声と図の併用かといった選択です。マルチメディア学習の理論 [Mayer2009] は、視覚情報と聴覚情報を組み合わせる「モダリティ効果」が外在的負荷を下げることを示しています。一方、「学習スタイルに合わせた提示」というよく言われる主張については、Pashler et al. [Pashler2008] のレビューが指摘するとおり、確固たる証拠は不足しています。学習者の好みを尊重して選択肢を提供することは正当化できますが、「視覚型／言語型」というラベルに沿って自動的に提示形式を切り替えることに、学習効果上の根拠はほとんどありません。

ヘルプ要求と支援の濫用：制御の難しさ

適応の次元と粒度を整理しても、それで設計が完了するわけではありません。支援を提供すること自体が、学習者の行動を変化させる という再帰的な問題が残ります。とりわけ即時適応の文脈で、ヒントの提供は学習者のヘルプ要求行動を歪めます。

Aleven and Koedinger [Aleven2006] は Cognitive Tutor の利用ログを分析し、学習者の多くが ヒントを適切に活用できていない ことを示しました。ある学習者群はヒントを過剰に要求して機械的に従うだけで思考を行わず（help abuse）、別の群は困難に直面しても要求せず（help avoidance）、結果として両者ともに学習効果が低かったのです。とくに前者は、Cognitive Tutor のヒント階層が最終的に「ボトムアウトヒント」として答えに近い情報を提供するため、学習者がヒントを連打して答えを得る「ゲーミング（gaming the system）」と呼ばれる行動に陥りやすかったとされます。Baker らの一連の研究は、ゲーミング行動が学習効果と強く負相関することを定量的に示しています。

これに対する応答として、Roll et al. [Roll2011] はメタ認知的支援を内蔵した Help Tutor を開発しました。Help Tutor は、学習者のヒント要求が「いま要求すべきタイミングか」を独立に評価し、不適切なヘルプ要求パターン（即座のヒント要求、過剰なボトムアウト依存）に対しては「自分でしばらく考えてみよう」とメタ認知的なフィードバックを返します。実証研究では、Help Tutor を使った群は使わなかった群に比べてヘルプ要求行動が改善し、しかもその効果は介入終了後にも持続しました。

この事例が示してくれるのは、適応の対象を「知識状態」に限定するのは狭すぎる、ということです。学習者がどのように適応的支援を使うかという、その使い方自体が学習可能で、かつ学習を要する対象 なのです。第 9 章で扱ったメタ認知の側面は、ここでもう一度設計の問題として現れます。適応的システムは知識を提供するだけでなく、学習者にシステムを正しく使う方法を教えることまで考えねばなりません。

適応をどう実装するか

適応の決定をどのアルゴリズムで実現するかには、伝統的に三つのアプローチがあります。

ルールベース適応 は、専門家の知識を IF-THEN ルールとして記述する古典的方式です。例えば「学習者が概念 A を未習得かつ問題 P が概念 A を要求するなら、問題 P の前に概念 A の説明を提示する」といった形式です。透明性が高く、教育設計者がルールを直接記述・修正できることが利点です。教育理論や実践知識を直接コード化できます。一方、ドメインや学習者の多様性が増えるとルール数が爆発し、ルール間の相互作用や矛盾の管理が困難になります。Cognitive Tutor は大規模なルールベースシステムですが、その維持に大きなコストがかかることが知られています。ファジィ論理を用いて「習熟度が高い」「やや迷っている」のような曖昧な概念を連続値で扱う拡張も研究されてきました。

最適化ベース適応 は、適応を制約満足問題や最適化問題として定式化します。目的関数（例：期待される学習効果の最大化）を定義し、前提知識制約、ZPD 制約、多様性制約、時間制約などの下で最適な学習経路や問題系列を計算します。明示的に複数の制約と目標を扱える点が強みですが、計算コストと目的関数設計の難しさが課題となります。

強化学習による適応 は、システム自身が試行錯誤を通じて支援戦略を学習するアプローチです。Rafferty et al. [Rafferty2016] は教授戦略を部分観測マルコフ決定過程（POMDP）として定式化し、学習者モデルを状態、教授行動を行動、学習進歩を報酬として、最適な教授方策を計算しました。固定的な戦略よりも適応的選択の方が学習効果が高いことが示されています。強化学習の利点は最適戦略を事前に設計せずデータから自動的に学習できる点ですが、大量のデータを要し、初期の探索段階では学習者に最適でない支援を提供する可能性、そして学習された方策の解釈困難さという課題があります。

近年の研究は、ルールベースの解釈性と機械学習の柔軟性を組み合わせるハイブリッドアプローチに向かっています。例えば、ルールでマクロ適応の枠組みを与え、即時適応の細部のみを強化学習で最適化する、といった設計です。

適応の限界：いつ適応すべきでないか

適応的支援は強力ですが、無条件に有益なわけではありません。設計者として認識しておきたい三つの限界があります。

第一に、過剰適応（over-adaptation） の問題があります。学習者に常に「ちょうど良い」難度の課題だけを提供すると、学習効果はかえって損なわれます。Bjork の「desirable difficulty」[Bjork1994] の研究は、学習中に経験するある種の困難——困難な検索、間隔練習、変動性のある練習——がむしろ長期的な定着と転移を促進することを示しています。常に易しい課題を解かせることは、その場の正答率を上げる代わりに、学習を表層的な水準に留めてしまうのです。Kapur [Kapur2008] の「productive failure（生産的失敗）」の研究はさらに踏み込み、まず支援なしで複雑な問題に取り組み失敗を経験した学習者の方が、最初から正しい解法を教えられた学習者よりも最終的な理解が深いことを示しました。失敗そのものが、後続の学習を準備する重要な認知的活動なのです。これは適応設計者にとって難しい示唆です——学習者の即時の成功率を最大化することが、長期的な学習効果を最大化するとは限らない、という意味で。

第二に、学習者の自律性 の問題があります。適応が強力すぎると、学習者の選択の余地を奪い、内発的動機づけを損なう恐れがあります。自己決定理論 [Ryan2000] によれば、自律性の感覚は内発的動機づけの中核要素です。「次は何を学ぶか」「いまどの程度の支援を受けるか」をすべてシステムが決めてしまう設計は、学習者を受動的にし、長期的なエンゲージメントを下げてしまいます。これに対する一つの応答が、Bull and Kay [Bull2007] の オープン学習者モデル（Open Learner Model） です。システムが推定した学習者モデルを学習者自身に見せ、確認・修正・利用できるようにします。学習者は自分の学習状況を理解し、適応の方向性に関する意思決定に参加できるわけです。完全にシステム主導の適応ではなく、学習者と協調して適応のレベルや方向性を決める「協調的適応（negotiated adaptation）」が、自律性と適応の両立を目指す方向性として重要だと、僕は考えています。

第三に、適応の透明性と信頼 です。学習者がシステムの適応の根拠を理解できないと、システムへの信頼が損なわれます。「なぜこの問題が選ばれたのか」「なぜこのヒントが出されたのか」を説明できることは、学習者の受容と適切な利用のために重要です。第 9 章で見た BKT のような解釈可能なモデルは、この説明可能性を支える基盤を提供してくれますが、深層学習ベースの適応では「なぜそうしたか」を学習者にも教師にも説明することが原理的に難しくなります。適応の効果と透明性のトレードオフは、現在も活発に議論されている設計課題です。

これらの限界を踏まえると、優れた適応的システムの設計とは「すべてを最適に適応させる」ことではなく、「適応の対象と程度を慎重に選び、学習者に適切な制御権を与える」ことだと言えます。

まとめ

本章では、適応的学習支援を「学習者の状態と目標に応じて学習体験のパラメータを動的に調整する設計問題」として位置づけ、粒度（マクロ・ミクロ・即時）と次元（内容・順序・難易度・支援量）の二軸で整理しました。Bloom の 2 シグマ問題への応答として個別化を実現する有力な手段でありつつ、適応そのものが学習者のヘルプ要求行動を歪め、過剰適応が学習を浅くし、自律性を奪い得るという困難も抱えています。第 9 章で構築した学習者モデルは、これらの設計判断の入力として使われますが、推定の不確実性をどう扱うか、学習者にどこまで制御権を渡すかは、引き続き設計者の判断に委ねられています。

次章への橋渡し

適応的支援が実際に学習者に届くのは、UI を通じてです。どんなに優れた適応戦略でも、学習者がシステムを使いこなせなかったり、ヒントを誤読したり、認知負荷で疲弊したりすれば、効果は失われてしまいます。第 11 章では、ヒューマンコンピュータインタラクション（HCI）の観点から、学習支援システムのインタフェースとインタラクションが学習に与える影響を扱います。UI が単なる表面ではなく 認知負荷を直接操作する設計問題 であることを、一緒に見ていきましょう。

さらに学ぶために

Brusilovsky, P. (2001). Adaptive hypermedia. User Modeling and User-Adapted Interaction, 11, 87-110.
VanLehn, K. (2011). The relative effectiveness of human tutoring, intelligent tutoring systems, and other tutoring systems. Educational Psychologist, 46(4), 197-221.
Aleven, V., & Koedinger, K. R. (2006). An effective metacognitive strategy: Learning by doing and explaining with a computer-based Cognitive Tutor. Cognitive Science, 30(3), 467-505.
Shute, V. J., & Zapata-Rivera, D. (2012). Adaptive educational systems. Adaptive technologies for training and education, 7, 1-35.

認知的教育AIの地図