ヒューマンコンピュータインタラクションと学習支援

この章で扱う問い

第 10 章で扱った適応戦略がどんなに洗練されていても、それが学習者に届くのはユーザインタフェース（UI）を通じてです。本章で考えたいのは、学習支援システムにおける UI が、単なる「使いやすさ」の問題ではなく、学習者の認知負荷を直接操作する設計問題であること です。図とテキストの配置一つで外在的負荷が変わり、フィードバックの粒度とタイミングで関連負荷の質が変わり、オープン学習者モデルの見せ方でメタ認知の働き方が変わります。HCI の研究室から来たあなたには「タスク効率」と「学習」が同じ UI 設計の中でぶつかる場面として、ITS や AIED の研究室から来たあなたには「適応戦略を学習者にどう手渡すか」という最後の一マイルとして、それぞれ読んでいただけるのではないかと思います。

本章では、認知負荷理論を骨格に据えて、フィードバック設計、オープン学習者モデル、感情に応答するインタフェース、そして LLM チューターの対話設計までを、「数学チュータ」という一貫した想定例を交えながら見ていきます。

学習支援におけるHCIの特殊性

ヒューマンコンピュータインタラクション（Human-Computer Interaction, HCI）は、人間と計算機の相互作用を扱う学際分野で、伝統的にはタスク遂行の効率化、エラー削減、ユーザ満足度向上を目指してきました。Nielsen [Nielsen1993] のユーザビリティ五属性——learnability、efficiency、memorability、errors、satisfaction——は一般的なソフトウェアでは妥当な目標です。

しかし学習支援システムでは、効率を追い求めることが時に学習を妨げます。学習の目標はタスクを素早く完了することではなく、学習者の知識や能力を変化させること だからです。学習者が何も考えずタスクを完了できてしまうほど効率的な UI は、学習者から思考の機会を奪います。第 10 章で触れた desirable difficulty が学習を促進するという知見は、UI 設計の文脈では「適切な摩擦をどこに残すか」という問題として現れます。

Quintana et al. [Quintana2004] は「学習者中心設計（Learner-Centered Design, LCD）」を提唱し、学習支援ソフトウェアにおける「learnability」を、「システムの使い方を学ぶこと」ではなく「システムを通じて対象領域の内容を学ぶこと」と再定義しました。LCD の核は、学習者の現在の能力で達成困難な課題に対して足場かけ（scaffolding）を提供すること、学習者が「いま自分はどこにいて、何を学んでいるか」を理解できるよう学習プロセスを可視化すること、図やシミュレーションを認知的道具として組み込み認知プロセスを外部化すること、そして探究と発見の機会を確保することにあります。これらは UI のレイアウトやインタラクションの細部にまで影響する設計原則です。

認知負荷とインタフェース：数学チュータの設計を例に

第 7 章で扱った Sweller et al. [Sweller2011] の認知負荷理論は、UI 設計に最も直接的な示唆を与える理論です。学習者のワーキングメモリ容量は厳しく制約されており、UI の複雑さがその容量を圧迫すれば、学習内容の処理に回せる資源が削られます。認知負荷は「内在的負荷」（学習内容そのものの複雑さ）、「外在的負荷」（不適切な提示や UI による不要な負荷）、「関連負荷」（スキーマ構築に直接寄与する負荷）の三つに分かれます。UI 設計の目標は、外在的負荷を最小化し、関連負荷を最大化することです。

flowchart TB
    subgraph Bad["悪い設計：外在的負荷が大きい"]
        direction LR
        IB["内在的負荷<br/>(本質的複雑さ)"]
        EB["外在的負荷<br/>(不適切なUI)"]
        GB["関連負荷<br/>(スキーマ構築)"]
        IB --- EB --- GB
    end

    subgraph Good["良い設計：外在的↓、関連↑"]
        direction LR
        IG["内在的負荷"]
        EG["外在的負荷<br/>(縮小)"]
        GG["関連負荷<br/>(拡大)"]
        IG --- EG --- GG
    end

    Bad -. "改善" .-> Good

図 11-1: 認知負荷理論に基づくインタフェース設計。ワーキングメモリは有限のため、悪い設計では外在的負荷が容量を圧迫する。良い設計では外在的負荷を最小化し、関連負荷（学習に寄与）を最大化する。

具体的に考えるために、二次関数の学習を支援する数学チュータの UI を想像してみてください。画面の左側に問題（「 $y = x^{2} - 2 x - 3$ のグラフを描け」）、右側に学習者の作業領域（係数を変えるスライダーと座標平面）、下部に解説テキストが配置されているとしましょう。よくある悪い設計は、解説テキストが画面下部にあり、「グラフの頂点は $(1, - 4)$ です」という説明と、その頂点を表す座標平面上の点が遠く離れて配置されている場合です。学習者は視線を上下に行き来させ、テキスト内の「頂点」と座標平面上の点を頭の中で対応付けねばなりません。これは Sweller らが「分離効果（split-attention effect）」として指摘した古典的な外在的負荷です。改善策は、「頂点」という語を座標平面上の対応する点の隣に直接配置する、あるいは点と語を線で結んで対応関係を明示することです。同じ情報量でも、空間的統合によって学習者のワーキングメモリ負荷が下がります。

別の例として、係数を変えるスライダーを動かしたときに、座標平面上のグラフが滑らかにアニメーションし、同時に音声で「 $x^{2}$ の係数を大きくすると、放物線が縦に細くなります」という説明が流れる設計を考えてみましょう。これは「モダリティ効果」を活用したもので、視覚チャネル（グラフ）と聴覚チャネル（音声）を同時に使うことで、ワーキングメモリの二つのサブシステムを並列に活用します。ところが、ここに同じ内容のテキスト解説まで画面に表示すると、同じ情報を視覚チャネルで二重に処理することになり、Mayer の言う「冗長性効果（redundancy effect）」が生じて学習効果がむしろ下がります。冗長な情報は親切に見えても、しばしば有害なのです。

これらの原則は、見た目の美しさやリッチさとはむしろ対立することが多いものです。学習支援 UI の設計では、「何を入れるか」と同じくらい「何を入れないか」に注意を払う必要があります。

フィードバックの設計：粒度・タイミング・フレーミング

フィードバックは学習支援システムの中核的な相互作用で、単に「正解」「不正解」を返すこと以上に多くの設計判断を含みます。Hattie and Timperley [Hattie2007] の影響力あるレビューは、フィードバックを「現在の学習状況、目標、次にとるべき行動」に関する情報として包括的に捉え、その効果は内容と提供方法に大きく依存することを示しました。設計上の重要な軸は粒度・タイミング・フレーミングの三つです。

粒度については、結果フィードバック（KR: Knowledge of Result）と、より詳細な解説フィードバック（KCR: Knowledge of Correct Response、あるいはエラー特定型のフィードバック）の選択があります。先の数学チュータで、学習者が頂点を $(1, - 3)$ と答えた場合、「不正解」とだけ返すのが結果フィードバック、「 $y$ 座標が違います。頂点の $y$ 座標は $f (1)$ で計算します」とエラー位置を特定するのが解説フィードバックです。一般に解説フィードバックの方が学習効果は高いのですが、与えすぎると学習者の自己訂正の機会を奪います。Cognitive Tutor の階層化ヒント（第 10 章参照）は、最初は粗いフィードバックを返し、学習者が要求すれば段階的に詳細にしていくことで、この緊張関係に対処しています。

タイミング については、即時フィードバックと遅延フィードバックの古典的な対比があります。スキル習得の初期段階では即時フィードバックが効果的で、誤った手続きが定着する前に修正できます。しかし、テスト的な状況や問題解決の練習では遅延フィードバックの方が長期的な定着を促すことが Bjork らの研究から知られています。即時フィードバックは学習者を依存的にし、自己モニタリングの機会を奪い得ます。設計上の解決の一つは、第一試行は遅延でフィードバックし、再試行時には即時にする、といったハイブリッド戦略です。

フレーミング については、フィードバックの言語的トーンが学習者のマインドセットに影響することが Dweck らの一連の研究で示されてきました。「賢いね」と能力を称賛するフィードバックは固定的マインドセットを促し、「がんばって取り組んだね」と過程を称賛するフィードバックは成長マインドセットを促します。同様に、誤答に対して「間違っています」と直接的に伝えるか、「もう一度確認してみよう」と探索を促すかで、学習者の感情と次の行動が変わります。これらは技術的設計の問題というより、システムが学習者にどんな「教師」として現れるかという、より広いインタラクション設計の問題です。

対話的支援：AutoTutorからLLMチューターへ

学習は本質的に対話的です。教師は質問し、学習者は答え、教師は学習者の答えに基づいてさらなる質問やプロンプトを返す。この対話性を計算機システムでどう実現するかは、ITS 研究の長年の中心テーマでした。

AutoTutor [Graesser2004] はその先駆的システムです。物理学やコンピュータリテラシーを領域とし、学習者と自然言語で対話しながら概念理解を支援します。対話は、深い理解を要する問いの提示、学習者の自由記述による回答、回答の意味分析、欠けている要素を引き出すための追加質問・ヒント・プロンプト、要点の要約、という段階を辿ります。AutoTutor の対話戦略はルールベースで実装されていて、潜在意味解析（LSA）を用いて学習者の発話と「理想的な回答の構成要素」を比較し、何が言及されていて何が欠けているかを判定します。評価研究では、教科書のみで学習した群に比べておおむね effect size $0.4$ 〜 $0.8$ の学習効果が報告されており、人間の個別指導（ $d \approx 0.79$ ）には及ばない場合もありますが、コスト効率を考えれば実用的な水準です。

AutoTutor の限界は、対話戦略を事前に設計しておく必要があることと、想定外の発話への柔軟な対応が困難なことでした。2020 年代の大規模言語モデル（LLM）の発展は、この限界を一気に押し広げました。GPT-4 や Claude のような現代の LLM は、広範な領域で文脈に応じた自然な対話を生成できます。しかし、LLM チューターの設計は新たな問題を生みます。LLM はデフォルトでは学習者の質問に「答えてしまう」。生徒が「この方程式を解いて」と頼めば、丁寧に解いてくれてしまう。これは適応的支援の文脈では、ヒント濫用やゲーミングを構造的に促進する設計と言えるでしょう（第 10 章参照）。

良い LLM チューターの設計は、プロンプトとシステム側の足場かけによって LLM の振る舞いを制約することにあります。先の数学チュータの例で言えば、LLM には「学習者が解答を直接求めても答えを出さず、学習者の現在の理解を引き出す質問を返すこと」「学習者が示した中間ステップが正しい場合は次のステップを問う、誤っている場合はその誤りを直接指摘せず、検証する方法を尋ねること」といったソクラテス的対話の役割を与えます。さらに、第 9 章で扱った学習者モデルを LLM のプロンプトに渡し、「この学習者は二次関数の頂点公式を未習得である」といった情報に基づいて支援を調整します。LLM チューターはこの意味で、ITS の学習者モデルと適応戦略を、自然言語生成という柔軟なインタフェースで包む構成を取り得ます。実証研究と倫理的課題については第 12 章で詳しく扱います。

ペダゴジカルエージェントとして対話相手に画面上のキャラクター表現を与えるアプローチも、長く研究されてきました。Reeves and Nass [Reeves1996] の「メディア等式」は、人間が計算機やメディアに対して実際の人間と同様に社会的に振る舞うことを示し、エージェントの存在が学習者の関与を高め得ることを示唆しました。しかし Mayer [Mayer2014] のレビューは、エージェントの単なる存在では学習効果は向上せず、教育的に意味のある行動（適切な説明、質問、フィードバック）を行うことが本質だと結論づけています。礼儀正しく友好的な言葉遣いをする「ペルソナ効果」が学習成果を向上させる証拠もありますが、過剰なアニメーションは「誘惑的詳細」として注意を逸らし、写実的すぎるエージェントは「不気味の谷」を引き起こします。エージェントは万能ではなく、その有用性は具体的な振る舞いの設計次第なのです。

学習プロセスの可視化とオープン学習者モデル

学習者が自分自身の学習状況を理解できるようにすることは、メタ認知と自己調整学習を支える重要な機能です。可視化の対象は二つあります——学習内容そのものと、学習プロセスの状態です。

学習内容の可視化として代表的なのは、対話的シミュレーションです。PhET [Wieman2008] は物理学・化学・数学の概念を学ぶための対話的シミュレーションのコレクションで、例えば「フックの法則」のシミュレーションでは学習者がバネを引っ張り、力と伸びの関係をリアルタイムで観察できます。バネ定数のスライダーを動かすと、グラフがどう変化するかを視覚的に把握できる。PhET の評価研究では、伝統的な講義や教科書のみの学習より高い効果が報告されており、特に複雑な因果関係や動的プロセスの理解に有効です。ただし Tversky et al. [Tversky2002] のレビューが示すように、アニメーションは静止画より無条件に優れているわけではなく、学習者が重要な変化に注意を向けられるような支援とセットで初めて効果を持ちます。概念マップツールである CmapTools [Novak2006] も、学習者が自ら概念とその関係を構築する活動を支援することで、知識の構造化を促します。

学習プロセスの可視化の典型は学習ダッシュボードです。学習時間の推移、各トピックの習熟度、未完了課題、目標達成度などを可視化し、学習者と教師が状況を把握できるようにします。Khan Academy の知識マップは成功例で、学習者は自分が習得したスキルと未習得のスキルを一目で把握でき、保護者や教師も進捗を確認できます。Verbert et al. [Verbert2014] のレビューは、ダッシュボード設計の落とし穴として情報過多を挙げ、可視化の目的を明確化し、認知負荷に配慮し、数値だけでなくその意味と次の行動可能性を伝えることの重要性を指摘しています。

学習プロセス可視化の中で、とくに教育的含意が深いのが オープン学習者モデル（Open Learner Model, OLM） です（第 10 章でも触れました）。OLM は、システムが内部に持つ学習者モデルを学習者本人に開示し、確認・修正・利用できるようにするアプローチです。スキルメーターで KC ごとの習熟度をバー表示する単純な形式から、ベイジアンネットワークで KC 間の依存関係と各要素の習得確率をグラフ表示する複雑な形式まで、表現には幅があります。

Bull の一連の研究 [Bull2010] は、OLM が学習者のメタ認知的気づき、学習計画、動機づけを向上させることを実証してきました。学習者がモデルを見ることで、「自分はこのトピックを十分理解していると思っていたが、システムは未習得と判定している」といった 自己評価とシステム評価のずれ に気づき、それ自体が反省的な学習機会となります。学習者がシステムの評価に同意しない場合、その不一致を解消するための対話——追加の自己評価、テスト、修正——が起き、学習者のメタ認知能力が鍛えられます。OLM の設計は、システムを「学習者を評価する権威」ではなく「学習者と協働する道具」として位置づける哲学を体現するものです。第 10 章で触れた学習者の自律性の問題に対する、具体的な設計上の応答でもあります。

感情とエンゲージメントに応答するインタフェース

学習は認知的活動であると同時に情動的活動でもあります。混乱、退屈、フラストレーション、フロー——学習者の情動状態は学習成果と深く関連します（第 9 章参照）。これに応答する affect-aware なインタフェースの研究が、過去 20 年ほどの間に進展してきました。

Wayang Outpost [Arroyo2014] は、数学学習を支援する ITS で、学習者の表情、姿勢、皮膚電気反応などのセンサーデータから情動状態を推定し、それに応じてヒントの提供方法やキャラクターの応答を変えます。例えば学習者がフラストレーションを示す兆候を検出すると、システムは励ましのメッセージを返したり、課題の難度を下げたりします。実証研究では、こうした affect-aware な介入がエンゲージメントと学習成果を向上させることが報告されています。D'Mello and Graesser [DMello2008] の AutoTutor 研究も、混乱が一定時間続けば追加のヒントを、退屈が検出されればより挑戦的な問いを提示するといった戦略を試みています。

しかしこの種のインタフェースには重要な倫理的問題がつきまといます。学習者の表情や生理データを継続的に監視することは、プライバシーと監視の境界に関わります。Prinsloo and Slade [Prinsloo2017] は、こうしたデータ収集について透明性、同意、データの最小化といった倫理原則を提唱しています。技術的にも、表情から情動を読み取る精度は文化や個人差を超えた一般化が困難で、誤検出が学習者の不快感や不適切な介入につながるリスクがあります。affect-aware なインタフェースは強力ですが、その導入は教育的便益とプライバシー・公平性のリスクを慎重に天秤にかける必要があります。

アクセシビリティとユニバーサルデザイン

学習支援システムは多様な学習者に開かれているべきです。視覚・聴覚・運動機能に制約のある学習者、異なる言語背景の学習者、様々な年齢層の学習者が等しく学習機会を得られる設計が求められます。W3C の Web Content Accessibility Guidelines（WCAG）は、Web コンテンツのアクセシビリティを「知覚可能（perceivable）」「操作可能（operable）」「理解可能（understandable）」「堅牢（robust）」の四つの原則（POUR）として定式化していて、これらは学習支援システムにも直接適用できます。画像への代替テキスト、動画への字幕、キーボードのみでの操作、明確で一貫したナビゲーション、支援技術との互換性。これらは追加機能ではなく、設計初期から組み込むべき基盤です。

Universal Design for Learning（UDL）[Rose2014] は、より広い教育設計の枠組みとして、すべての学習者に等しく効果的な学習機会を提供することを目指します。UDL は、情報を複数の方法（テキスト、音声、図、動画）で提示する「複数の表現手段」、学習者が知識を示す方法を複数（記述、口頭発表、プロジェクト）提供する「複数の行動と表現の手段」、興味と動機づけを支える複数の関与の手段、を提唱します。UDL の哲学は第 10 章の適応的支援と密接に関連します——「正しい」一つの方法ではなく、選択肢を用意することが本質です。アクセシビリティは少数のための特別配慮ではなく、UI 設計の質そのものを高める制約と捉えるべきだと、僕は考えています。

次章への橋渡し

本章では、学習支援システムの UI を 学習者の認知負荷を直接操作する設計問題 として位置づけ、認知負荷理論を骨格に据えてその様々な側面を見てきました。図とテキストの空間的統合、モダリティと冗長性の扱い、フィードバックの粒度・タイミング・フレーミング、対話システムから LLM チューターへの展開、オープン学習者モデルによるメタ認知支援、感情に応答するインタフェース、そしてアクセシビリティとユニバーサルデザイン。これらはすべて、UI の細部が学習者の認知資源と動機にどう影響するかという同じ問いの異なる側面でした。優れた UI は、学習者の認知資源を学習内容そのものに集中させ、学習プロセスを可視化し、学習者の自律性と多様性を尊重します。逆に、不適切な UI は外在的負荷で資源を浪費し、依存を生み、学習者を排除してしまいます。

ここまで第 9 章から第 11 章にかけて、学習者モデルの構築、適応戦略の設計、UI の設計を順に見てきました。これらの基盤を支えるのが、近年急速に発展する人工知能と機械学習の技術です。次章では、AI が ITS の各レイヤにどう適用され得るかを概観し、とりわけ LLM が教育にもたらす可能性と固有の限界を掘り下げていきましょう。

さらに学ぶために

Quintana, C., et al. (2004). A scaffolding design framework for software to support science inquiry. Journal of the Learning Sciences, 13(3), 337-386.
Mayer, R. E. (2014). The Cambridge handbook of multimedia learning. Cambridge University Press.
Hattie, J., & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81-112.
Bull, S., & Kay, J. (2010). Open Learner Models. In Advances in Intelligent Tutoring Systems, Springer.
Verbert, K., et al. (2014). Learning dashboards: an overview and future research opportunities. Personal and Ubiquitous Computing, 18, 1499-1514.

認知的教育AIの地図