本書の未来——三つの研究プログラム

この章で扱う問い

本書は最終章に到達しました。ここまで、認知の分析 (第 5 章)、形式化 (第 6 章)、学習活動の設計 (第 7 章)、実装技術 (第 8〜12 章)、評価 (第 13〜14 章)、関連分野との位置取り (第 15 章)、応用事例 (第 16 章)、倫理 (第 17 章) を順に巡ってきました。本書を閉じるにあたって——本書の枠組みは完成された方法論ではなく、未完の探求です——その探求の方向性を、実行可能な研究プログラムとして提示しておきたいと思います。

本章の主張は、本書の今後を語るのに「あれもこれも」と挙げず、三つの方向性 に集中することです。多層形式化 (multi-layered formalization)——認知を構文・意味・概念・メタの複数層で同時に形式化する道。LLM との責任ある統合 (responsible LLM integration)——大規模言語モデルの言語能力と本書の制御可能性をどう組み合わせるかという、最も時事的でかつ最も困難な問題。コミュニティとデータ共有 (community and data sharing)——形式化と実装の知見が単発で消えず累積する、エコシステムの社会基盤の構築。これら三つは独立ではなく、互いに依存しています。多層形式化は標準化された中間表現を要求し、その中間表現の流通はコミュニティ基盤を要求し、コミュニティ基盤の正当性は LLM 時代における本書の存在意義を要求します。

本章では各方向性を、漠然とした未来予測ではなく、具体的な研究上の問い として提示します。本書の読者が「次に何をすべきか」を考えるときの足場として読んでいただければ嬉しいです。研究室を選ぶ段階の学生にも、すでに別の領域で研究を進めている学生にも、ここで挙げる問いのどれかが「自分のテーマと地続きだ」と感じてもらえるところがあるはずです。

第一の方向——多層形式化

本書の核心は、認知構造の計算論的形式化です (第 6 章参照)。これまで本書の伝統と ITS の歴史は、形式化を主に「単一レベル」で行ってきました——プロダクションルール、制約、概念マップ、Q 行列。しかし実際の学習は多層的です。形式化の方法論自体が、この多層性に応えるよう進化する必要がある——これが第一の研究プログラムです。

多層性とは何か——プログラミング学習を例に

具体例として、プログラミング学習者の認知を見てみましょう。同じ学習者が同じ瞬間に、次の異なる層で別々の知識を発動しています。

構文レベル——文法的に正しいコードを書く。括弧やセミコロンの規則。
意味レベル——コードが意図した動作をする。変数のスコープ、参照透過性、状態遷移。
設計レベル——効率的で保守可能な構造を持つ。命名、関数分割、コードの読みやすさ。
概念レベル——抽象的なアルゴリズムやデザインパターンを理解する。再帰、分割統治、オブジェクト指向。
メタレベル——自分の理解度を監視し、学習戦略を調整する。「ここでデバッガを使うべきか、紙に書くべきか」。

学習者がループでつまずくとき、その原因は構文 (for の書式が分からない) かもしれず、意味 (カウンタ変数が「同時に」変わると思っている) かもしれず、概念 (反復という抽象が腑に落ちていない) かもしれず、メタ (自分が何を分かっていないかが分かっていない) かもしれません。現状の多くの ITS は、これらを区別せずに一つの「スキル」として扱います。Cognitive Tutor の KC (knowledge component) も、たいてい構文か意味のどちらか一方の粒度で書かれます。

研究上の問い

多層形式化の研究プログラムは、次の問いに分解できます。

第一に、層をどう離散化するか——上で挙げた 5 層は便宜的なもので、ドメインによって最適な層数と区切り方が違います。数学では構文層は弱く、概念層が極めて重要です。語学では構文層と意味層の区別が常に揺らぎます。各ドメインで層構造をどう決めるかは、認知的タスク分析と教育心理学的妥当性の問題です。

第二に、層間の相互作用をどうモデル化するか——構文の混乱が意味の理解を妨げ、メタ層の覚束なさが下層全部を不安定化させます。層が独立に積み重なるのではなく、相互に影響し合う構造をどう書き下すか。動的ベイジアンネットワーク、層別の活性化拡散モデル、ACT-R [Anderson2007] や Soar [Laird1987] のような統合的認知アーキテクチャとの連携が候補になります。

第三に、層に応じた診断と介入を設計できるか——同じ「ループの誤答」に対して、構文レベルの問題なら構文補正、意味レベルなら逐次実行の可視化、概念レベルなら別ドメインでの類比提示、メタレベルなら振り返りプロンプト、と介入を分けます。Error-based Simulation (第 16 章参照) は意味層の介入として優れていますが、概念層やメタ層には別のアプローチが要ります。

第四に、確率的・ファジー形式化と多層形式化の両立。従来の形式化 (論理、オントロジー) は明確な真偽を前提としますが、学習者の知識は曖昧で、部分的で、文脈依存的です。BKT のようなベイズ的アプローチや、ファジィ論理、現代の確率的プログラミング言語をどう多層に拡張するかが課題です。

第五に、時間的・発達的形式化——現状の学習者モデルは「現時点での知識状態」を表現します。しかし学習は時間的プロセスであり、知識の獲得速度、忘却曲線、発達段階の遷移を扱う必要があります (第 14 章の学習曲線分析参照)。Piaget [Piaget1952]、Vygotsky [Vygotsky1978] の発達理論との統合は、ITS が長らく避けてきた課題です。

中間表現の階層化——抽象度のスペクトラム

多層形式化と並行して、中間表現そのものに階層構造を持たせる必要があります。本書の中間表現は、抽象的すぎると具体的な実装に結びつかず、具体的すぎるとドメイン間で再利用できなくなります (第 6 章参照)。「ループ」概念を例に、抽象度のスペクトラムを書いてみましょう。

最抽象レベル——「一定の規則に従う反復過程」 (ドメイン非依存)
中レベル——「カウンタによる有限回反復」「条件による反復」 (プログラミング、数学に共通)
具象レベル——for (int i=0; i<n; i++) (C 言語)、 $\sum_{i = 1}^{n}$ (数学記法)

学習者は具象から入り、中レベルへ抽象化し、最抽象レベルで他ドメインと接続します。中間表現がこの階層を明示し、学習者・教師・別システムが必要な抽象度でアクセスできるようにすることが大事です。これは多視点表現とも繋がります——微分の概念は、幾何 (接線の傾き)・解析 (極限としての導関数)・物理 (瞬間速度)・計算 (数値微分) の異なる視点から表現されるべきで、視点間のマッピングを明示するのが中間表現の役割です。

第二の方向——LLM との責任ある統合

大規模言語モデル (LLM) の登場は、学習支援に大きな変化をもたらしつつあります [Kasneci2023] (第 12 章、第 16 章参照)。本書の視点からの問いは単純です——LLM の流暢さと本書の制御可能性をどう統合するか。これは未来の話ではなく、いま起きている話です。Khanmigo (第 16 章) は GPT-4 ベースで広範な学校に展開されており、対応を急がなければ本書の枠組みは時代遅れの方法論として通り過ぎられてしまうかもしれません。

LLM の限界——FCL が補完すべき点

LLM は強力ですが、FCL 的観点から見ると重要な弱点があります。

第一に、認知モデルの欠如——LLM は学習者の認知状態を構造化されたモデルとして追跡しません。「この学習者はどのスキルを習得し、どの誤概念を持つか」の永続的状態がないのです。会話のたびに最初からやり直しに近い状態で動きます。

第二に、教育的戦略の不在——LLM の応答は確率的で、ZPD 内の課題、段階的ヒント、フェーディング (第 10 章参照) といった教育的戦略を保証しません。「学習者が答えに詰まったとき、どこまでヒントを出すべきか」を、LLM は文脈と確率分布から「それっぽく」決めますが、認知科学的に正しい判断とは限りません。

第三に、説明可能性の欠如——「なぜこのヒントを提示したか」の根拠が、LLM の活性化パターンに閉じ込められて取り出せません。

第四に、ハルシネーション——LLM は自信を持って事実誤認を述べます。教育文脈では、これは深刻な害をもたらしうるリスクです。

FCL-LLM ハイブリッドアーキテクチャ

これらの問題に対する本書の応答は、LLM を言語生成エンジンとして使い、FCL が制御の頭脳となる 階層的アーキテクチャです [Stamper2024]。具体的に四層で書いてみましょう。

flowchart TD
    A["第1層：認知モデル層 (FCL)"] --> B["第2層：教授戦略層 (FCL)"]
    B --> C["第3層：対話計画層 (FCL)"]
    C --> D["第4層：言語生成層 (LLM)"]
    D --> User["学習者"]
    User --> A

図 18-1: FCL-LLM ハイブリッドアーキテクチャの四層

第 1 層 (認知モデル層, FCL)——学習者の知識状態を BKT や制約ベースモデルで形式的に追跡。第 2 層 (教授戦略層, FCL)——現在の認知状態に基づき、教育的目標を設定 (「スキル X を習得させる」「誤概念 Y を修正する」)。第 3 層 (対話計画層, FCL)——ソクラテス的対話、worked examples、足場かけなど、具体的な教授戦略を選択。第 4 層 (言語生成層, LLM)——FCL が決定した「教育的意図」を、自然で文脈に適した日本語に変換。

具体例で動かしてみましょう。学習者がプログラミングで「変数の値は同時に変わる」という誤概念を持つとします。

認知モデル層が誤概念 M = {同時更新} を診断 (直前の解答パターンと誤りモデルから)。
教授戦略層が「逐次実行の概念を明示化する」を選ぶ。
対話計画層が「ステップ実行を観察させる」戦略を選択し、シミュレータでの実演をプランする。
言語生成層に「学習者にステップ実行の観察を促す日本語を、プログラミング初学者向けに書いてください」と指示し、LLM が「では、このコードを 1 行ずつ実行したとき、変数 x と y の値がどう変化するか、実際に見てみましょう」と生成する。

この設計の意義は、LLM の柔軟な言語能力と本書の教育的制御可能性が両立できるところにあります。LLM が暴走しても、FCL が教授的意図を承認したものだけが学習者に届く——これが「責任ある統合」の意味です。

研究上の問い

このアーキテクチャは概念的にはきれいですが、実装上の問いは多くあります。

LLM の出力をどう検証するか——FCL が「ステップ実行を促せ」と指示しても、LLM は別の指示を出すかもしれません。LLM 生成テキストが教授的意図と整合しているかを、もう一度本書の側で形式的に検証する仕組みが必要です。
プロンプト設計の形式化——本書の教授的意図を LLM 用プロンプトに落とすこと自体が、新しい形式化の対象です。「教授的意図の中間表現」と「自然言語プロンプト」の対応を体系化する必要があります。
LLM の知識の更新可能性——ドメイン知識が変わったとき (数学カリキュラムの改訂、プログラミング言語のバージョンアップ)、LLM の応答をどう一貫して更新するか。本書の中間表現側を更新するだけでは、LLM が古い情報を出し続けます。
コスト構造——LLM 呼び出しは API コストがかかります。本書の階層構造で適切に間引く (簡単な応答は LLM を使わない) 設計が必要です。

LLM による形式化の自動化——逆方向の使い方

逆方向に、LLM が本書の形式化プロセスを支援できる可能性もあります。

オントロジー構築支援——ドメイン専門家が自然言語で概念を記述すると、LLM が形式的なオントロジー (OWL、第 4 章参照) の候補に変換します。専門家が検証・修正することで、形式化コストを削減できます。

誤概念パターンの自動抽出——大量の学習ログと対話データから、LLM が典型的な誤りパターンを抽出し、Mal-rules (第 9 章参照) として形式化する候補を提案します。

説明生成——形式的な認知モデルから、学習者・教師向けの自然言語説明を LLM が生成します。「あなたの誤りは、概念ノード X と Y の関係を取り違えていることから生じています」を、より平易な表現に言い換える、といった使い方です。

これらは便利ですが、LLM の生成は検証が要ります。本書の形式的枠組みが、LLM 生成の正しさを検証する基準となる——LLM は FCL を加速するが、本書の正しさを保証するのは LLM ではない ということです。

第三の方向——コミュニティとデータ共有

本書の最大の野心は、個別システムの効果ではなくエコシステムとしての累積にあります (序章、第 13 章、第 15 章参照)。これは技術的課題であると同時に、コミュニティ形成の社会的課題でもあります。形式化と中間表現は、それを担う社会的仕組みがなければ単発の論文や孤立した製品で終わる——この認識が第三の研究プログラムの出発点です。

認知モデル・オントロジーのリポジトリ

最初に必要なのは、研究者が開発した認知モデル、ドメインオントロジー、教授戦略を、検索可能・再利用可能な形で登録する場所です。これは、ソフトウェア開発における GitHub、機械学習における Hugging Face のモデルハブに相当する役割を、学習支援研究で果たすことを目指すものです。

技術的要件は明らかです——標準化されたメタデータ (モデルの対象ドメイン、理論的基盤、検証データ、ライセンス)、バージョン管理、検証メトリクス、相互参照 (モデル間の拡張・修正関係)。期待される効果は「車輪の再発明の削減」と「累積的発展」と「新規研究者の参入障壁の低下」です。

研究上の問いは次の三点に絞られます。標準化の範囲をどこに引くか——細かすぎる標準は採用されず、粗すぎる標準は再利用を促進しません。コミュニティ・ガバナンス——誰が標準を決め、誰がリポジトリを運営するか。学術コミュニティ、民間企業、政府機関のどれが正当な担い手か。インセンティブ設計——研究者がモデルを共有する動機をどう作るか。論文出版とは別の評価指標が必要かもしれません。

相互運用可能なコンポーネントライブラリ

リポジトリと並んで、学習者モデリング、適応的課題選択、フィードバック生成、可視化などの機能を、プラグイン可能なモジュールとして提供する基盤が要ります。「Bayesian Knowledge Tracing モジュール」が任意のドメインの知識構造を入力として受け取り、学習者の習熟度を推定する標準インタフェースを提供する——という形式です。

技術的要件は標準 API (入出力の形式、呼び出し規約)、中間表現の統一 (モジュール間でデータをやり取りする共通フォーマット——JSON-LD、xAPI のような既存規格との接続)、ドキュメントと例 (各モジュールの使用法、制約条件の明示)。期待される効果は「システム開発の効率化」「異なるアプローチの公正な比較」「ベストプラクティスの普及」です。

学習データの倫理的共有

PSLC DataShop [Koedinger2010] のように、学習ログデータを研究コミュニティで共有する仕組みも必要です。これは第 17 章で論じた倫理的課題と正面から衝突します——プライバシー、再識別リスク、商業利用の禁止、目的限定、同意。「共有可能性」と「個人保護」のトレードオフをどう設計に書き込むか が、研究上の問いです。

技術的・倫理的要件には、匿名化 (個人識別情報の削除、k-匿名性の保証)、同意 (学習者・教育機関からのインフォームド・コンセント、特に未成年への配慮)、目的限定 (研究目的に限定し商業利用を制限)、標準形式 (異なるシステムのログを統一フォーマットで記録)、削除権 (参加者がデータ削除を要求できる権利、GDPR 準拠) が含まれます。

期待される効果は、大規模データによる理論検証、稀な学習パターンの発見、システム間の効果比較、そしてコミュニティ全体の研究品質の向上です。第 14 章で論じた検出力分析が示す通り、現場効果 ( $d \approx 0.20$ ) の検出には数百〜数千の学習者規模が必要で、これは単一の研究室では集められません——共有データなしには、本書の現場評価は事実上不可能なのです。

コミュニティと標準化

FCL エコシステムの実現には、標準化団体 (IEEE、W3C のワーキンググループなど) が中間表現と API の標準を策定する組織的取り組みが必要です。Learning Tools Interoperability (LTI) や xAPI などの既存教育技術標準との連携も重要です。同時に、論文だけでなくコード・データ・モデルを公開するオープンサイエンス文化、認知科学・教育学・計算機科学・HCI・倫理学が並ぶ学際的協働、Design-Based Research (第 14 章) のように実践者 (教師) も設計プロセスに参加する仕組みが要ります。

これらは技術的問題というより 社会制度的問題 です。FCL を方法論として完成させるだけでは足りず、それを担うコミュニティを育てなければなりません——これが、本書の第三の研究プログラムが研究者個人の努力の射程を超えた、構造的な仕事である理由です。

日本語圏に話を絞ると、第 15 章でも触れた 「教育・学習支援システム研究」 という包括ラベルのもとに、すでにいくつかの研究コミュニティが動いています。本書が描く地図とほぼ重なる射程をカバーしている代表的な研究会・学会は次のあたりです。

なかでも SIG-SLAM (認知スキーマ・学習活動モデリング) は、その名称が示すとおり、本書のテーマと直接重なる問題を扱う研究会です。

加えて、若手研究者・学生向けの集まりとして、

教育・学習支援システム若手の会 (yelss) — 著者も運営に関わっている、所属研究室の枠を越えた若手の集まり
CALST (Co-study Group on Advanced Learning Science and Technology) — AI・知識工学・学習工学・学習科学・認知心理・認知科学にまたがる若手研究者と学生の 協働的な「第二のゼミ」。週 1〜隔週オンラインで集まり、研究発表・輪読・学会発表練習・研究室運営の共有などを「言い訳なしの深い議論」として続ける場

があります。学部生・大学院生・若手教員が、所属研究室の枠を越えて議論したり、互いの研究を見せ合ったりする場で、本書が想定している「近接ラボの学生たちが越境して話せるエコシステム」のささやかな実例です。本書を読み終えた、あるいは途中で「もう少しこの界隈の人と話してみたい」と感じたあなたには、こうしたコミュニティが自然な次の一歩になります。各コミュニティへの参加方法は付録 A や、僕の研究室サイト https://koike-lab.org/ から辿ってください。

三つの方向の絡み合い

ここまで三つの方向性を独立に書きましたが、実際にはこれらは絡み合っています。

多層形式化は、複雑な認知構造を扱える中間表現を要求します。その中間表現が単一研究グループに閉じていては、多層性のメリットが出ません——複数のドメイン、複数の言語、複数の文化的文脈で再利用されて初めて、多層形式化の射程が確かめられます。よって 多層形式化はコミュニティ・データ共有を要求します。

LLM との統合は、LLM の出力を本書の制御下に置くことを要求します。FCL が LLM を制御するためには、FCL 側の認知モデルが十分に豊かでなければなりません——浅い認知モデルでは、LLM の流暢な暴走を抑えきれません。よって LLM 統合は多層形式化を要求します。

コミュニティ・データ共有は、共有することの価値が示されなければ動機が生まれません。LLM 時代に「FCL が必要だ」と言うためには、LLM では達成できない説明可能性・教育的制御性・倫理的責任を、FCL ベースのシステムが具体的に示す必要があります。よって コミュニティ形成は LLM 統合の成功事例を要求します。

この三つは循環しているのではなく、相互依存的に同時進行します。一方を完成させてから次に進むという順序ではありません——三つの方向で並行して、それぞれの研究プログラムが他の二つを引っ張りつつ進んでいきます。これが、本書の今後の数十年の研究プログラムの構造です。

おわりに——未完の探求への招待

本書の枠組みは完成された体系ではありません。本書で述べた形式化、中間表現、エコシステムは、それぞれが進行中の研究テーマで、未解決の問いに満ちています。これは「未熟」ではなく、生きた研究プログラム であることを意味します。

本書を通じて伝えたかったのは、三つの問いに集約されます。第一に、「なぜ」を問い続けているか——多くの学習支援システムは「うまくいく」ことを目標としますが、本書の枠組みは「なぜうまくいくか」を問います。短期的には非効率に見えますが、長期的には科学的知見の累積こそが持続可能な学習支援の基盤となります。第二に、知見を共有できているか——各研究者が独自のシステムを一から構築し、結果を論文で報告するだけでは、車輪の再発明が続いてしまいます。本書の中間表現とエコシステム構想は、この非効率性に応えようとするものです。第三に、技術は誰のためにあるか——AI 技術はしばしば学習者を「最適化の対象」として扱う危険を持ちますが、学習者は能動的な主体です。本書の説明可能性は単なる技術的特性ではなく、学習者の自律性とエージェンシーを尊重する倫理的立場と結びついています (第 17 章)。

読者の皆さんには、本書の「消費者」ではなく「共創者」となっていただきたいと願っています。批判的に吟味し、改善し、拡張し、必要なら根底から書き換えてください。本書の枠組みは、多様な視点と専門性が交わる場であるべきだと、僕は思っています。

学習は、人間の最も基本的な営みの一つです。すべての子どもが、自分の可能性を発揮できる学習機会を持つべきです。本書の枠組みは、そのビジョンの実現に貢献できると僕たちは考えています——しかし技術だけでは不十分です。教師の専門性、教育政策、社会の価値観、すべてが重要です。本書の枠組みは教育の複雑なエコシステムの一部として、理論と実践、研究と現場、技術と人間性を結びつける役割を果たすべきだと思います。

本書で述べたことを、最後に短く三つの命題に圧縮して終わります。形式化は目的ではなく、深い理解のための手段である。中間表現は単なる技術ではなく、知見共有のための言語である。本書の枠組みは固定された方法論ではなく、より良い学習支援への探求である。

この探求は、まだ始まったばかりです。

著者から——読み終えた読者へ

ここまで本書を読んでくれて、ありがとうございました。第 1 章からまっすぐ読んでくれた方も、関心のある章だけを拾い読みしてくれた方も、それぞれの読み方でこの本に時間を割いてくれたこと、心から感謝しています。

まえがきにも書いた通り、本書は LLM をフル活用しながら、僕 (古池) の理解の届く範囲で編んだ「未完成な地図」です。学生たちのために少しでも早く何かを渡したい、という思いで先に世に出しました。書き終えてみると、扱いきれなかった話題、もっと深く論じるべきだった論点、別の角度から書き直したい章が、たくさん残っています。誤りや誇張、出典の取り違えがどこかに残っている可能性も、正直に言って、ゼロではありません。それでも、近接する研究室の学生にも、これから古池研で研究を始める学生にも、認知科学・教育工学・ITS / AIED・LA / EDM・HCI のどこかに自分の重心があるあなたにも、何かしら手がかりが残せていれば、いまの段階ではそれで十分だと思っています。

「ここはおかしい」「これは違う出典だ」「この主張はもう少し丁寧に書ける」と感じた箇所があれば、ぜひ知らせてください。本書はそうしたフィードバックで少しずつ磨かれていく前提で書いています。完成度の高さよりも、地図を更新できるかどうかのほうが、本書の価値を決めます。

本書は「何を研究するか（教育 AI / 学習支援研究の素材・方法・歴史）」に重心を置いた地図でしたが、もう一冊の地図——「どう研究するか（生き方・実践・スキル）」——として、姉妹編「研究の一歩目」を書きました。研究者としての立ち上がり、論文の書き方、メンターとの対話、査読、キャリアといった話題は、そちらに集めています。本書とペアで読んでくれると、二冊が補い合うように届くはずです。とくに最終章「これからの研究者へ」は、これから研究を始めるあなたに宛てて書いた手紙のようなもので、本書の読後にちょうど続く位置にあります。

気になる論点があれば、ぜひ研究室まで連絡をください——批判も、別の見方も、「ここはこう違う」も、すべて歓迎します。本書はそうしたやり取りを通じて、少しずつ書き直されていくものだと思っています。どこかですれ違うことがあったら、あなたの問いがどう育ったかを聞かせてください。喜びも、迷いも、混ぜたまま話してくれて構いません。楽しみにしています。

それでは、ここで本を閉じます。あなたの探求が、よい方向に進みますように。

認知的教育AIの地図