認知とは何か ―認知科学の基礎―

この章で扱う問い

学習を支援するシステムを設計するためには、まず「人間が情報をどう処理し、知識をどう構造化し、問題をどう解くのか」を理解しないと話が始まりません。本章は、第1章で素描した本書の枠組みの「認知」の側を埋める章です。20世紀前半の行動主義から 1950 年代の認知革命を経て現代の認知科学へと至る流れを追いながら、記憶・スキーマ・問題解決という三つの中核的トピックを概観します。最後に、同じ論理的内容でも表現形式が変われば認知プロセスそのものが変わる、という 本書の見取り図にとって決定的な原理を提示します。

ITS や AIED の開発に関心がある読者にとっては、これから学習者モデリングや適応的支援を設計するときの「土台」になる章です。認知科学的な興味から本書を読んでいる読者にとっては、「学習支援工学が認知科学をどう使うのか」という見方を提供します。本章で見る記憶やスキーマは、後の章で診断・支援・評価のあらゆる場面に再登場します。

行動主義から認知主義へ

ブラックボックスとしての心

20世紀前半の心理学を支配したのは、観察可能な行動だけを科学の対象とすべきだとする立場、すなわち 行動主義 です。Ivan Pavlov [Pavlov1927] は、犬の消化に関する研究中、ベルの音(中性刺激)と餌(無条件刺激)を繰り返し対提示すると、犬がベルの音だけで唾液を分泌するようになることを発見しました。この 古典的条件づけ(classical conditioning)は、学習の基本的メカニズムとして広く認められましたが、説明できるのは刺激と反応の連合だけでした。

sequenceDiagram
    participant Bell as ベル(中性刺激→条件刺激)
    participant Food as 餌(無条件刺激)
    participant Dog as 犬
    participant Response as 反応(唾液分泌)

    Note over Bell,Response: 学習前
    Food->>Dog: 提示
    Dog->>Response: 唾液分泌(無条件反応)

    Note over Bell,Response: 学習中(対提示)
    Bell->>Dog: 音を鳴らす
    Food->>Dog: 餌を与える
    Dog->>Response: 唾液分泌

    Note over Bell,Response: 学習後
    Bell->>Dog: 音を鳴らす
    Dog->>Response: 唾液分泌(条件反応)

図2-1: パブロフの古典的条件づけ

B. F. Skinner [Skinner1938] はより能動的な学習メカニズムとして オペラント条件づけ(operant conditioning)を提案しました。スキナー箱のなかでネズミが偶然レバーを押すと餌が出る――この設定から、望ましい行動の直後の報酬が行動を増加させる(強化)、罰が行動を減少させる()、強化が止まれば学習された行動は消えていく(消去)といった一連の法則が導かれます。スキナーの理論はプログラム学習や初期の CAI の基盤となり、いまも一部のドリル型教材に影響を残しています。

しかし行動主義には根本的な限界がありました。心的プロセスをブラックボックスとして扱うため、言語・推論・創造性といった高次の認知活動を説明できず、また同じ刺激でも文脈や既有知識によって反応が異なる事実をうまく扱えなかったのです。

認知革命

1950 年代後半から 60 年代にかけて、複数の分野からの収束的な動きが、心の内部を科学的に研究することを正当化していきました。これが 認知革命 です。

George Miller [Miller1956] は論文「マジカルナンバー 7±2」で、人間の即時記憶の容量が約 7(±2)チャンクであることを示しました。これは情報処理の制約を定量的に示した最初の発見の一つで、心を「処理能力の限界をもつシステム」として論じる道を開きます。同じころ言語学者 Noam Chomsky [Chomsky1959] はスキナーの『言語行動』(1957) を厳しく批判しました。子どもは限られた言語入力から無限の文を生成できる――これは単なる刺激-反応連合では説明できず、生得的な言語獲得装置の存在を示唆する、というわけです。

決定打となったのはコンピュータの登場でした。Claude Shannon の情報理論 [Shannon1948] と Alan Turing の計算理論 [Turing1937] は、「情報」と「計算」という新しい枠組みを提供しました。これによって心的プロセスを「情報の変換と操作」として記述できるようになり、入力(刺激)→処理(認知プロセス)→出力(反応)というモデルのもとで、内部の心的プロセスを正面から扱う 認知科学(Cognitive Science)[Neisser1967] が誕生します。

行動主義と認知主義はあらゆる点で対照的です。両者の違いを整理すると次のようになります。

観点行動主義認知主義
研究対象観察可能な行動のみ内的な心的プロセス
学習の定義刺激-反応の連合形成知識構造の変化・再構成
心の扱い「ブラックボックス」として無視情報処理システムとして研究対象
主要概念強化、罰、条件づけスキーマ、記憶、問題解決
研究方法動物実験、行動観察認知課題、プロトコル分析、脳イメージング
教育への示唆ドリル・反復・即時フィードバック概念理解・構造化・メタ認知

下表に、行動主義から認知科学への転換の主要な出来事を示します。

時代年代研究者・出来事内容
行動主義時代1900–1927Pavlov古典的条件づけ
1913–1930Watson行動主義宣言
1938–1960Skinnerオペラント条件づけ
移行期1948Shannon情報理論
1950Turingチューリングテスト
1956Millerマジカルナンバー7±2
1959Chomsky言語批判
認知革命1967Neisser認知心理学
1968Atkinson & Shiffrin記憶モデル
1972Newell & Simon問題解決
認知科学確立1975–1990認知科学の発展

表2-1: 認知革命のタイムライン

記憶のシステム

人間の記憶は単一の貯蔵庫ではなく、性質の異なる複数のサブシステムから成り立っています。この構造を理解することは、教材設計や課題提示において「いま学習者の心のどこに負荷がかかっているのか」を判断する基礎になります。

多重貯蔵モデル

Atkinson と Shiffrin [Atkinson1968] は、記憶を三つのシステムに分ける 多重貯蔵モデル を提案しました。

  1. 感覚記憶(Sensory Memory):視覚、聴覚などの感覚情報を 1 秒未満の極短時間だけ保持します [Sperling1960]
  2. 短期記憶 / ワーキングメモリ(Short-term Memory / Working Memory):限られた容量(およそ 7±2 チャンク)で情報を一時的に保持・操作します。
  3. 長期記憶(Long-term Memory):ほぼ無制限の容量で、情報を長期間保存します。
graph LR
    A[外部刺激] --> B[感覚記憶<br/>Sensory Memory<br/>容量:大<br/>持続時間:&lt;1秒]
    B -->|注意| C[ワーキングメモリ<br/>Working Memory<br/>容量:7±2チャンク<br/>持続時間:数十秒]
    C -->|符号化・リハーサル| D[長期記憶<br/>Long-term Memory<br/>容量:ほぼ無制限<br/>持続時間:永続的]
    D -->|検索| C
    C -->|忘却| E[消失]

    style A fill:#e1f5ff
    style B fill:#fff4e1
    style C fill:#ffe1e1
    style D fill:#e1ffe1
    style E fill:#f0f0f0

図2-2: 記憶の多重貯蔵モデル

このうち教材設計に最も大きな影響を与えるのが、ワーキングメモリの 容量制約 です。たとえば「3, 8, 1, 9, 4, 7, 2」という 7 桁の数字は多くの人が一度で復唱できますが、「3, 8, 1, 9, 4, 7, 2, 5, 6, 0」と 10 桁になると途端に困難になります。一方、同じ 10 桁でも「090-1234-5678」のように電話番号として意味づけられた瞬間に楽に保持できる。これが Miller の言う「チャンク化」の効果であり、既有知識が情報を意味のあるまとまりに束ねることで、見かけ上の容量制限を押し広げているのです。

ワーキングメモリの内部構造

Alan Baddeley [Baddeley1986] は、短期記憶を単一のバッファではなく、専門化したサブシステムの集合として捉え直しました。音韻ループ は言語情報を内的リハーサルで保持し、視空間スケッチパッド は視覚・空間情報を保持し、中央実行系 が注意を割り振ります。後年(2000年)には、複数のモダリティを横断する情報を統合する エピソードバッファ が追加されました。

このモデルの教育的含意は明確です。複雑すぎる教材は処理しきれず学習を阻害するため、提示する情報量を学習者のワーキングメモリ容量に合わせて設計する必要があります。これは認知負荷理論 [Sweller2011] として体系化され、第7章で改めて取り上げます。

長期記憶の種類

長期記憶もまた一枚岩ではありません。Tulving [Tulving1972] による区分は、教育的な観点からとりわけ重要です。

意識的に想起でき言語で表現できる 陳述的記憶 は、さらに 意味記憶エピソード記憶 に分けられます。意味記憶は文脈から独立した一般的知識で、「パリはフランスの首都」「 は直角三角形の関係式」といった事実が該当します。エピソード記憶は時間と場所に結びついた個人的経験の記憶で、「昨日の夕食」「初めて自分のプログラムが動いたときの喜び」といった出来事として想起されます。これに対し 手続き的記憶 は、自転車の乗り方やタイピングのように、言語化しにくく身体に刻まれた「やり方」の記憶です。

記憶の種類特徴教育的示唆
意味記憶・文脈から独立した知識
・言語化可能
・意識的アクセス
概念の構造化、関係性の明示、スキーマ形成が重要
エピソード記憶・文脈依存的
・個人的な経験
・時間・場所情報を含む
具体的な体験を通じた学習、ストーリーテリング、実践的文脈の重視
手続き的記憶・言語化困難
・自動化される
・練習により形成
反復練習、フィードバック、段階的な技能習得、自動化までの支援

表2-2: 長期記憶の種類と特徴

これら三種類の記憶は、それぞれ異なる学習プロセスと支援を必要とします。概念理解(意味記憶)には構造化と関連づけが、体験的学習(エピソード記憶)には文脈の豊かさが、技能習得(手続き的記憶)には反復と段階的フェーディングが効きます。学習支援システムは、対象とする学習成果がどの記憶に属するのかを意識して設計しなければならない、というわけです。

知識の構造化:スキーマ理論

記憶は受動的な録画装置ではありません。新しい情報は、既有の知識構造に照らし合わせ、解釈され、再構成されて取り込まれます。この知識構造を スキーマ と呼びます。

Bartlett の再生実験

スキーマ概念の出発点は Frederic Bartlett [Bartlett1932] の古典的実験です。彼はイギリスの被験者に「幽霊の戦争」という北米先住民の民話を読ませ、時間をおいて繰り返し再生させました。被験者は物語を逐語的に思い出すのではなく、自分の文化的枠組みに合うように歪めて想起しました。たとえば「カヌー」が「ボート」に置き換わり、超自然的な要素は合理化され、なじみのない要素は脱落していく。Bartlett はここから、記憶が「録音と再生」ではなく既有知識に基づく「再構成」であると結論します。

スキーマの効果は、文脈情報の与え方ひとつでも劇的に現れます。Bransford と Johnson [Bransford1972] は被験者に、衣類を分類して洗濯機に入れ、洗剤を加え、適切な設定を選び……と続く一節を提示しました。事前に「これは洗濯の話です」と告げられた群は内容を容易に理解し記憶できましたが、何の文脈も与えられなかった群は同じ文章を抽象的で意味不明と感じ、ほとんど記憶できませんでした。同じ言語入力でも、活性化されるスキーマの違いが理解そのものを左右するのです。

スキーマの機能

スキーマ(schema)は、概念や出来事や手続きについて構造化された知識の枠組みです。たとえば「レストラン・スキーマ」には、入店して席に着き、メニューを見て注文し、食事をし、会計をして退店するという典型的な流れと、ウェイターやテーブルやメニューといった登場人物・道具、そしてチップを払うかどうかといった文化的規範が含まれます。

このスキーマは少なくとも四つの働きをします。第一に 理解の促進 ――新しい情報を既存のスキーマに統合することで、断片的な入力が意味のある全体として把握できる。第二に 推論 ――明示されていない情報を補えるため、「レストランにはテーブルがある」と聞かなくてもそう想定できる。第三に 記憶の補完 ――欠けている部分をスキーマで埋めるため、ときに実際にはなかったことまで「思い出して」しまう。第四に 注意の誘導 ――スキーマに関連する情報に自然と注意が向く、という働きです。

学習はスキーマの変化である

Piaget [Piaget1952] は学習を二つのプロセスの組み合わせとして捉えました。同化(assimilation)は新しい情報を既存のスキーマに取り込むこと、調節(accommodation)は既存のスキーマそのものを修正・拡張して新しい情報に適応することです。多くの学習は同化で済みますが、既有スキーマでは捉えきれない経験に直面したとき、学習者は調節を迫られます。この同化と調節の動的均衡こそが学習の本質であり、効果的な支援とは、学習者の現在のスキーマを診断し、適切な同化・調節を引き出すことにほかなりません。この見方は、次章でより詳しく扱う構成主義の核となる発想です。

問題解決と推論

知識の獲得と並んで認知科学が中心的に扱ってきたのが、問題解決です。とりわけ Newell と Simon の枠組みは、ITS や ICAI の設計に直接の影響を与えてきました。

問題空間としての問題解決

Newell と Simon [Newell1972] は、問題解決を 問題空間(problem space)における探索として定式化しました。問題は、初期状態、目標状態、状態を変換するオペレータ、そして許される操作についての制約からなります。問題を解くとは、オペレータを適用して初期状態から目標状態への経路を見つけることです。

人間(と古典的 AI)が実際によく使う戦略が 手段-目的分析(means-ends analysis)です。現在状態と目標状態の差異を同定し、その差異を減らすオペレータを選び、適用し、新しい状態でまた同じことを繰り返す。たとえばハノイの塔では、「最大の円盤を目標の柱に移す」というサブゴールを設定し、その前提条件(小さい円盤を別の柱に退避する)をさらにサブゴール化していく、という再帰的構造として記述できます。この見方は、学習者がつまずく場所を「サブゴール構造のどの段階で目的-手段の対応が見えていないか」として特定する手がかりを与えてくれます。第5章の認知タスク分析では、この発想を実際に方法論として使うことになります。

初心者と専門家の違い

Chi らの古典的研究 [Chi1981] は、物理学の問題を初心者と専門家に分類させたとき、両者の分類基準が劇的に異なることを示しました。初心者は「斜面」「ばね」「滑車」といった 表面的特徴 で問題をまとめるのに対し、専門家は「エネルギー保存則が使えるか」「ニュートンの第二法則の問題か」といった 深い構造 ――解くために適用すべき原理――でまとめるのです。

この違いは、専門知識が単なる事実の量ではなく、知識の 構造化スキーマ化 によって特徴づけられることを示しています。学習支援の目標は、知識の量を増やすことだけではなく、表面的類似性に縛られた知識を深い構造に基づくスキーマへと組み替えることにある――この観点は、次章で扱う「転移」の議論にも直結します。

Marr の三つのレベル

David Marr [Marr1982] は、情報処理システムを理解するには三つのレベルを区別する必要があると論じました。計算理論レベル は「何を」計算しているのか、そして「なぜ」それが適切なのかを問います(例:視覚は網膜像から3次元世界を復元する。それは行動に必要だから)。表現とアルゴリズムレベル は、その計算をどんな表現と手順で実現するかを問います(例:エッジ検出 → 輪郭抽出 → 面の認識)。実装レベル は、それが物理的に何によって実現されているかを問います(例:神経回路)。

本書で僕たちが主に扱うのは上の二つのレベル、すなわち「学習において何を達成すべきか」(概念理解、スキル習得など)と、「それをどんな表現とアルゴリズムで支援するか」です。実装レベル――脳神経科学的な機構――は背景に置きつつ、計算理論とアルゴリズムのレベルで支援を設計する、というのが本書の基本的な立場です。

外的表現と認知的道具

ここまで述べてきたのは、心の内側で起こっていることです。ですが、認知は心の中だけで完結するものではありません。紙、図、記号、計算機といった 外的表現 が、しばしば思考そのものを形作ります。本章の最後に、この点を強調しておきたいのです。なぜなら学習支援システムを設計するとは、結局、適切な外的表現を学習者に渡すことだからです。

情報が変われば認知が変わる

同じ問題でも、どのように表現するか によって難易度が劇的に変わります。

例:4 枚カード問題(Wason selection task [Wason1968]

カードの片面にはアルファベット、もう片面には数字が書かれている。「カードの片面が母音なら、その反対の面は偶数である」というルールを検証したい。以下の4枚のカードのうち、ルールが守られているかを確かめるには、最低限どれをひっくり返せばよいか?

[E] [K] [4] [7]

正答率はわずか10%程度で、多くの人は「Eと4」と答えます。しかし正解は Eと7 の2枚です。それぞれのカードについて、なぜ裏返す必要があるのか/ないのかを論理的に整理すると次のようになります。

E は母音であり、ルールの前件を満たします。裏が偶数でなければルール違反となるため、裏返して確認する必要があります。K は子音であり、ルールの前件を満たしません。ルールは子音について何も主張していないので、裏に何があってもルール違反とはならず、裏返す必要はありません。4 は偶数なので一見関係ありそうですが、ルールは「母音 → 偶数」であって「偶数 → 母音」ではありません。裏が子音であってもルールは破られません。後件の肯定(affirming the consequent)は論理的に無効であり、ここで多くの人がつまずきます。7 は奇数なので、もし裏が母音だったとすれば「母音なのに偶数でない」となりルール違反です。裏返して確認しなければなりません。

要するに、必要なのは「前件を満たすカード(E)」と「後件を満たさないカード(7)」を確認することです。これは形式論理における対偶(P → Q と ¬Q → ¬P の同値性)の応用にほかなりません。

ところが、まったく同じ論理構造を日常的な文脈に置き換えると、正答率は大幅に上がります [Griggs1982]

「21歳未満ならアルコール飲料を飲んではいけない」というルールを検証する場面を考えてみましょう。バーで以下の4人を観察できるとして、ルール違反がないかを確かめるには誰をチェックすべきか?

[ビールを飲んでいる] [コーラを飲んでいる] [25歳] [16歳]

正解は「ビールを飲んでいる人」(年齢を確認)と「16歳の人」(飲み物を確認)の2人です。コーラを飲んでいる人や25歳の人は、ルールの前件を満たさない/後件を満たすため、確認する必要はありません。論理構造はカード問題と同型ですが、こちらでは多くの人が直感的に正答にたどり着きます。

抽象的なシンボル(母音/偶数)よりも、社会的規範や因果関係を含む具体的文脈のほうが、人間の推論を強く支えるのです。情報の論理的内容が同じでも、その表現形式が変われば認知プロセス自体が変わる――これは、学習支援システムの設計においても見過ごせない原理です。

認知的道具

外的表現は、人間の認知能力を拡張する 認知的道具(cognitive tools)として働きます。アラビア数字や代数記法は筆算という手続きを可能にし、グラフや概念マップは複雑な関係を一目で把握させ、そろばんや電卓は計算を物理的・電気的に外部化し、シミュレーションは試行錯誤の空間を広げる。Donald Norman [Norman2013] が指摘するとおり、こうした道具は認知プロセスを外部に押し出すことで、ワーキングメモリ容量のような内的制約を補完しているのです。

本書の問題意識からすると、適切な 外的表現の設計 は中心的な課題です。学習者の認知負荷を下げ、深い構造への注意を促し、推論を支える表現とは何か――この問いは第7章および第11章で再び取り上げます。

まとめ

本章では、認知科学の基礎を駆け足で概観しました。

  • 行動主義から認知主義へ:刺激-反応から情報処理へのパラダイム転換。コンピュータ・メタファーが、心的プロセスを科学的に研究する道を開きました。
  • 記憶システム:感覚記憶、ワーキングメモリ、長期記憶の多重構造。ワーキングメモリの容量制約(7±2 チャンク)は、学習設計上の最も重要な制約です。
  • スキーマ:知識の構造化された表現。記憶も理解も推論もスキーマを介します。学習とは同化と調節によるスキーマの変化です。
  • 問題解決:問題空間の探索と手段-目的分析。専門家と初心者の違いは、知識量ではなく構造化の深さにあります。
  • Marr の三つのレベル:本書では主に計算理論レベル(何を学ぶか)とアルゴリズムレベル(どう支援するか)に関心があります。
  • 外的表現:情報が変われば認知が変わる。表現の設計こそ学習支援の鍵です。

次章への橋渡し

本章では、人間の認知システムが「いかなる構造をもち」「どのように情報を処理するか」を扱いました。記憶の多重構造、スキーマによる知識の組織化、問題空間の探索、外的表現の効果――これらは認知の 構造と機能 の話です。

しかし、僕たちの本当の関心は構造そのものではなく、その構造が 経験を通じてどう変化するか、すなわち学習です。スキーマはどう拡張・再構成されるのか。表面的特徴に縛られた初心者の知識は、どんな経験を経て深い構造に基づく専門家の知識へと組み替わるのか。

第3章では、この「変化のメカニズム」に焦点を移します。Piaget と Vygotsky による構成主義、Bruner や Ausubel の教授理論、Bloom のタクソノミー、認知的徒弟制と状況的学習論、メタ認知と自己調整学習、生産的失敗、そして転移――学習科学が積み上げてきたこれらの枠組みを体系化し、本書の関心からの学習環境設計への示唆を引き出します。本章で見た認知の「構造」と、次章で見る学習の「動態」を重ね合わせたとき、どんな認知状態を、どんな経験で、どこに動かすか、という設計問題が立ち上がってきます。

さらに学ぶために

  • Anderson, J. R. (2000). Cognitive Psychology and Its Implications. Worth Publishers.
  • Baddeley, A. D. (1986). Working Memory. Oxford University Press.
  • Marr, D. (1982). Vision. W. H. Freeman.