【書籍まとめ】IQってホントは何なんだ?知能をめぐる神話と真実 / 村上宣寛(富山大学教授)
-----第1章 知能とは何か-----
◆IQの数字に対する信憑性
「私の知能指数は150だ」について
マスコミなどで見る「IQ150」という高得点は、通常に考えるとあり得ない。偏差値で換算すると83となる。標準偏差(得点分布の散らばり)が極端に大きな試験でないと、そのような得点はなかなか登場するものではない。
もしくはそのような場合90%以上の確率で、古代の比率IQ(鈴木ビネー式、田中ビネ-式など)の数字だと思われる。その他、正しい統計がなされていないIQテストである場合など。
◆昔の学者はIQをどう考えたか
・ソーンダイク(心理学者・教育学者。コロンビア大学教授)…真実、もしくは、事実の観点から見て正しい反応をする能力
頭が良い人は多くの結合(コネクション)があり、多くの刺激に対して正しい反応ができる。
・ターマン(心理学者。スタンフォード大学教授)…抽象的思考を遂行する能力。
ターマンはアメリカで知能検査の開発と普及に努めた。作成した「スタンフォード・ビネ検査」は今でも第5版が使用されている。この検査を土台にして、集団式知能検査、陸軍αとβができたし、再びそれらを基にしてウェクスラ式の個別式知能検査もできた。
IQが135を超えた児童を天才児として、1500名以上を35年間も追跡研究し、普通児よりも健康的で情緒が安定していることを示した。
・ボーリング(実験心理学者)…知能とは知能テストが測ったものである。
・学者たちの定義のまとめ
1)知能は、環境への適応力、基本的な精神能力、高度な精神能力(推理、問題解決、決断)と関係がある。
2)1921年と1986年の大きな違いは、知能にメタ認知(知識や認知をコントロールするメカニズム)を含めたこと。
3)知能テストは知能を正しく測っているかというと、もちろん知能の一部しか測っていない。
◆一般の人と、専門家の「知能の捉え方」の違い(1981年、スタンバーグらの調査。新聞広告で集めた素人122名と、博士課程の専門家140名)
・素人の分析
1)実際的問題解決能力
2)言語能力
3)社会的有能さ
の3因子にまとまった。
・専門家たちの分析
1)言語知能 語彙が豊か、よく理解して読む、好奇心を示す、知的好奇心が豊か
2)問題解決能力 手近な問題に知識を応用できる、よい決定をする、問題を最適な方法で提出する、常識がある
3)実際的知能 状況をよく捉える、目標達成法を決定する、自分の周りの世界をよく意識する
の3因子にまとまった。
専門家の知能観は狭い範囲に偏っていたが、素人は社会的な態度まで知能に含めていた。
◆6カ国に共通した「頭のよい人」像(日本、韓国、中国、台湾、カナダ、メキシコ。被験者は大学生3206名)
・6カ国に共通に見られる因子(いずれも素人)
1)共感性・社会性能力 人の立場になって考える、誤りを素直に認める、思いやりがある、人の話をよく聞く
2)対人的能力 ユーモアがある、話題が豊富、話がおもしろい、話し上手
3)判断力・決断力 頭の回転が速い、判断が早い、決断力がある、動作が機敏
4)表現力・センス 字が綺麗、筆まめ、おしゃれ
◆専門家はメタファーで理解する(スタンバーグの要約)
いくつかの見方が存在している。
・地理的メタファー 知能は心の地図であるという見方。知能にいくつの因子があるのか、知能の個人差はどこから来るのか、などを追求する。
・計算的メタファー 知能とは基本的な情報処理プロセスであるという見方。反応時間の分析、プロコトル分析、コンピューター・シミュレーションなどで研究する。
・生理学的メタファー 知能とは神経細胞である、脳である、神経の伝達速度である、という見方。誘発電位、神経の伝達速度、PETやfMRIによる研究が多い。
・発生的認識論的メタファー 知能とはスキーマ(枠組み)であるという見方。操作の数学的構造を研究する。
・人類学的メタファー 知能とは文化が発明したものであるという見方。文化的文脈と個人の交互作用が研究対象。
・社会学的メタファー 知能とは社会化であるという見方。思考も社会的相互作用が内在化したものである。
・システム的メタファー 知能とは地理的、計算的、生理学的、人類学的、社会学的なレベルを総合した複雑なシステムであるという見方。
◆コーシーニの心理学百科事典では
「知能の測定」という項目にて
知能は適用範囲の広い学術用語で、個人の複雑な精神能力に関連している。
素人には、頭の回転の速さ、学業成績、職業上の地位、特定分野での傑出などを意味する。
知能を測定する心理学者には、利用できる知識の量、新しい知識を獲得する速度、新しい状況に適応する能力、概念、関係性、抽象的な記号を操作する能力、さらに端的には「知能テストが測定する現象」を意味する。
-----第2章 知能を測る-----
◆精神テストの誕生
ヴントの着想を受け継ぎ、初めて科学的に知能を測定しようとしたのはゴールトン。
ゴールトンは進化論で有名なダーウィンの従兄弟。祈祷には効能がないことを証明し、意志の自由についての個人実験(自分自身を被験者にした実験)を行ったり、宝くじの憶測の散らばりを研究。音楽家、科学者、政治家などが一つの家系にまとめる傾向を見つけ、これを遺伝の影響とみなし、1869年に「遺伝的天才」を執筆。
ゴールトンは遺伝的に優れた男女を選んで結婚させれば、優秀な民族が創造できると考えた。犯罪者などは断種し、移民を制限すべきであると主張した。悪名高い「優生学」の創始者となった。
ゴールトンの精神テストを整理し完成したのは、アメリカのジェイムズ・キャテル。10個のテストで構成。
(知能と関係するのは最後の文字数くらい。ほとんどのテストは頭の良さと関係ない。)
握力 意志の力や情緒的興奮の程度を測定
右腕の敏捷性
感覚閾 皮膚の2箇所をとがった針で刺激する。接近した場所を刺激すると1箇所と感じる。その離れた2箇所の最低の距離。
痛覚閾 痛覚の鈍い人は頭が悪いと考えた。
重さの弁別閾
音に対する反応時間
色の名前を言う時間
50センチの直線を2等分する正確さ
10秒間の時間判断
一度で報告できる文字数
◆知能テストの誕生
「ビネシモン検査」
フランスのビネは、知能は非常に複雑であるので、反応時間などの単純な課題で測定できるはずがないと考えた。
ビネの目的は知能の測定ではなく、精神遅滞児の識別であったため、様々な内容を含める必要があった。
4歳の子どもが失敗し、5歳の子どもが正しく回答できる問題を試行錯誤した。更に子どもの集中力を考えると、検査は20分が限界だった。
「ビネ・シモン検査」は改訂され、1世紀にもわたり使い続けられた。
・目と頭の協応 火の付いたマッチを目の前でゆっくりと動かし、頭と目が協調して動作するかを調べる。
・触覚による把握 小さな木のかけらを触らせ、それが握れるか。
・視覚による把握 小さなモノを見せて、それが握れるか。
・食べ物の認識 チョコレートと木のかけらを見せて、視覚だけで食べ物がわかるか。
・食べ物の探索 キャンディかボンボンを見せて、目の前で紙に包む。包の中に食べ物があるとわかりか。
・簡単な指示の実行 よく見るように支持を与え、手を叩いたり足を上げたりして見せる。それが真似できるか。
・物の認識 「あなたの頭はどこですか?」と頭、髪の毛、目、足などの意味がわかっているか。
・絵の認識 窓、お母さん、姉、妹、ネコなどの絵を見せて「窓はどこですか」などと尋ねる。現実のものを絵に置き換えてもわかっているかを調べる。
・2本の直線の比較 3センチ4センチの直線を見せて、どちらが長いかを問う。
・3つの数字の復唱 3,0,8とか5,9,7など、3つの数字をゆっくりと読み上げて、復唱できるかを調べる。
・2つの重さの比較 3グラムと12グラム、6グラムと15グラムなど、重さが違う大きさの同じ箱を見せて、重い方を報告させる。
・暗示への抵抗 例えば、机の上の糸、裁縫用指ぬき、コップを見せて「ボタンはどこですか」と尋ねる。
・知っているものの言葉による定義 家、馬、フォーム、お母さんとはどういうものか、言葉で説明させる。
・文章の復唱 15単語からなる文章を読み上げ、復唱させる。注意力や短期記憶を調べる。
・記憶に基づく知っている物の比較 紙とボール紙、ハエとチョウチョ、木とガラスの違いを説明させる。
・絵の記憶 時計、カギ、爪などの13枚の絵を同時に見せて記憶させ、30秒後に何があったか名前を言わせる。
・3つの数字の復唱ミス 3つの数字の復唱課題と同じ。ここではミスを丹念に記録する。精神遅滞児と健常児ではミスの中身が違う。
・記憶に基づく幾つかの物の類似性 ケシの花と血の類似性、ハエとアリとチョウチョとノミの類似性をなどを言わせる。
・直線の比較 3センチと3.1~3.5センチの直線を15対、違いの大きな物から見せて、どちらが長いか言わせる。
・5つの重なりの並び替え 3,6,9,12,15グラムの四角い箱を重さの順に並び替える。
・重さの記憶 前問で正解した時、子どもに目を閉じさせて、重りを1つ取り去る。どの重りが取られたかを調べさせる。
・韻の練習 韻の説明をして、ある単語と韻の合う言葉を言わせる。
・文章の穴埋め 単語がかけている文章を見せて、ふさわしい単語を入れさせる。例:空は○○○など。
・3つの単語の合成 単語を3つ見せて意味のある文章を作らせる。例:パリ、川、富など。
・抽象的な質問への回答 「よい助言が必要なとき、何をすべきですか?」など4つの問題を出す。
・時計の針の逆転 時計が正しく読めることを確認してから3時15分を示して、短針と長針を入れ替えると何時になるかを聞く。
・4つ折りの紙の切断 紙を4つ折りにしてハサミで切る。どんな形に切られたか推理させる。
・抽象後の定義 尊敬と友情など、抽象的な言葉の違いを説明させる。語彙能力を調べる。
3歳から13歳の健常児のデータを多く収集し、特定の年齢での正解率を75%にした。つまり、6歳児の75%ができた問題を6歳児用に割り当てた。
児童がどの年齢用の問題までできたかにて、精神年齢が割り出せた。
◆知能指数IQ概念の登場
スピアマンは知能が一般知能gと特殊知能sから構成されるという数学モデルを提案した。
アメリカでビネ・シモン検査を改良し、本格的に普及させたのはターマン。
ターマンは1916年に「知能の測定」を出版した。これが最初のスタンフォード・ビネ検査であった。検査問題は90項目。
その後、2003年まで改訂され続け、現在でも知能テストの1つの標準として使用されている。
ターマンは知能指数IQの概念を提案した。
IQ=精神年齢/暦年齢×100
例:3歳の子どもが5歳用の問題までできたとすると、IQ=5/3×100=167
と天才に該当するIQになってしまう。
この計算は、今や化石としてのIQの概念となっている。
ウェクスラは1939年にウエクスラ・ベルビュー知能テストを開発したときに、このIQ概念の不合理性を指摘し
IQ=テスト得点/所定の年齢で期待される平均得点×100
とした。
この式も現在は使われていない。基準得点からの差異はわかるが、平均からの差異はわからないため。
1960年、スタンフォード・ビネ検査は知能指数の標準得点化に踏み切った。
ウエクスラ式知能検査も1981年から標準得点に変更された。
IQ=(テスト得点-所定の年齢で期待される平均得点)/所定の年齢での標準偏差×15+100
これが現在最も使われているIQの定義式である。
-----第3章 知能は幾つあるのか-----
心理学は学問として成立して、100年程度でしかない。
当初、心理学は哲学と同様、検証手段のない学問だった。
現在は、科学的なデータと検証手段がある。しかし残念ながら、たった一度のデータ収集や分析で結論が得られることはない。
被験者集団、データの収集法、分析が違うと結論が異なってしまうから。
◆スピアマンの一般知能
スピアマンは教科間の成績の相関がプラスになることに注目し、相関関係が2つに分解できることに気づいた。
一般知能gと、数多くの特殊知能s1、s2、s3などの和からなるという2因子説を唱えた。
一般知能gは知的なすべての課題に影響する因子で、特殊知能sは課題ごとに異なる特殊な因子である。
◆サーストンの基本能力因子
サーストンは数学や光学を学んだ後、心理学に転向した。
1938年、57のテスト間相関行列を因子分析した結果、7つの「基本的精神能力」因子を取り出した。歴史的に有名。
・言語理解力 語彙能力に大きく関係する能力。読みの理解力や言語の類推力にも関係する。
・語の流暢さ アナグラム(意味がわかるように文字を並べ替える遊び)や特定のカテゴリーに属する単語(Sで始まるものは?)をどれだけ早く言えるかに関係する単語能力。
・空間能力 立体を回転したり、分解して、どのような形になるのかに関係する視空間能力。
・連想記憶 無関係な2つの事柄を機械的に記憶する能力
・知覚速度 視覚図形の細部の異同をチェックするような事務能力。
・帰納的推理 数の系列を見せて規則を発見する能力。
一般知能gを上位の因子として、その下に7つの因子が並び階層構造を仮定した。
スピアマンとサーストンの結果は、見方の違いという程度に落ち着いた。
◆ギルファドの立方体モデル
ギルファドは、初期のテーマは知覚心理学、心理尺度であったが、後に知能や性格の研究を行った。
日本では「精神測定法(1936年)」で有名になった。YG性格検査は、ギルファドの性格検査から抜粋したものである。
知能は1つの大きな因子ではなく、サーストンのように数多くの独立した因子から構成されると確信した。
1956年、ギルファドは、知能が「内容」と「所産」と「操作」の3次元からなると考えた。
そして
内容は「図形」「シンボル」「意味的」「行動的」の4種類。
所産は「単位」「クラス」「関係」「システム」「変換」「含意」の6種類。
操作は「評価」「収束的思考」「発散的思考」「記憶」「認知」の5種類。
しかしギルファドのこの構造モデルは、ほかの研究者にとっては十分確認されていない。
-----第4章 新しい知能理論-----
新しい知能理論について、日本語でのまとまった紹介はこの本が初めてだろう。
◆キャテル-ホーン-キャロルの知能理論
レイモンド・キャテルは、著名な心理測定家で性格、学習、知能、創造性の領域で、非常に多くの論文と著作を残した。
キャテルの知能理論で有名なのは、知能が
・流動的知能Gf 生物学的側面のgで、成人以降は減退する。空間能力や速度に関する知能。
・結晶的知能Gc 教育や文化の影響を受けるgで、年齢を重ねても減退せず、むしろ上昇する知能。
の2つの因子から構成されると考えたこと。
「流動的知能」と「結晶的知能」の相関は0.5程度もあるので、上位因子として「一般知能g」が見出される。
流動的知能Gfは18−28歳が最も高く、加齢とともに減退。
結晶的知能Gcは18−20歳からもゆっくり上昇し続けた。
一般的視覚化機能は21−28歳が最高点であった。
◆知能因子分析的研究の集大成がCHC理論
一番上位の第3層には一般知能g… 知的能力すべてに関わる因子。スピアマンのgと同じ概念。
その下の第2層には16の一般的な因子が確認。
さらに下の第1層には特殊な因子がある。
・流動的知能/推理Gf
自動的に処理できない新しい問題を、じっくりとよく考えて解決する高度な知的操作。推理を図に書いたり、概念を作ったり、分類したりと、様々な能力が含まれる。基本的には文化に制約される非言語的能力である。
一般的演繹的推理、帰納的推理、量的推理、ピアジェ的推理、推理速度、の因子がある。
・結晶的知能/知識Gc
特定の文化から得た言語の知識や、情報の蓄積の幅や深さを表す能力である。語彙の理解力などはこの典型である。
言語発達、語彙の知識、聴く能力、一般的言語情報、文化の知識、コミュニケーション能力、発話能力と流暢性、文法的感受性、外国語能力、外国語適性、の因子がある。
◆ガードナーの多重知能理論 (現在では疑わしいとされる理論)
ガードナーは、ハーバード大学で社会心理学と発達心理学を学び、1971年に博士号を取得。現在はハーバード大学の教授である。多数の論文と書籍を知っぽつし、23冊が20ヶ国語に翻訳されている。
ガードナーによれば、知能は問題を解決したり、何かを創造したりする能力である。知能は領域固有の能力で、文化に規定される。
一般知能gという概念は不適切で、少なくとも8つ(初期は7つ)の独立した能力があると考えた。
・言語的知能 言葉や言葉を探求する情熱、これらを習得し、愛する能力。
・論理-数学的知能 物質や抽象的なものに取り組み、その関係や原則を認識する。
・音楽的知能 曲を作ったり演奏する能力や、音楽を聴いて認識する能力。
・空間的知能 知らない道を歩く能力や、建築家が設計図を見て、立体的に認識する能力。
・身体運動的知能 ダンス、手術など、複雑な体の動きを遂行する能力。
・人間関係的知能 他人に対する共感性や直感などの社会的技術。
・個人内的知能 事故の理解と洞察、その問題解決への応用。
・博物学的知能 自然の物体を認識し、分類する能力。
ただしガードナーの挙げる根拠はかなり疑わしい。
特殊な例外や異常例からの主観的推論が大部分である。
また、一般知能gの存在については多くの証拠があるので、否定できない。
◆スタンバーグの三頭理論
スタンバーグはイェール大学を卒業する時、最優秀賞を受け全米の優等学生友愛会の終身会員となった。知能の研究を情報処理的モデルから始めた。
例えば、メガ・ソサイエティ(IQ175以上の人の会)を見ても、分析的な知能が優れているだけで、創造的ではなかったと感じた。
最終的にスタンバーグは、知能には「分析力」「創造的能力」「実際的能力」の3つのバランスが重要であると考えて、次に示すような三頭理論を提案した。
・分析的知能 知能の基礎となる情報システムで、メタ成分、実行成分、知識獲得成分がある。
-メタ成分 問題解決を効率的に実行する成分。知能の高い人は問題解決の際に、より上位の全体的な計画や戦略に多くの時間を費やし、問題に固有の下位の計画には少ししか時間を費やさなかった。
-実行成分 問題の解決に固有の成分である。成分の例として、短期記憶や三段論法的推論がある。
-知識獲得成分 問題解決に必要な知識を学習したり獲得する成分である。知能の高い人は、言葉の意味をその文脈とともに理解している。そのために、語彙も豊富。知識獲得成分を測定するには、語彙能力テストが最も効果的である。
・創造的知能 経験的知能とも呼ぶ。新しい仕事をどれだけ効率的に遂行できるかを示す知能である。知能の高い人は、新しい情報をよく理解して、選択的に処理する能力が優れていた。また、意識的で計画的な処理から、無意識的で自動的な処理へ移行するのも速かった。
-新しさを処理する能力 知能は既存の問題を処理するだけではなく、新しい事態において学習し、考える能力でなければならない。
-情報処理を自動化する能力 何度も遭遇する事態に対して、ルーチン化、あるいは自動化する能力がある。
・実際的知能 文脈的知能とも呼ぶ。自分の生活に関連した現実世界から選択・形成・適応する能力である。分析的知能のメタ成分、実行成分、知識獲得成分の現実世界に対する応用である。
-適応 周りの特定の文化に適応する技術。
-選択 自分の才能や興味に合う環境を選択する能力。知能の高い人は、自分の能力や興味に適合した職業を選択して、成功を収める。
-形成 選んだ環境が自分の能力と十分に適合しない場合でも、その環境を改変し、自分に適合させる能力。
例)従業員が上司のやり方を買えるように説得し、職場架橋を改善する場合など
スタンバーグの主張する基本的な知能成分がすべて確認されたわけではない。
しかし、スタンバーグはSTAT(三頭能力検査)を作成し、教育場面での検証を次々に行っている。
2002年の研究は、小学生、中学生、高校生と参加者のバリエーションが大きく、総数も1,300名以上と大規模。
この研究の結果、三頭理論の教育効果はハッキリと実証された。
◆知能理論はどこに向かうのか
キャテルーホーンーキャロルのCHC理論は、最も実証性が高いが、日本ではほとんど知られていない。
アメリカ、ヨーロッパで優れた理論が展開されても、それを直ちに日本では応用できない。特に、テスト関係は文化的バイアスがあるので、テスト問題を作り直し、再標準化するという手間が必要。
日本の心理学者は文化系に偏っていて、知能テストや心理テストに嫌悪感を抱く人が多い。
知能指数(一般知能g)は差別である、と発言しておけば、日本では居心地がいい。
-----第5章 知能テストはどのようなものか-----
知識問題と一般知能gとの相関は、0.8程度もある。
ウェクスラが1939年に開発したウェクスラ式知能検査も日本では広く使わている。
その後改訂が続き、2003年にWISC-Ⅳとなった。
成人用はWAISで、1991年にWAIS-Ⅲとなった。日本版は2006年にようやく発行。
幼児用のWPPSIは、2002年にWPPS-Ⅲとなった。日本版は1969年に出たが、その後放置されたまま。
情報処理的アプローチによる児童用の知能検査では、カウフマン夫妻によるK-ABCがある。1983年出版され、2004年にK-ABC-Ⅱとなった。日本版は1993年の初版のまま。
こんなにタイムラグがあるのは、検査問題を日本の文化に合うものと差し替えて、正答率などを調査する必要があるから。標準化集団の大きさは2,000名程度。各年齢ごとに、相当数が必要。
◆個別式知能テストから集団式知能テストへ
個別式・・・ビネ式知能検査は、1人1人の児童を面接しながら問題を与えて回答を記録する。そのために能率が非常に悪かった。
集団式・・・本格的に開発されたのは、ヤーキスの指揮下、第一次世界大戦の時。彼がハーバード大学で取り組んだテーマは、動物の学習。その後、軍隊に入隊する召集兵のち脳が測定できたら、上級将校は将校の人材を探し出しやすいだろうと。
集団式知能テストは、オーティスのアイデアに負っている。陸軍α式とβ式であり、総計172万7,000名に実施。
◆陸軍α、βおよびビネからウェクスラ式へ
ウェクスラは、心理学の歴史家として有名なボーリングと出会った。ボーリングはヤーキスが組織した委員会のメンバーだった。
ウェクスラは、当時の知能検査は子供の知能評価には向いているが、成人には向いていないことに気づいた。
IQ=テスト得点/所定の年齢で期待される平均得点×100
とし、現在の標準式となっている。
ウェクスラはほとんどテスト問題を作らなかった。
ビネ尺度や陸軍αとβ検査のような初期の成果を大部分参考にしたものであった。
◆WAIS-Ⅲの問題構成
WAIS-Ⅲは言語性検査が7種類、動作性検査が7種類あり、計14種類のテスト問題から構成。
・言語性検査
知識 学校で学ぶような一般的知識。例:問題例を挙げると「空気の主な成分はなんですか」など。
数唱 検査者は一連の数字を1秒に1つの速度で読み上げる。受験者はそれを順にまたは逆に繰り返す。
算数 小学校程度の算数問題で「時速15キロの自転車で35キロ走るのに何時間かかりますか」など。
理解 日常の実際的知識や社会ルールの問題。例:「靴を履くのはなぜですか」など。
類似 2つの単語の共通性を指摘させる。例:「服と靴下とではどんなところが似ていますか」など。
語音整列 検査者は数字と文字を順に読み上げる。受験者はそれを数字と文字を別々の順に並べて答える。例:「5 の 2 お」とあれば「2 5 お の」。
・動作性検査
絵画完成 絵を見せて欠けている部分を指摘する。例:「時計の絵があって短針がない場合」など。
絵画配列 受験者は絵のカードを数枚見て、それを物語の順に並べる。
積木模様 二面が赤、二面が白、二面が赤と白の塗り分け(三角形)になっている立方体を使って、できるだけ早くモデルの模様を作る。
組み合わせ パズルの一種で、厚紙でできた顔や象などの絵画がバラバラにされている。それをだきるだけ早く組み合わせて完成させる。
符号 1-9の数字と様々な記号がペア示されている。受験者はそのペアを覚える。次にランダムにたくさんの数字が出るので、その下に対応する記号をできるだけ早く記入する。
行列推理 様々な図形が3行3列に配列されているが、1箇所だけ欠けている。受験者は縦、横の配列の規則を読み取り、欠けた部分の図形を選択する。
記号探し 受験者は左の2つの見本記号と、右の5つの記号を見比べて、同じものがあるかないかをできるだけ早く判断する。
因子分析法で、WAIS-Ⅲのテスト問題を整理してまとめただけのもの。
知能因子を集大成した「キャロルのCHC理論」から見ると不完全。
【CHC理論の知能因子を、WAIS-Ⅲのテスト問題から推定する場合】
CHC理論では知能に16の一般的な因子があるので、そのうちの5つはWAIS-Ⅲによって推定可能。
しかし残りの11の知能因子は測定できていない。
◆日本版WAIS-Ⅲは大丈夫か
今まで広く用いられていたWAIS-Rの問題点は、
・第三者が納得するような妥当性研究がないこと
・絵画完成、絵画配列、組み合わせ検査は信頼性係数が低く、問題の改良が必要なこと
・各検査問題の年齢群ごとの平均値や標準偏差という基礎的資料が提供されていないこと
・解釈マニュアルが存在しないこと
など。
その後の2006年の日本版WAIS-Ⅲの問題点
・絵画完成と絵画配列の検査問題は、新規の問題が増えて信頼性係数が向上した。しかし、組み合わせ検査は信頼性係数が低いまま。
・各年齢群の素点の平均と、標準偏差という基本的な統計量が公開されていない
・因子分析を用いた内容的妥当性の研究はあるが、学力や社会的地位を予測するという証拠はない。
・実施・採点マニュアルは存在するが、解釈マニュアルが存在しない。総合IQや各検査得点は出せるが、定まった解釈法がないので利用困難である。
-----第6章 頭の大きさと回転の速さ-----
◆頭の大きい人は賢いか?
1906年、パールによる最初の科学的研究。
相関係数の平均は0.19=頭の大きさと頭の良さには弱い相関がある。
ただし決定係数(影響力)に直すと4%に満たない。
ヴァーノンらは(いつの調査か不明)らは、
CTやMRIによる「脳の容量とIQとの関係」の14の研究、延べ716名の被験者をメタ分析して、0.35の相関を得た。
2005年、マクダニエルは延べ1530名による
推定では、「脳の容量とIQ」の相関は0.33だった。
大きな脳を持つ人はIQが高い傾向があるが、その影響力は10%程度。
◆頭の回転の速さとは?
単純反応時間(反応の遅れ)と知能の相関は、マイナス0.31
選択反応時間(反応の遅れ)と知能の相関は、マイナス0.49
中程度の相関(逆相関)が確認された。
反応時間から知能得点への回帰分析では、
単純な反応時間の影響力で10%、選択反応時間で24%。
これらにより、反応時間と知能との関係は、無視できない大きさである。
◆点検時間も相関あり
2001年にクルードニクとクラーンツラが今までの研究90以上をまとめてメタ分析を行った。被験者総数は4,197名。
「点検時間とIQの修正済みの相関」はマイナス0.51と中程度の相関。
視覚課題ではマイナス0.49、聴覚課題ではマイナス0.58、やはり中程度の相関。
ただし、「点検時間と一般知能g」には密接な関係がある、とされている。
-----第7章 年をとると知能は衰えるのか-----
心理学による発達研究には「横断的方法」「縦断的方法」「コーホート研究」の3つの研究法があり、それぞれ長所と短所がある。
・横断的方法
ある時点での幾つかの年齢集団のデータを採り、比較する方法。
グループ1 10歳、グループ2 15歳、グループ3 30歳、・・・など。
学術雑誌の研究論文など、ほとんどはこの横断的方法。コストもかかりにくい。
しかし重大な欠点がある。10歳の人が育ってきた環境と、20歳、30歳の人の育ってきた環境とは大きな違いがある。
この時代効果を調査結果から分離できない。
・縦断的方法
ある特定の集団を5年、10年、20年と追跡して調査し、比較する方法。
グループ1 10歳→15歳→20歳→30歳→・・・など。
特定個人の変化が追跡できるので、因果関係の推定が可能。
しかし問題は研究コストで莫大な時間と労力がかかる。
調査方法も変わってくる可能性があり、また何回も繰り返すテストでは「記憶」や「学習効果」が出てしまう。
・コーホート研究
幾つかの年齢集団を何年かにわたって追跡的に調査研究する方法。
グループ1 10歳→15歳
グループ2 15歳→20歳
グループ3 20歳→25歳
各グループを単独で分析すれば、年齢効果が測定できる。またグループごとを比較すれば時代効果が測定でき、分離できる。
しかし研究コストは縦断的研究とさほど変わらない、研究例は少ない。
◆知能は果たして衰えるのか?
1)ウェクスラによる研究
1939年の標準化データでは、ピークが20-24歳にある。
1955年の標準化データでは、ピークが25-29歳にある。
双方ともその後、加齢とともに直線的に減退し、70歳ではIQは20点以上低い。
高齢者にはスピードの点で不利と考えたので、知能テストを「時間制限法」と「時間無制限法」で実施し比較したが、評価点で1点以下の違いしかなかった。
そうすると、スピードの衰えということでは説明ができず、確実に知能は衰えるといえた。
・言語理解 加齢とともに上昇し、40-70歳代の間に緩やかなピークがある。
・作業記憶/知覚統合/処理速度 いずれも加齢とともに減退する。
特に動作性知能が22歳から88歳まで、一貫して直線的に減少している。22歳でIQが100でも、88歳ではIQが75前後にまで減退するという推定値。
◆生存率調査の衝撃
穴ディーン大学のウェイリとグラスゴー大学のディアリは、1999年に60年以上前のテストデータから、追跡調査を開始。
1921年生まれの550名、1932年生まれの280名。
「11歳の時のIQは、その後の人生にどんな影響を与えたか?」
・IQは生涯にわたって比較的安定していた。
1932年と1998年の相関は、0.73(66年間のギャップを考えるととても高い数値)
小さい頃に頭のよかった人は、老人になっても頭がよい可能性が高い。
・IQの高かった人は長生きし、低かった人は早く死ぬ。
この傾向は女性で目立つ。
・IQが高い人は、精神障害にもかかりにくい。
IQが16点低下するごとに精神科を訪れるリスクが、12%ずつ増加。
→その他から、頭のよい人は健康的な環境や行動を選び、その結果、長生きする。
◆年齢によって何が減退するのか
サートルハウスは「情報処理速度の低下」が原因、という。
「年齢と情報処理速度の重み付け」相関は、0.52。
メタ分析としては非常に大きな値で、少人数のサンプルでも確認されている。
「情報処理速度の低下」は、記憶、推理、視空間認識など、スピードが要求されない認知的課題にも大きな影響を与えていた。
ミエリンの消失に伴う、神経伝達速度の低下、神経細胞の消失、神経結合の喪失など、様々な要因から知能の低下が起こる、と考えられる。
一方、サートルハウスは、ニューヨーク・タイムズのクロスワード・パズルを使い、20歳代から70歳代まで、各年代200名程度に実施した4つの研究を行った。
成績は、年齢とともに直線的に上昇していた。
言語には、脳のハードウエアの劣化を補うような仕組みがある様。
「複雑な言語課題」や「現実的な能力」は年齢とともに上昇する。
-----第8章 遺伝で知能が決まるか-----
ゴールトンは、従兄弟のダーウィンの「種の起源」に影響され、家系のデータを収集した。
優れた男女を結婚させれば、優秀な民族が創造できると考えた。優生学である。
ダーウィンの家系には天才的な人が何人も排出したし、音楽家、数学者の家系でも同様であった。
ただし音楽家の家に生まれれば、音楽の早期教育を受けるだろう。数学者でも、美術家でも同様。
その後、双生児研究が登場。
「遺伝子の影響力(加算的に働く遺伝子の影響力)+(優勢遺伝子の影響)+(遺伝子同士の交互作用)」
と
「環境の影響力’(共有環境の影響力)+(非共有環境の影響力)」
で現在のIQを示すことができる。
(行動遺伝学の書籍の記述と、考え方は基本的に同じ)
家族研究や双生児研究では、
IQに対する遺伝の影響力が年齢とともに上昇し、環境の影響力がゼロ近くにまで減少する。
-----第9章 知能の人種差と男女差-----
1987年のフリンの論文は衝撃的だった。
14カ国のIQデータは、1世代で5-25点も上昇。
1世代を30年、中央値を15点とすると、30年で15点の上昇である。
平均100点の知能テストは、30年後に子供の世代が受験すると、平均115点になってしまう。
◆なぜIQが上昇するのか
我々は1世代くらいでは賢くならない。遺伝子も変化しない。それでもIQはどんどん上昇する。
つまり、IQの値を決定するのでは遺伝子だけではなく環境が左右する。
レイブンのマトリックスでは、流動的知能の一種で「一般的な問題解決に関係する得点」の上昇が著しい。
ウェクスラ式では、結晶的知能の一種で「学校などでの学習の結果を反映する得点」の上昇が中くらいである。
しかし、算数、知識、語彙、理解などはほとんど上昇していない。
アメリカの学校教育は、1950年代から「なぜ」を強調し、認知的な問題解決能力を要求した。
流動的知能が上昇したのは、このような社会的な変化の結果であると考える。
◆IQの男女の差
複数の調査で、男女の平均IQにはほぼ差がないことがわかった。
ただし、得点分布は男の標準偏差が大きく、IQ50-60や、130-140という分布の両端では、男が女の1.4倍多かった。
学習障害者、また学校でのトップクラスの成績保持者に、男が多いことを実証的に説明するデータである。
統計的に男が優れている点
・視覚的作業記憶を使って変換する課題。メンタルローテーションという、線画の立体図形をディスプレイで見せて、一定の角度回転させると、どの図形になるかを選択法で回答させる課題で、男性が非常に優れている。
・対象物を動かす課題
・目標が含まれる運動課題。例:ボール投げ、ダーツ。
・一般的な知識領域、地理的知識、数学と科学の知識。
・数学や科学領域での流動的推理能力。例えば、比例の推理、数学の学力試験、機械的推理、言語による類推、科学的推論。
男が特に優れているのは、視覚的な空間能力。
またセンター試験のようにマークシート式の場合、男に有利に働く様。
統計的に女が優れている点
・長期記憶から音韻的、意味的情報を素早く取り出す能力。例:言葉の流暢性、同義語の表出、連想記憶、多くの記憶課題、スペリングとアナグラム、数学の計算、空間的な位置の記憶、香りの記憶。
・文学や外国語の知識。
・複雑な詩の執筆や理解力。
・精密な運動課題。例:鏡を見ての追跡課題。穴にコマを差し込むゲームの課題。
・知覚的速度。埋め込まれた文字を探す課題。
・非言語的コミュニケーションの理解力。
・知覚の範囲。触覚や味覚や嗅覚は敏感。
女は一般的に言語能力が秀でている。
男性が優勢なのは、空間認知(0.44)、メンタル・ローテーション(0.56-0.73)、機械的推論(0.76)、
女性が優勢なのは、スペリング(-0.45)、言語能力(-0.40)、
-----第10章 知能テストと勤務成績-----
公務員には一般知能問題がある。
学力と知能は高い相関があるので、一般知能問題も一般知能gを測っているかもしれない。
シュミットとハンターは、85年間の研究をメタ分析した。
515の職業、被験者総数3万2000名という大規模な分析である。
予測的妥当性(勤務成績との相関関係)を算出。
知能テストの予測的妥当性は0.51。予測という点は不十分(中程度)であるが、心理テスト関係では最大値に近い。
仕事内容が高度になるにつれて、知能のウエイトが増すという結果だった。
面接も意外に妥当性が高い。
「構造化面接」というのは、面接者のセリフがあらかじめ完全に決まっているもので、この場合は妥当性が0.51と高い。
「行動の一貫性評価」は、過去の仕事ぶりから将来の仕事ぶりを予測するもの。面接で、過去にどんな仕事ができたかを詳しく聞き、その結果を点数化する。これも0.45と比較的高い。
仲間の評価は、同じ仕事をしている仲間が評価するもので、実施上の制約はあるが、妥当性は0.49と高い。
統合テストは、飲酒や薬物、ケンカ、盗み、怠慢など、望ましくない行動を測定する病理的な心理テスト。妥当性も0.41と比較的高い。
経営者やセールスマンは、外向性と協調性が必要と言われているが、メタ分析の結果は、外向性0.12、協調性0.02と非常に小さかった。
過去に受けた訓練や経験を得点化する評価法、教育年数、興味は、勤務成績とほとんど関係がない。筆跡と年齢はまったく妥当性がないという結果。
◆リクルートグループのSPIの予測力は小さい
管理者適性検査(NMAT)の、予測的妥当性は0.25-0.3の間であり、アメリカの知能テストの0.51と比べかなり見劣りする。
CHC理論の枠組みで考えると、流動的知能の一部の知能因子しか見れていない。一般的知能gとの関係が小さいと思われる。
SPI2は、2002年にSPIの性格類型の尺度を削除して、改訂したもの。
内容は、性格検査と、基礎能力検査(GAT)、実務基礎能力検査(RCA)、事務能力検査(NCA)からなる。
ただし、GATの妥当性が低く、一般知能gを正しく測定している証拠がどこにもない。
NMATやGATが、一般知能gを十分に測定していないという仮説が成り立つ。
よい知能テストを作るためには、頭の良い人と悪い人をよく弁別するテスト問題を収集すればよい。
現在では妥当性が高い「CHC理論」で確認された知能因子の過半数をカバーするように。
妥当性の高いテストが開発されれば、選抜の成功確率が高まるので、企業の利益は大きくなる。
現在では予測的妥当性を検討して依頼している人事部は皆無だろう。
-----付録A 統計知識の補足-----
◆相関係数の意味
効果量 0.1以下はゼロに近い、0.11-0.35は小さい、0.36-0.65は中くらい、0.66-1.00は大きい、1.00超は大きいと評価する。
数学の点数がよい生徒は、国語の点数もよいことを表している。
相関係数は比較的大きいといえる。
しかし、数学の点数がわかったから国語の点数も推定できるとは、とてもいえない。
相関係数が0.80の場合、数学と国語の成績には強い関係があり、相関係数は大きいと表現できる。
右上の「選抜者集団」では常に相関係数が低くなる。
・相関係数がマイナスの場合は、数学ができると国語ができない、というパターンで右下がりの散布図となる。
・相関係数の2乗を決定係数といい、分散や影響力の指標である。
数学と国語の相関係数が0.5だと中程度の大きさで、関連が強いように思えるが、科目の影響力としては25%にすぎない。残りの75%は他の要因である。
・相関係数は因果関係を意味しない。仮説としては可能だが、因果関係の立証はそれだけではできない。
◆回帰分析の意味
回帰分析は、数学の成績から国語の成績を推定する方法。
数学が50点の場合、国語は何点となるか?を求める。
上記の図では、国語が40点から70点に散らばる。推定値にかなりの誤差が含まれる。
「推定値と現実のデータとの相関係数」を求めると、回帰分析の当てはまりのよさがわかる。これが重相関係数である。
重相関係数を2乗すると、影響力の大きさとなり、これが説明率である。
影響力が数十%ないと、現実的な予測はできない。
・回帰分析は相関係数の応用ともみなせる。つまり相関係数の注意点がほとんど回帰分析にも当てはまる。
・回帰分析では因果関係はわからない。数学の成績がいいから、国語の成績もよくなる、とは言えない。
◆共分散構造分析
共分散構造分析は、複雑な連立方程式を近似的に解く数学的な手法。構造方程式モデリングとも呼ばれる。
回帰分析や因子分析(多変量のグループ分けに使用)なども共分散構造分析の下位モデルとして位置づけられる。
計算手続きは複雑なので、ソフトウエアのパッケージに頼ることになる。
例:SAT(アメリカの大学適性試験の共通テスト)の平均得点、収入(1人あたりの所得)、教育(25歳以上の住民の教育年数の中央値)、データはアメリカ合衆国の21州ごとの代表値なので21セットある。
収入と教育の間に「相関α12」を仮定し、教育からSATを予測したり、収入からSATを予測するモデル。
この図のモデルは、下記の方程式で記述できる。
教育と収入の相関は0.49で、AMOSで解くと
となり、教育年数や収入からSAT得点が予測できることになる。