知り合いに頼まれた調べごと
折角2時間近くかけて調べてるんですから、1人だけに還元するのは勿体無いし、なにせ最近ここに書くレベルのネタに困っていましたから、まぁラッキーといえばそのとおりです。統計学や心理学に関する内容ですね。
統制群
比較実験を行う際に、実験操作を行わない対象群のこと。例えばある薬Aの効能を調べる際に、この薬を投与される被験者たちを実験群、比較のために投与されない被験者たちを統制群と呼ぶ。
相関(統計学)
「相似な関係」があるものの関係。数学を使わずに説明するのならば、データAとデータBについて、一方が大きくなるともう一方も大きくなる(あるいは小さくなる)という関係を、前者は「正の相関がある」、後者を「負の相関がある」という。数学的には-1〜1の値を取る相関係数というものを使って相関関係を示す。1が正の相関関係、-1が負の相関関係があることを、0が相関関係がないということを示す。
間主観性
主観が正しいものであるということを、他者が自分と同じように考えているということを示すことにより証明した主観の妥当性のこと。
制約
与えられた問題を解くにあたって、変更することが出来ない条件のこと。
四分位偏差
色々な定義があるが、一般的には「第3四分位と第1四分位の差の半分」としている。第1四分位とは量的データの下位25%の値、第3四分位とは上位25%の値を言うのが一般的である。与えられたデータが中央値(上位下位50%の値、第2四分位とも言える)に対して対称であれば、四分位偏差は第1四分位と中央値の差、および中央地と第3四分位の差と一致するが、そうでない場合は一般的には一致しない。
確認的因子分析
観測変数に影響を及ぼす因子を探索的に探す古典的な方法(探索的因子分析)に対して、因子および観測変数を予め予測して、それを確認するために行う因子分析。検証的因子分析とも。例えば、「ガンの発症率と関係のあるものは一体なんだろう?」と思って調べるのは探索的因子分析、「ガンの発症率を関係のあるものはこれなんじゃないのか?」と思って調べるのは確認的因子分析である。
両側検定
ある値がどれくらい有意なのかを調べる際に、その値より大きい値と小さい値の両方で有意水準を越えているか否かを調べる検定。例えばある実験値が得られたとき、その値が小さい分には構わないというのであれば、真値が実験値より有意に小さくなるリスクは考えなくても良い。この場合は真値が実験値より有意に大きくなるリスクだけを考えればよいので、上側検定を行う。逆の場合は下側検定を行い、この2つをあわせて片側検定と呼ぶ。真値が実験値より有意に大きい場合も小さい場合もリスクとして捉える時は上側検定と下側検定を両方行い、これを両側検定と呼ぶ。
間隔尺度
数字を扱う際に必要なルール「尺度」の1つ。数値の差にのみ意味があり、比には意味が無いとする尺度のこと。簡単に言ってしまえば、正負の数からなり計算することに意味がある数字から出来ているデータ群は間隔尺度を適用する。例えば「今日のりんごは110円、昨日のりんごは100円」という状況では、「差は10円」「10%高くなった」というのは共に意味があるが、「今日の最高気温は33℃、昨日の最高気温は30℃」という状況では、「差は3℃」「10%高くなった」というのは後者は意味をなさない(-3℃から3℃の変化は-100%となるが、これに意味はあるだろうか?)。従って、値段については間隔尺度より1つ優位である「比例尺度」を適用できるが、セ氏温度には「間隔尺度」までしか適用できない。なお、尺度にはこの2つ以外にも、数値の差にも意味はないが、大小関係には意味がある「順序尺度」(例えばランキング、2位と3位の差と40位と41位の差は同じじゃないでしょ?)、大小関係にさえ意味のない「名義尺度」(例えば出席番号、出席番号1番の人って何かが1番ってわけじゃないよね?)がある。
パラメトリック検定とノンパラメトリック検定の違いについて、具体例をあげて説明しなさい。
そのデータの分布を正規分布であり、等分散性を有していると仮定して検定を行うのをパラメトリック検定、そうでないものをノンパラメトリック検定と呼ぶ。そのデータがパラメトリック検定に必要な仮定を有しているとしても、データ数が少ない場合は良い検定を行えない場合が多い。例えば、日本国民の身長のデータは正規分布であり等分散性を有していると仮定できるためパラメトリック検定を行う条件は揃っているが、日本国民の年齢のデータは等分散性はともかく正規分布は明らかに仮定できない(日本国民の平均年齢の人が一番多いというわけじゃないよね?)ためパラメトリック検定をするのは適切ではない。