資料18 データをめぐる3つの問題(佐伯胖、松原望:実践としての統計学、東京大学出版会、67-712000.)

何かを観察し、それを誰かに伝えたいと思ったとき、観察したことを文字、図、記号、写真など、後に残るような、具体的なカタチで表現するだろう。これらの記録は、別の機会に、別の場所で、別の人に見せうることが可能であり、見せられた人は説明が必要な場合もあろうが、それがどういうモノやコトをさしているかが伝わると考えられる。記録がそもそもどういうコトやモノを表彰しているか、それがどれだけ明確に規定されているかという問題を「表象問題」とよぶことにする。なお、記録するという行為により、記録されるモンやコトが影響を受ける、ということはやっかいな問題である。面接調査を考えれば、納得がいくだろう。

「一義性問題」

記録を見て、これがそもそもどういうコトやモノを表象したものかがある程度わかるにしても、完全に一義的な対応関係として明確に定まるとは限らない。今日は体温が高い、記録したとき、この日の彼の体温が37度だったのか、39度だったのかはわからない。少なくとも、平常より高かった、ということは間違いないだろう。つまり、記録について、それが表象するコトやモノがどこまで一義的に定めうるものかのかということを問題にしなければならない。

「意味性問題」

記録が何を表象し、それがどの程度一義的なについて明確になったとしても、通常それだけでは満足しない。その背後にある何らかの意味(一般性のある法則や命題、関係構造)を推察したいはずである。単なる憶測や私見でなく、妥当性のある解釈というものを引き出したい。特定の記録から、その背後にある意味の解釈がどの程度可能かという問題を「意味性問題」という。体温が高い、ということから、病気にかかっている、ということを意味しているかということである。表象関係が明確で、一義性が高ければ、さらに、意味付けに利用される理論体系の妥当性が高いとすれば、確かない意味付けが引き出される。

「データとは」

記録が、表象問題、一義性問題、意味性問題に対して、妥当な(つまり、個人的な見解を超えて、一般的に主張しうる)答えを出しうるとみなされたとき、それは「データ」とよんでよいだろう。私達が何らかの記録を「データ」と呼ぶ場合、それについて表象問題、一義性問題、意味性問題を問うていくことを意味する。データというものは、「それをデータにする(データとして取り上げる)」ということに、何らかの価値があるとみなされていた、と考えるべきであろう。そもそも、データは、それを利用して他の事柄を導き出そうという目論見があるからこそ、データとみなしたのである。つまり、意味性問題こそが、データを取る目的なのであり、表象問題と一義性問題は、意味性問題を出来うる限り妥当なものにするための条件を問う問題なのだといえよう。

「統計学が対象とするデータについて」

出現する(観察される)頻度が重要な関心事になるようなデータである。

つまり、「同じ」とみなされることが、繰り返し生起し、それが観察されるということ、さらに、観察される頻度の多いか少ないかが問題になる。