物事の比較における主観的評価の課題

　世の中には様々な事柄について国際的な比較分析がなされています。例えば、農業・経済・文化・教育・環境・安全・健康・産業・政治・技術・軍事・スポーツ、などなどです。

　国際比較は意外と奥が深く、各国が統計を取っているような定量情報であれば比較的容易ではありますが、データの収集が難しかったり主観的な側面が含まれている場合はより難しくなります。

何を測定するかによって異なる難易度

　例えばアルコールを例にして考えてみましょう。

　『アルコールの消費量』を比較することは容易です。例えば日本であれば国税庁が酒類に関する定量データを公開しているように、酒類は各国の公的機関が観測している定量データがありますので、それを収集して並べるだけです。実際にWHOはそのようにして1人あたりのアルコール摂取量を毎年まとめています。

　しかし『ビールやウイスキーなど様々な酒類の具体的にどれが多く売れているか』の比較は難易度が上がります。そのためには飲料メーカーや小売業者のデータをかき集める必要があり、国内だけならばまだしも国際比較となるとデータの整合性に不確実な部分が残るでしょう。

　さらに『どの酒類が好きな人が多いか』となればさらに難しくなります。一人一人に聞いて回るわけにもいかず、また主観的な好き嫌いの度合いの幅は人それぞれなためです。

　仮にリッカート尺度によって次のような設問があったとします。典型的なアンケートの設問です。

　１．非常に好き

　２．やや好き

　３．どちらともいえない

　４．やや嫌い

　５．非常に嫌い

　このような単純なアンケートであっても、「あれもこれも全部非常に好き！」と評する人もいれば「非常に好きは一つだけにして、他はやや好きにしよう」と評する人もいるように、個人や文化の違いによる主観のブレが内包されることに留意が必要です。

最高の人生とは

　もう一つ、測定が難しいものの代表例として幸福度を見てみましょう。

　幸福度はまったくもって定量的に測定することができないため、社会学者が様々な定性的測定方法を検討しています。

　幸福度調査の代表例として、世界幸福度報告(World Happiness Report)の方法論を見てみましょう。

　世界幸福度報告ではCantril ladder(キャントリルのはしご)を用いて幸福度を測定しています。

　これは非常にシンプルな測定方法で、自分にとって最高の人生を10、最悪の人生を0と設定したはしごを設定し、今現在の自分がどの位置にいるかの回答を集計したものです。

　率直に言えば、これは極めて主観的で文化の影響を強く受ける測定方法だと言えます。

　ステレオタイプ的な表現になるのですが、日本を代表とするアジア圏ではこの手の心理検査の尺度において中立的回答を選びやすい傾向を持っているとされています。逆に西欧のようにはっきりとした回答を好む文化圏もあります。

　そのため、アジア人であれば

「まあ最高だとはもちろん言えないけど、なんとか生きているし最悪でもないかな、悪いこともそりゃあるけどさ、良いことだってあるし、これから先がどうなるかは分からないから、5点とか6点とかそのくらいかな」

と中立寄りの回答を取る人のほうが多そうな気はしませんか？少なくとも自分の今現在を10点だと積極的に自己主張する人は少ないかと思われます。

　さらに言えば、最高の人生である10点とはどういう状況でしょう？

　自らの欲求が全て叶う楽園のような状態？

　あるいは天寿を全うするまで健康な状態を保つことが期待できる状態？

　神の思し召しに従い自らの信仰を完全に全うできている状態？

　この基準自体がそもそも個人の主観と文化的影響を強く受ける項目であり、人によって異なる尺度の点数を単純比較することにどれだけの意味があるのかは疑問です。

異文化比較の課題

　主観的なステレオタイプでは説得力が薄いので、学術的な評価も見てみましょう。

　少し古い論文ですが、このような主観的評価における異文化比較の課題について報告している論文があります。

What’s Wrong With Cross-Cultural Comparisons of Subjective Likert Scales?: The Reference-Group Effect

主観的リッカート尺度の異文化比較の何が問題か？：参照集団効果

https://culcog.berkeley.edu/Publications/2002JPSP_referencegroup.pdf

Our interpretation is that the results from cross-cultural comparisons of means from attitude, trait, and value measures are inaccurate. People from different cultures adopt different standards when evaluating themselves on subjective Likert scales. Comparing measures with subjective Likert response options conceals the very cultural differences that confound the comparisons with the reference-group effect. This is problematic.

我々の解釈では、態度・特性・価値尺度の平均値の異文化間比較の結果は不正確である。異なる文化の人々は主観的なリッカート尺度で自分自身を評価する際に、異なる基準を採用している。主観的なリッカート尺度を用いた比較は、参照集団効果によって比較を混乱させる文化的差異そのものを隠してしまう。これは問題である。

　幸福度調査はまさにこの課題を内包していると考えます。

　異なる文化圏による主観的尺度に基づいた数値を単純比較することは直接的な幸福の比較とはなり得ません。

結言

　主観的要素を含む国際比較は無意味だと言いたいわけではなく、主観的要素が含まれていることを留意した上で用いる必要があり、その差異への理解が重要だと述べたい、そういった話です。

　もちろんこれは国際比較で顕著なだけで、主観的評価には必ず付き纏う問題です。

　極論ではありますが、主観的な比較は男女や老若などにも影響を受けます。例えば「健康」についての主観的価値を問うた場合を想定すればそれは明白でしょう。若者にとっての「健康の価値」と高齢者にとってのそれを同じように取り扱うことはできません。

　いずれにせよ、定性データを取り扱う時はそのような背景についても留意が必要です。

忘れん坊の外部記憶域

興味を持ったことについて書き散らしています。

物事の比較における主観的評価の課題

何を測定するかによって異なる難易度

最高の人生とは

異文化比較の課題

結言