« 電子帳簿保存法及びスキャナ保存制度の改正 | トップページ | 合意された手続 »

2019年1月20日 (日)

統計学を信じてみませんか?

 厚生労働省の毎月勤労統計調査で不正な調査が行われていたということが問題になっています。従業員500名以上の企業について,全件調査が求められているところ,東京都の対象企業約1400社のうち500社のサンプリング調査に依っていたという問題,さらにその調査の集計過程にミスがあったということと聞いています。規則では,全件調査すべきとされていたのですから,全件調査すべきです。それ自体は否定しようがないと思います。

 しかし,私は「統計学の知見があったら,全数調査のような手数のかかる無駄な作業に税金を使おうという気になっただろうか?」という意見が出てもよいのではないかと考えています。選挙速報の番組を見ていると,出口調査など投票者のごく一部について実施したデータを基に夜8時の投票締め切りと同時に「当選確実」が打たれるというのをみなさんも経験していると思います。サイコロで2回続けて1の目が出ることはあっても100回,1000回と投げ続ければ,あらゆる目が1/6に近い数値に収束します。こうした統計学の知識を活用すると,母集団はかなり少ないサンプルのデータから推計できることがわかっています。それであれば,1400件のうち500件も標本抽出する必要があったのだろうか?という疑問があります。標本(サンプル)の抽出は,無作為に選ばなければいけないので,企業のように様々な個性があり,給与の算定方法なども多岐にわたる(年俸制による固定給から歩合給などまで)ので,単純に抽出するわけにはいかないのかもしれません。しかし,大多数の企業が基本給+残業手当+その他という給与体系を取っているのであれば,数十から200件程度の標本抽出で1400件の母集団の姿をかなり近似して推計できるのではないかと思います。しかも,1400件の集計の結果,給与額が28万円になったとして,「その金額プラスマイナス1%以内に推計結果を95%(99%)の確率で納めるためには何件の標本を取ればよいか?」といった計算も統計学の知識で算出することができます。

 という意味では,テレビに出てくる有識者の方々からも「なんで厚生労働省はいまだに全件調査などやっていたのだ。税金の無駄遣いではないか。ルールを変えずにやったことはけしからんがサンプル調査自体は良いことだ」といった発言をされる方を見かけない気がします。全件調査に戻すべきだという形で世論は動いています。しかし,限られた予算の中で,しかも,その予算は,我々が払った税金です。それが不効率な作業に使われるというのはどうなんでしょうか。もっと少ない職員数で統計が作成できるかもしれません。

 統計学は,大量のデータを取り扱う場面では絶対に必要な知識だと思います。私が高校生の頃は,正規分布(標準偏差など)や統計的な推測(仮説の検定など)は,数学Ⅲに置かれており,選択科目でした。しかし,学校から「将来,経済学部や商学部に進む人は数学Ⅲを選択しておいた方がよい」と言われて,履修しました。そして,大学でも統計学が必修科目でしたので,この2年間で統計学を学びました。新聞記者やニュースキャスターと呼ばれる方々は,案外,こういう学習が足りないのではないかなと思う次第。私も統計学の計算手法自体は忘れましたが,統計学で何ができるかは身についています。そういう知識がない人たちが,ニュースを作ったり,それにコメントをしていると,世論をミスリードするのではないかと危惧する次第です。また,「微分・積分など社会に出てから使わないじゃないか」などと言う方々は,「だから,統計学を高校の数学の必修にすべきだ」と付け加えてほしいと思います。だって,新聞記者のような文章を書く,文系の方々にも必須の知識ですので。ちなみに私は積分はともかく微分は高校の必修分野であるべきだと思っています,経済学の履修で必須の知識ですので。

| |

« 電子帳簿保存法及びスキャナ保存制度の改正 | トップページ | 合意された手続 »

コメント

今般の問題では、全量調査を行っていなかったことそのものというより、仰る「集計過程にミスがあった」こと、すなわち復元処理が行われていなかったことが問題とされていると認識しています。
ご主張には賛同しますが、ともすれば「ルール上の取り扱いの問題だけであり本質的には瑕疵がない」と響きかねない書き方には違和感があります。

投稿: 通りすがり | 2019年1月20日 (日) 15時58分

コメントありがとうございます。
 金額が過少に算出されたのは「集計過程にミスがあった」からなんでしょうね。しかし、そもそもサンプル調査が認められていなかったのであり、テレビ等ではそちらにスポットが当てられていると認識しております。
 なお、「ルール上の取り扱いの問題だけであり本質的には瑕疵がない」と響きかねない書き方というのは、どの部分のことでしょうか。最初のパラグラフで「全件調査すべきです。それ自体は否定しようがないと思います。」と書いており、瑕疵がないというニュアンスを込めたつもりはないのですが。今後の文章を磨く意味でも、ご指導を賜れれば幸いです。

投稿: 佐久間 | 2019年1月21日 (月) 08時55分

お久しぶりです。
サンプルがランダムに抽出されていないから統計的に処理できないのではないですか?報道がないから想像するしかありませんが。

投稿: maeda | 2019年1月30日 (水) 23時31分

maedaさん、ご無沙汰しております。そうかもしれませんが、そもそも1400件全部を見るべきところ、統計的に処理できるなら、500件よりもっと少ないサンプル数でよさそうなものを・・・という観点ですので、サンプルがランダムに抽出されていないのは、なし崩しの現状としてはそうなのでしょうね。全件調査するか、統計的処理を前提に必要なサンプル数やサンプルの採り方を検討してから実施する。このいずれにもなっていなかったことが今般の問題ですよね。個々の役所の方は、それぞれ優秀だし、きちんとした人なのに、組織としては、グズグズになってしまうというのは、経営学の課題として研究してほしいものです。

投稿: maeda | 2019年2月 2日 (土) 12時27分

間違って、名前欄にmaedaと入れて投稿しちゃったのでしょうか。上記の「maedaさん、ご無沙汰しております~」以下の文章は、佐久間によるものです。失礼いたしました。

投稿: 佐久間 | 2019年2月 3日 (日) 17時44分

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: 統計学を信じてみませんか?:

« 電子帳簿保存法及びスキャナ保存制度の改正 | トップページ | 合意された手続 »