統計検定2級挑戦 -2014-

このエントリーをはてなブックマークに追加
はてなブックマーク - 統計検定2級挑戦 -2014-
Share on Facebook
Post to Google Buzz
Bookmark this on Yahoo Bookmark
Bookmark this on Livedoor Clip
Share on FriendFeed

このブログでは自分の好き勝手にいろんな内容の記事を載っけてますが、今回は「統計学」についてです。

統計検定というのがあるのをご存知でしょうか。

統計検定ページ

2011年に発足したばかりの新しい検定です。2014年にこの検定を受けてみました。自分は理系の4大を出ているのでめざすとこはまず「2級」に設定しました。自分もそうでしたが受けている方の体験記は参考になりましたので、こちらで自分も紹介してみようとおもいました。結果からもうしあげますと、2014年の11月の試験で合格できたのですが6月に一度落ちて悔しい思いもしました。そんなことも踏まえてつらつら書いてみます。

序章

まず自分のステータスとしては、今はIT企業が15年目ですが、データ分析は主業務としていません。ものすごくざっくりいうとシステムエンジニアというタイプになります。大学は理系ですが、統計・確率は勉強していません。しかも高校生のときは確率は数学野中で一番不得意な分野、というか嫌いでした。そんな自分が「統計検定2級」を得たのはだいぶがんばったなと感じてます。

goukakusho

受けるきっかけとしては、昨今IT業界ではしばらく前から耳にするようになってきた「ビッグデータ」に関するデータ分析の注目の高まりから、統計学も注目され、そこに興味を持ったためです。今の仕事でビッグデータのソリューション開発をしていて、また業務の中で一時、あるシステムのパフォーマンスの生データを収集して、独自に「R」という統計パッケージを使って分析したり、可視化したり提案に活かしたりすることで更にに興味がわいてきました。統計学を学びつつ様々なシーンで活用すると絶対にいい!と思い勉強しはじめました。と同時にこの検定があるのを知って、力試しで受けてみようと思ったのです。

 勉強教材

いきなり教材の話ですが、自分は「書物」「セミナー」「Web」「TV」「自分ノート」で勉強しました。

まずは「書物」ですが今自分が持ってる関連書物は以下です。

20150105_180151-1

 

 

 

 

前章でも話したとおり自分はこの分野が苦手で不得意、嫌いというところもあったのでまずは統計学とは?というのがめちゃめちゃやさしくわかるところから読み始めています。ただ、この頃はまだ「統計検定」は意識しおらず単に興味として知りたいという気持ちから読んでます。

  • マンガでわかる統計学(オーム社) # シリーズ 
  • マンガでわかる統計学 素朴な疑問からゆる~く解説(ソフトバンククリエイティブ)

 

学業から離れてだいぶたつので理解力が悪く、またどの書物も同じ事をいっているんだけれども表現が若干違うことに惑わされたりと、1冊では到底身につくことができませんでした。優秀な方であれば1冊(その1冊選ぶとすると「統計学入門(基礎統計学)」でしょう)でもいいのかもしれません。が私は違っていたので、いくつも書物を見比べたりして自分が理解できるところまで読んでいたりしました。

実は統計検定の出題範囲を踏まえたうえでの公式の参考書と問題集が出ています。

  • 統計検定2級対応「統計学基礎」
  • 統計検定2級 公式問題集[2011~2013年]

 

自分の経験で話すと、これを使って勉強しながら、3ヶ月くらいで2014年6月の試験を受けたのですが、回答率75%で落ちました。他の方の経験談を読んでいると合格圏内だったと思ったのですが落ちていたので相当ショックでした。なので改めて弱いところと理解不足だったところを再理解しながら11月に臨みました。

統計検定2級という観点でみると良く網羅されていたのが、以下です。

  • まずはこの一冊から 意味がわかる統計解析(ベレ出版)

 

問題を解いたり、解説を理解するときによく参考にしました。

2級の範囲では「R」を使った問題も出ます。というかRを使って表現された統計解析結果を読み取るといった方がよいかもしれません。Rはとてもよくできたフリーの統計パッケージです。個人的には多少プログラミング力があるので、Rはすんなり理解でき活用できました。Rについては個別の参考書まではいらないかもしれません。公式の参考書の中にも解説があるのでその程度でよさそうです。興味がある方は触ってみるのもいいと思います。その際には、以下の本がとても読みやすく参考になります

  • とある弁当屋の統計技師(データサイエンティスト) ―データ分析のはじめかた― (共立出版)
  • とある弁当屋の統計技師(データサイエンティスト) 2 ―因子分析大作戦― (共立出版)

 

ここで因子分析については具体的に範囲ではありませんが、データ分析をする上では使用頻度は高い分析手法なので知っておいてもよいとおもいます。

ベイズの定理については、大体出題頻度が高いので抑えておくとよです。私はこの勉強をはじめるまでベイズの定理は知りませんでした。でも身近なところでも使われていることを知りとても興味深く学習できました。ベイズの定理を話す上でよく引き合いに出される「モンティ・ホール問題」はあまり普通の人は知らないものなので、何かのネタとして知っているととても面白いはずです。

読んだ本の中には検定範囲というより、「データをどのように活用するか、どのようなシーンで統計学が役立つか」をテーマとした本もあります。これらは、単に学問として統計学を学ぶだけでなく、何を目的に統計学を使うのかを認識することができます。ビジネスや生活、他専門的な研究などの分野で統計学、ツールや手法は、さまざまな目的を達成するための手段でしかありません。なので単に数式の羅列や公式だの定理だのを頭に入れるよりはその活用をイメージしながら、また実際に使いながら勉強した方が意欲的に進められると思います。

  • 統計学が最強の学問である (ダイヤモンド社)
  • 統計の9割はウソ: 世界にはびこる「数字トリック」を見破る技術 (徳間書店)
  • 統計思考入門―プロの分析スキルで「ひらめき」をつかむ (プレジデント社)
  • 1億人のための統計解析 エクセルを最強の武器にする (日経BP社)
  • ビッグデータの正体 情報の産業革命が世界のすべてを変える(講談社)

 

上記は自分が個人的に特に面白いと感じ繰り返し読んでいる本です。はじめ統計に関しての知識0(平均値くらいしかしらない程度)で読んで、学習を進めながら再度読み返すとより理解しながらしっかりと腹落ちしながら読めるようになりました。


 

続いて「セミナー」です。とはいっても、セミナーはそれほど行ってるわけではありませんし、検定の直接の対策になっているわけではありませんが、最近ではいろいろ開催されているのでモチベーションをあげるのにもいいとおもいます。

はじめていったのは、2013年11月、立教大学の統計のセミナーで大学教授と企業人(そこではじめてブレインパット社を知りました)の方々がパネルディスカッションをしながらデータ活用についてを話をしていました。講堂にはほっとんどが学生でしたが、学生の中でも真剣に聞いている人たちが多くいました。ちなみに、そこで統計検定を知りました。ですがすでにその直前で試験応募は締め切られていたため、その次を目標としました。

もうひとつは自腹1万5千円を払って行きました。それは「統計学が最強の学問である」の著者である西内さんが講演されるからです。自分より年下でどんな感じの人なのかも興味がありました。非常におもしろいプレゼンであり、統計学の最強っぷりを更に感じることができたので、より統計学を意欲的に勉強することができました。


 

次に「Web」ですが、以下のようなものを参考とすることができました。

  • 検定試験の体験ブログ
  • 統計局ホームページ(http://www.stat.go.jp/)

ブログに関してはGoogle先生でぐぐったらいくつか出るかと思うので省略させてください。(このページもひっかかるようになるといいかなと)後者は特に「なるほど統計学園」「なるほど統計学園高等部」は興味深いと思います。また、「データサイエンス・スクール」は直接検定対策にも役立ちます。ここでは初級・中級・上級とありますが、2級めざすなら、すくなくとも上級で満点とらないとだめです。当然初級・中級もということになりますが。これから勉強はじめるという人にはここで自分のレベルを確認するのも1つの指標になるかと思います。このサイトではテキストと問題も提供されており、これがなかなかわかりやすくできていますのでとても参考になるかと思います。


 

次は「TV」です。これは、ほんとにたまたまなんですがふとTVの一覧を見ていたとき、「放送大学」のところに統計関連の番組が見えました。「心理統計学」と「身近な統計」です。この2つの内容がほぼどんぴしゃで大学で学ぶの基礎統計学の範囲を網羅している感じでした。文書だけでなく、直接先生の講義を聴けるのでこの上なく理解の助けになりました。こちらも録画をして、理解の浅いところは繰り返し観たりしました。番組の教材とかもあるようですが、そこはよくわからなかったので使いませんでしたが。


 

教材、最後の「自分ノート」ですが、これは当然売ってるものとかでなく、自分で作ったものです。ほんとに学生のように学習したわけです。「正規分布」や「t検定」、「F検定」、「分散分析」・・・など似たような数式を利用したり、母分散が未知でどうのこうのとか、既知で等しいとかややこしい式をある程度覚えておく必要が出てきます。自分用のノートを作って理解を深めたり、単語帳を使って、平均と分散の式や値など覚えるようにしました。ただ、英単語のようにたくさんあるわけではないので量としては少ないかもしれません。これは人によりそうですが。前述の「放送大学」の内容なんかは講義を聴くようにノートをとってみていたりしました。

勉強時間とやり方

あくまで自分がやった経験になります。まずは検定を受けると決めた後は統計検定のページから出題範囲を確認してそれを網羅できるように、公式の参考書を読んでいきました。そのときまでに得ていた知識などは役に立ちましたがきちんと問題が解けるようになるには足りませんでした。足りてないところはしっかり理解してうめるしかありませんので、理解できるまで何度も読みました。簡単に書きすぎてわからないものは、数学的証明を見てわかったり、その逆もあったりでそれを整理しながら自分のための理解でノートを書いたりしました。

自分が2014年6月に受ける前に、過去問の問題集が出たのでそれをやりました。はじめは5割、その次は7割とその時は3週くらいしかやれなかったのですが、解説を読んでも理解できない(というか難問?)のもあったりとまだまだ理解不足でした。きっと試験結果もそれが反映されたのだと思います。特にベイズの定理は理解が浅く2問逃してしいました。

11月には苦手なところを集中的に、あと若干出題範囲が代わっていたのに気づき少しその範囲まで確認しながら学習しました。過去問は2014年6月のも含めて解けてないのを中心に実施し、また苦手と理解の浅いところを腹落ちするところまで覚えました。その中心に使った教材は公式参考書と合わせて、「統計学入門(基礎統計学)」、「まずはこの一冊から 意味がわかる統計解析」でした。

使った時間は、電車などの移動による隙間時間と帰ってからの時間と風呂入ってる時に本を読むのが好きなのでその時間ってとこです。

試験当日と結果

試験会場は6月試験は早稲田大学、11月試験は東京大学でした。11月試験の話をすると、かなり自信をもって受けたのですが、いざ試験が開始すると出鼻くじかれではないですが新鮮な問題に頭がリフレッシュされて焦りました。少し時間があまるかなとおもいきや、一問一問じっくりな感じで見直す時間はなくきっかり90分使ってしまいました。そのためか、やったぞ感はなく答え合わせは正解が公開されるまでしませんでした。ですが、1問だけ明らかなボンミス(完全な計算ミス)があったのを非常に悔やんでいました。点数が加算されるとしても少ないと予想さされるところでしたが、もったいないです。正解が出たので答え合わせをすると、正解率としては80%、6月は上回りました。これで落ちたらどこまで取らないといけないのか・・・と思いもしましたが12月の結果をみたら番号があったのでホットしました。

11月の試験は3級も実は受けました。しかし3級の勉強はまったくしてません、というか2級でいっぱいでできなかっただけですが。過去問すら解けませんでした。範囲は若干かぶっているんですが出題のされ方が違うというか、ほんとに基本中の基本な用語の理解やグラフなどを読み取るとかそういったものが多くありました。やはり2級とはレベルが違う感じでした。2級合格できるひとは3級は100%合格レベルになると思います。こちらも合格でした。

感想とこれから

2級を2度目でなんとか合格できましたが、ここにきて準1級が設けられました。2015年6月からはじまります。これをめざしてみようとおもいます。2級範囲は基礎であるのでその応用まで広げるという感じです。私のいる業界にはデータサイエンティストという職種も生まれていたりととても興味深い分野でもありますし、データ活用の様々な分野で活用できる統計学は私も最強ではないかと感じています。

最後に検索の第二ワードで指定されているものについて私の経験から答えますと・・・

合格点・合格ライン・・・これは私が他の方の合格体験記を読んだ限りだと自己採点で正解率7割いったらごうかくかと思ってましたが、どうもそうでもないようです。当然難しい問題には高い配点が付いていると思いますし、はじめの方はやはり全体的からすると簡単な問題が多いのでここではミスしたくないところです。

勉強時間・・・1日平均で2時間程度でしょうか。期間は一度落ちてますが、5ヶ月で6月の試験に落ち+1ヶ月で11月の試験に合格、という感じです。トータル時間がどうこうということはないと思います。やはり数学の知識は存分に使われるので、文系の方でも苦手な部分がある時はわかるところから始めるのが良いと思います。

難易度・・・これはどうでしょうか、ある人は「簿記2級くらい」と話してましたが私は簿記をしりませんし、英検2級とも違う気がします。ただ、2級は「大学生が1年で学ぶ統計学の基礎」ということなのでだいたいそのくらいなのかというところでしょうか。大学生が単位を取るために受ける試験はこんな感じかなーと思いながら過去問は解いていました。

簡単ではありますが、このページが少しでもこれから統計学を勉強する方々の参考になればとおもいます。

 

 

 

Back To Top