保健統計演習


保健統計演習 第10回 (6/21)
正規分布表の見方と基準化の公式をどう使うか

 教科書の正規分布表の中身は確率が書かれています.
 標準正規分布は平均が0ですので,確率=正規分布のグラフとX軸に囲まれた部分の面積は0以上の部分の面積を2倍すれば求められます.下図ですと,青の線が正規分布のグラフになりますが,この面積は水色の面積の2倍で求められることがわかります.実は全体の面積は1になります.つまり下図の水色部分の面積は0.5です(Xの累積確率のグラフでもそのことがわかります).



 話を戻しますが,知りたいのは確率が95%となる時のXの値です.水色の面積でいえば,95%÷2=47.5%,つまり0.475を正規分布表で探します.すると横軸が1.9で縦軸は0.06の交点に0.475を見つけることが出来ます.1.9+0.06=1.96が0.475に対応しているとこの表では見ます.講義とは逆の方法でしたけど,正規分布表の見方はこれで理解できると思います(X=1.96ではありません)

 さて,基準化の公式
   
では,先ほどの1.96はzの値になります.この公式にzとともに,調べたいデータの平均(μ)と標準偏差(σ)を入力すると,xの値が求められます.これで標準正規分布に従っているという仮定のもとで調べたいデータ全体の95%の範囲を計算することが出来ます.なぜ,95%の範囲を求める必要があるかというのは第4回のときにも書いたのですが,全体の95%がわかれば,残りの5%は極端なデータのグループなので今後除外してしまおうよ!っていうのが理由です.それ以上は私には突っ込まないでください.教科書には計算問題があると思いますので,計算できるようになっていただけると,国試の対策にもなる・・・そうですし,多分期末のテストがあれば必ず出ると思いますので,覚えてください.

△このページのTOPへ
保健統計演習 課題作成例 (6/20)
書式の設定方法をまとめました

課題の作成例を示しましたが,書式の設定方法をドキュメントにしましたので,参考にされたい方はダウンロードしてご覧ください.

 レポートの書式設定方法

△このページのTOPへ
保健統計演習 第9回 (6/13)
二項分布と正規分布

離散型確率分布である二項分布と連続型確率分布である正規分布について,どんな分布をするかとそれぞれの性質を確認しました.っていっても全体の3分の2は他の課題をやってるかインターネットで遊んでましたね.

さて,配付資料の例だとさいころの目が偶数である確率が0.5(A1セル)です.以下A列は偶数が出る回数を0から,2行目はさいころを振る(=試行)の回数を2からとってあります.さいころを2回振ったとき偶数の目が1回出る確率は0.5(B4セル).3回さいころを振ったとき偶数の目が2回出る確率は0.375(C5セル)と言うふうに見てください.  この確率をさいころを振った回数ごとにグラフ化すると,さいころを振った回数の半分を中心に左右対称なグラフが出来上がります.さらに確率を変化させると確率が0.5より小さくなれば,最頻値(グラフの山)は左にずれ,確率が0.5より大きくなれば最頻値は右にずれます.だからなんだ?ってことですが,どこに分布が集まっているのかってところに目をつけておけばいいと思います.

次に正規分布ですが,二項分布を数を細かくして変数のとる値を連続的なものに近づけると正規分布っぽくなります.ポイントとしては二項分布では最頻値が試行回数の平均で求められたのに対して,正規分布では原点が最頻値となるところです.言い方を変えると原点を中心に左右対称のグラフになるのが正規分布です.次回は正規分布の性質をもう少し見ることになると思います.

 追記:先月の課題をチラッと見たのですが,課題のファイル名に「保険統計」と書いているのが8名いますね.ほんとダラダラしたかんじで,中身読む気にならなかったです.

△このページのTOPへ
保健統計演習 第8回 (6/6・7)
コインの実験と言われてもピンとこない・・・

今回は確率分布の中でも二項分布とはどんなものかをグラフ化して概観しました.板書にあったように,二項分布は値の範囲が離散的です.血圧などはとりうる値が偶数だけなので離散的な例といえるのかな?

さて,Excelで不思議な0と1が並ぶ表を作成しました.コインがどうとか言われても看護関係ないじゃんかなどと思わずにガツガツと学んでくださいね.では何をやったかというと・・・

A1セル→ = INT(RAND( )+0.5)
   INTカッコ内の整数部分を取り出します.1.5なら1,0.5なら0です.
   RAND0以上1未満のランダムな値を作成します.
  つまり,INT(0.5以上1.5未満)=0か1が表示されることになります.

この計算式によって,Excel上に0か1がランダムに表示されたわけです.ここからはコインの表が出れば1,裏が出れば0となる集合関数を想定して話を進めます(これを言及しなかったので,この後の議論がわかりにくかったのではないでしょうか).

そして,A1セルをA120までコピーしたことで,結果として120回コイン投げの試行をするのと同義と考えます(ここまで1人目の試行).ここでコインの表裏が何回ずつ出たのかを知るためにヒストグラムを作成しました.

さて,A列のコピーを作成して表に挿入しました.列が増える分多くの人数でコイン投げの試行を行ったと考えてください.複数人で試行を行った場合にコインの表裏の出た数を知るため,1回毎の試行で何人表が出たのかを数えることを考えます.すると行ごと(横方向)に1を足し合わせれば表が出た人数に一致します.これで全体の試行の分布を横方向の合計数で調べることが出来ます.

だいぶややこしいところもあったと思いますが,以上のようなことをやりました.だんだんExcelであれこれやって結局何をやりたかったのかわからなくなってきますので,何を目的にして表やグラフを作成しているのかを意識して聞いてください.そうでないと全講義が終了したときに何も残らないんで.

△このページのTOPへ
保健統計演習 課題について (5/27)
個人的な意見で担当教員の考えではありませんが

ちょこっとだけ提出済みの課題を見させていただきましたが,ちょっとだけ個人的に思うことをいつもどおり勝手に書いてみます.

まず,ヒストグラムを分析ツールから作成した際に表示される表は度数分布表のもとになります.具体的には「階級」を「階級の範囲」に書き直して,どこからどこまでの範囲の中にデータが含まれているのか(=頻度)を明示すべきです.そう考えると階級の20や40は階級の範囲の「上限値」か「下限値」か,それとも「階級値」なのかを判断すればわかることだと思います.

次に,考察ですけど平均のことばかり目立つような気がします.平均なんて誰でも言及できると思いますので,その他の基本統計量を男女比較して言えることはないか頭をひねってみて欲しいです.基本統計量の各項目がどんな指標なのかを再チェックすればいろいろ視点は広がるのではないでしょうか?

△このページのTOPへ
保健統計演習 第4回 (5/13)
標準偏差について

今日はヒストグラムの作成をやったのと,標準偏差の考え方について学習しました.

標準偏差の説明の復習です.まず,標準偏差とはあるグループのデータがある時に,データの散らばり具合を数値化したものを言います.次に講義中で基本統計量を計算したデータを利用して講義中の説明を復習しましょう.フィリッピンのグループの平均身長が約150cmでした.標準偏差が7.9で約8cmと考えることにします.

この場合,150±8,つまり142cm〜158cmの間にグループ全体のうち68%のデータが含まれており,150±2×8,つまり134cm〜166cmの間にグループ全体のうち95%のデータが含まれていると考えます.これが何をしているかというと,書き方は極端ですが,全体の95%がわかれば,残りの5%は極端なデータのグループなので今後除外してしまおうよ!といったところです.今後95%って数字がよく出てきますんでちょっと気にしておいてください.

基準化の公式も重要なものだと思います.覚えておきましょう.

参考:Excelの間違いについて(リンク)

△このページのTOPへ
保健統計演習 第3回 (5/9)
分析ツール表示できますか?

ここを見てくれた人はもう大丈夫かもわからないけど,Excelで基本統計量を求めるには 分析ツールが必要なわけです.それでいて3回目の講義で分析ツールが表示されないって質問が ありましたけど正直お粗末です.やる気無いなら別にかまいませんけどね. 分析ツールを使用する方法は下にあるのでそこを見ていただきたいのですが, 注意点としては,インターネットの画面上で開いた場合は分析ツールは使えないってことを 覚えておいてください.あくまでスタートボタンからExcelを起動して使えるのです. これも毎回話していますが,教員から提供されたデータはまず自分のSドライブに保存する. そしてSドライブに保存したデータをダブルクリックして加工をするのです.忘れずに!

さて,今回は基本的な用語が登場しました.平均,モード(最頻値),メジアン(中央値),標準偏差. どんなものかだけ覚えておいてください.それぞれの値が何を示しているのかを理解していないと 先が全然不明な話になりますので.

最後に次回は5/13(金)U限ですので間違えて欠席など無いようにお願いします.

△このページのTOPへ
保健統計演習B 第1回 (4/19)
Aクラスと内容が違うので注意!

月曜日と内容が異なった場合にはこうして,Bクラス用のページを作成したいと思います.Aクラスの分と合わせてご覧ください.

さて,今回はヒストグラムの作成をしました.ヒストグラムを作るまでをまずは復習しましょう.

はじめに,分析ツールを選択できるようにする作業が必要でした.これはAクラスと同じなので省略します.

次に,体重についてヒストグラムを作成します.まずは,データ区間を作成します.これは空いているセルであればどこでも結構です.任意の数列を作成します.

データ区間を先に作りましょう!

次に,メニューバーのツールより分析ツールを選択します.

ヒストグラムを選択

そして,データ範囲の選択になるのですが,先に入力が終わったものを示します.

入力が完了するとこうなります

ラベル・累積度数分布の表示・グラフ作成にチェックを入れることを忘れないでください.この場合は体重についてのヒストグラムですので,入力範囲はD1〜D501となります.D1は「体重」が入力されていますが,範囲に含めます.

OKボタンを押した出来上がりが下のようになります.

とりあえずの完成形!

最後に別のグラフを作りましたけど,今回のところはここまでできるようになってください.

△このページのTOPへ
保健統計演習A 第1回 (4/18)
よろしくお願いします

月曜の朝から,担当遅刻(27分)ですいませんでした.大概こんな感じで進んでしまいますので, 覚えることだけしっかり持っていってください.

さて,早速Excelでの表計算遊びをしましたけど,この期に及んでExcelの使い方はいまいちわからない! という人は,本屋でうすっぺらいExcel解説本が数百円で売ってますんで,まずはそれで勉強してください. ちなみに黒崎はこの大学に来てからOfficeを勉強していますので,うちの学生ならすぐに追いこせますよ.>

さて,まず今回重要だったのがヒストグラムです.QC7つ道具の1つに数えられますが, QCってのは会社では毎年のようにQC大会ってのがあって,「業務改善をやってこんなに利益が出たんです!」 ってプレゼンしなきゃいけなかったりするのでぜひ覚えておきましょう.おおざっぱに言えば, ヒストグラムではデータを区間に分けて区間ごとの分布をグラフ化します.これでデータの特徴を調べようという考え方です.

次に,よくわからないことをやりました.基本統計量の算出です. 基本統計量がわからないという声がありましたけど,わからないことはまず目の前のパソコンで調べてみてはいかがですか? まかりなりにも学生なんだから,自分で調べてから聞いてもいいんじゃないって正直思います. Yahoo!Japanで「基本統計量」って検索かけたら4631件出ました(4月18日夜時点). 担当教員に聞くよりもずっと早いと思います.そんなことくらい調べてきてるわ,ボケ!ってくらいの意気込み 見せないと.つまらないことかもしれませんけど,そうやってパソコンを利用する癖をつけてください.

かなり余計なことを書きましたので,話を戻します.Excelでの基本統計量の算出方法を復習しましょう. まずはメニューバーのツールからアドインを選択.「分析ツール」の頭の□にチェックを入れてOKボタンを押さないと 「ツール」メニューに「分析ツール」が出現しません.

アドインを表示
分析ツールの選択

分析ツールを選択したら,次に現れるウィンドウで基本統計量を選択してOKボタンです.

基本統計量の選択

やっと範囲指定ですが,1行目の各数値のタイトルを範囲に含めることを忘れないでください. これをしないと,基本統計量ウィンドウの「先頭行をラベルとして使用」がちっとも生かされませんので. 加えて,出力オプションの「統計情報」にも先頭の□にチェックをいれることを忘れないでください. 講義中はもめてしまいましたが,データ方向は列です.Excelの列とはワークシート上ではA, B, C・・・の方向です. 今回のデータではA列から番号,性別,身長,体重,BMIの順で500行のデータを示していました. 500人の身長というデータ集合の基本統計量が知りたいので,データ方向は列になります.

基本統計量の算出

次回は,おそらく基本統計量の説明から入ると思いますので,まずはExcelで基本統計量を算出できるようになってください.

今回の資料はhttp://lec/hash/にあります.パワーポイントとExcel各1ファイル 必要に応じて各自のSドライブに保存しておいてください.ちなみに資料のあるページへのリンクを 学内ページの左メニューに「情報講義ページ」として出しておきましたので,次回講義からご活用ください.

△このページのTOPへ