初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析
著 | : 神田善伸 |
---|---|
ISBN | : 978-4-524-26158-1 |
発行年月 | : 2014年11月 |
判型 | : B5 |
ページ数 | : 216 |
在庫
定価4,180円(本体3,800円 + 税)
正誤表
-
2015年06月02日
第1刷・第2刷
- 商品説明
- 主要目次
- 序文
- 書評
フリー統計ソフト「EZR」(Easy R)を使って統計解析を始める前に読む“最初の一冊”。統計ソフト「R」に多彩な統計解析機能を組み込みより使いやすくなった「EZR」。その開発者が自ら、実際の使用方法を画面写真とともに平易に解説。ソフトインストールの手順から、基本的な解析機能の使い方、見栄えのよい図表作成のコツまで網羅。サンプルファイルを用いて実践的に学べる「EZR」のもっともeasyな解説書。
【内容目次】
Chapter1 統計解析の入り口
A 統計解析ってなに?
B データの種類
C データの要約、信頼区間
D 群間の比較、P値とは?
E 多重比較の問題
F バイアス
G 表計算ソフトでデータファイルを作ってみよう
Chapter2 EZRを始めよう
A EZRのインストール
B EZRの基本的な操作方法
C サンプルファイルのダウンロード
Chapter3 EZRでデータをながめてみよう−初級編
A データファイルを読み込む
B 解析前のデータファイルを編集する
C 名義変数のデータを要約する
D 連続変数のデータを要約する
E 生存期間のデータを要約する
Chapter4 EZRで検定してみよう−中級編
A 独立した2群間の比率を比較する〜Fisherの正確検定、カイ2乗検定〜
B 対応のある2群間の比率を比較する〜McNemar検定〜
C 独立した2群間の連続変数を比較する〜t検定、Welch検定、Mann-Whitney U検定〜
D 対応のある2群間の連続変数を比較する〜対応のあるt検定、Wilcoxon符号付順位和検定〜
E 独立した3群以上の間の連続変数を比較する〜一元配置分散分析、Welch検定、Kruskal-Wallis検定〜
F 2つの因子で群別化した連続変数を比較する〜二元配置分散分析〜
G 対応のある3群以上の連続変数を比較する〜反復測定分散分析、Friedman検定〜
H 2つの連続変数の相関を評価する
I 2群の生存曲線を比較する
Chapter5 EZRでこんなこともできる−上級編
A 比率についての多変量解析を行う〜ロジスティック回帰〜
B 連続変数についての多変量解析を行う〜重回帰〜
C 生存曲線についての多変量解析を行う〜Cox比例ハザード回帰〜
D 定性検査の特性を評価する
E 定量検査の診断への特性を評価する
Chapter6 EZRのTIPS集−学会発表、論文発表への近道
A 新しい変数を作る
B きれいなグラフで発表する
C きれいな表で発表する
D 解析の履歴を保存する
E 論文で使用統計ソフトについて記載する
Appendix 付録
A EZRの解析機能一覧
B サンプルファイル一覧
C おすすめの資料〜本書を読み終えて次のステップに進むために〜
INDEX
序
おそらく,本書を手に取られている人の多くは医療関係者ではないでしょうか.医療にたずさわる中で,さまざまな場面で疑問が生じると思います.はたしてこの検査はこの患者さんの診断に役に立つのだろうか?この新しい治療法と従来の治療法のどちらがこの患者さんの予後を改善するのだろうか?などなど.このような日常診療で生じた疑問(クリニカルクエスチョン)について,既存の研究結果(エビデンス)を参照しながら考えて診療を実践するのがEvidence-based medicine(EBM)です.一方,既存の研究結果で解決できない場合には臨床研究が必要になります.臨床研究のためには統計学が必須です.また,臨床研究のような大げさな試みでなくとも,日常診療におけるちょっとしたできごとについても統計解析を加えることで,その意義がより明解になります.
しかし,統計解析は概して医療関係者にとってハードルが高い存在です.どのようなときにどのような解析手法を用いればよいのか?解析結果はどのように解釈すればよいのか?そもそも有意差とはなにか?統計解析とはなにか?そして,これらのことが少しわかってきたとしても,実際にどのようにデータを集めて,どのように解析すればよいのか?世の中にはさまざまな統計解析ソフトが市販されていますが,いずれも高価であったり,操作が難しかったり,わかりやすい解説書がなかったり,と初心者にやさしいソフトがありません.
そこで,まず無料で,かつ簡単に操作できる統計解析ソフトの作成に着手しました.これはRという定評のある無料統計解析ソフトをもとにしています.Rをマウス操作だけで簡単に解析を行うことができるようにするRコマンダーをRに導入し,さらに医療分野でしばしば必要になる統計解析機能を組み込んだ統計ソフトがEZR(Easy R)です.もちろん,医療分野以外でも一般的な統計解析ソフトとして十分な機能を備えています.すでに大学や医療機関の統計学の講義に採用されており,EZRを統計解析に使用した論文も数多く発表されています.
本書では最初に統計学の基礎的な知識を学んでいただき,次に実際のデータの作成,EZRのインストールなどの準備を進めます.そしてまずはデータをじっくりとながめて要約してから,いよいよ検定に入るという,実際の統計解析の流れに沿って読んでいただくことができます.初心者でも読みやすくなるように難しい内容はCOLUMNや最後のTIPSにまとめてあります.さらに本書を読み終えてEZRのより高度な機能やRについても学んでみたいという場合は上級編である拙著の『EZRでやさしく学ぶ統計学』(中外医学社)にお進みください.そしてEZRの宣教師としてEZR世界征服計画にご協力ください(冗談です.念のため).
本書を読むことによって統計解析が皆様に身近なものになり,気が向いたらPCを開いて,ささっと統計解析ができるようになる,そんな一冊になることを期待しています.
2014年10月
自治医科大学附属病院・附属さいたま医療センター血液科
神田善伸
われわれ医療関係者は、医学の具現とそれを人類に還元する使命がある。そのためにはまず、自然科学の一分野としての医学の中で真理の探究を行う必要がある。対象が患者であれ、試験管であれ、実験動物であれ、そこから得られた経験から“神のみぞ知る真理”を見つけ出さなければならない。その“経験から真理を導き出すためのツール”が統計である。つまり、実験や臨床経験で得られたデータを統計解析にかけて検討し、“有意差がある”結果が得られれば、“神のみぞ知る真理を見つけ出す糸口になる”と考えることになる。ところが実際には、データは得られたが、それをどの統計で検討すればよいのかでつまずいてしまうことがある。また間違った統計解析法を使えば、そこで仮に有意差が得られても“神のみぞ知る真理”を誤って解釈してしまうことになる。
世間にあふれる統計のマニュアル本の多くは、解析のデータ入力とソフトの使用方法にfocusされたものがほとんどで、統計解析に一番大事な“どういう統計解析を選択すれば、データの中から真理を導き出せるか”という点に関する記載が少ないのが現状である。それに比して本書は、EZRという無料で、かつ高度の解析まで可能なソフトのマニュアル本でありながら、Chapter 1で統計解析の基本的考え方・多重比較やバイアスの問題点をも、余分な専門用語なしで簡潔かつ明快に解説されていることが特筆すべき点である。また本文中ところどころに「Column」という解説が挿入されており、これは統計解析の基礎事項の解説で、これだけ抜き出して読んでも統計学の基礎知識が得られるよう配慮されている。
Chapter 3ではデータ入力の具体的入力方法が述べられており、実際のデータ形式と適切な入力方法というかたちになっている。入力方法のマニュアルとしてはもちろん、データの形式に対する適切な解析方法の選択の判断材料としても一読の価値がある。Chapter 4では本格的解析の方法が述べられている。本章でもデータ形式に応じて大まかな解析方法が選択できるように配慮されており、各章でさらに細かくデータ解析方法の選択と具体的ソフトの操作方法が詳述されている。さらに結果の解釈の項目では、解析結果と同時にグラフが示されており、visualにも結果が概観できるようになっている。横道にそれるが統計解析においては、実はvisualな印象からくる判断がかなり重要である。これは、「真理の探究=自然科学的考え方=数式」とは矛盾する印象であるが、得られたデータをいくつかのグラフにしてみて“こことここを比べれば差が出そうだ”という第一印象から解析方法を選択することは、解析方法をいくつか行い有意差が出るまでtry &errorを行うより有効であるし、結果に関して散布図や箱ひげ図を併記したほうが、有意差の有無やどの程度群間で差があるのかが一目でわかる。
Chapter 5では、医学解析にはこれからますます重要度が増すといわれるロジスティック回帰分析をはじめとして、Cox比例ハザード解析などの高度な解析方法が、やはりグラフも示されて述べられている。フリーソフトでここまで提供されていることは驚きであるが、疫学的検討では当然であったこれらの解析方法は、これからは臨床研究でも必要とされる時代であるため有用である。さらにChapter 6では統計解析の結果をいかに他人に伝えるかについて、わかりやすい学会発表や論文投稿の仕方についてまでも解説されている。
本書は、EZRという無料でありながら、高価な有料ソフトに匹敵または凌駕する機能をもつ画期的なソフトのマニュアル本と呼ぶにはとどまらず、統計学的考え方の基本、データの形式による解析方法の選択の具体例、解析結果の臨床的解釈の意味、解析結果の伝達方法まで解説してあるものであり、“医学に携わる者が、どのようにして自然科学的真理を探究すればよいか”の原点に立ち返る方法論のマニュアル本といってよい良書である。
臨床雑誌整形外科66巻4号(2015年4月号)より転載
評者●関東労災病院スポーツ整形外科部長 岩噌弘志
統計学は、臨床研究や学術論文作成のための取っ付きにくい分野という印象がある。しかし日常診療の現場においても、自分の感覚や印象を統計によって数値化してみることで、より科学的な「言語化」が可能になることをしばしば経験する。とはいえ、有名な統計ソフトはいずれも個人で購入するには高額すぎ、気軽に何でも「ちょっと計算してみよう」というわけにはいかないのが現状である。
「R」はさまざまな機能を備えた定評ある無料統計ソフトで、昨今は数多くの臨床研究に用いられている。無料ならぜひ使いたいところだが、単独で用いるには何をするにもコマンド入力が必要で、いかにも統計の玄人が使用するソフトというイメージである。「Rが使えなければ統計ができるとは言えない」とおっしゃる方もいるほどである。そのようななか、「初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析」が上梓された。
著者の神田善伸先生は、私が研修医であった頃に血液内科でご指導をいただいた先生である。忙しい日常診療や研修医指導のなかでも恒常的に多くの文献を読まれ、すでに大きな臨床研究をいくつも手がけていらっしゃった神田先生の毎日は、私にとって衝撃的であった。このほど、統計学を深く理解して自由自在に使いこなされる神田先生が、Rを難しいコマンドなしに利用できる「EZR」というプログラムを何とご自身で開発され、さらに本書をしたためられたということで、再度衝撃を受けているところである。
EZRの使用勝手のよさはすでに定評があり、日本語で扱えることも正直なところ大変にありがたいと思う。EZRの使用法を示した本書の特徴は、プログラムの使い方のみならず、基本的な統計学の勉強が同時進行で行えるところにある。統計学の理論の本だけ読んでも眠くなるだけだが、サンプルデータファイルをダウンロードして実際にEZRでデータを扱いながら、どういうことを明らかにしたいのかにより、どの検定を利用できるのか、そして検定結果の評価といった理論を体得することができる。もちろん自分の手元にあるデータセットを用いて検定を行うことで、統計結果から明言してよいことと、その限界を理解することもできる。自分のデータセットを扱うのに際して親切な内容であるのは、Chapter 3の「B。解析前のデータファイルを編集する」という項目である。解析前のデータクリーニングはその後の解析をスムーズかつ適切に進めるのに必須であるが、その作業を手取り足取りで詳細に示してあるのは、神田先生がこのステップを重要視されていることの表れではないかと考えられる。Chapter 6「EZRのTIPS集」、そして各所にちりばめられたCOLUMNも実践的な内容であり、とくにCOLUMNだけ、先に読んでみるのもよいのではないかと思う。
「手元にデータがあって、いろいろと自分で検定を行ってみたいがソフトを買うお金がない……」という総合診療科の後輩にこの本を貸したところ、「EZRを使うのが楽しくて仕方ない」となかなか返してもらえずにいる。初めての統計処理から本格的な臨床研究まで、本書はどの人にとっても大きな足がかりになるものと確信している。
臨床雑誌内科116巻2号(2015年8月号)より転載
評者●順天堂大学大学院医学研究科感染制御科学/総合診療科准教授 上原由紀
動画
ご案内