研究に有用なソフトウェア-統計ソフト
ここ数日のエントリーをまとめて、統計ソフトのレビューをしたいと思います。
「医薬研究者のための統計ソフトの選び方 」【bk1】【amazon.co.jp】を参考にして、現在よく使われている統計解析ソフトをまとめてみました。
販売会社 | Platform | 値段 | 日本語化 | 使用論文数 | |
SAS | SAS | Win, Mac | レンタル制 | 186 | |
SPSS | SPSS | Win, Mac(英語版のみ) | ¥94,500(A) | あり | 243 |
Stata | インフォーマティック | Win, Mac, UNIX | ¥126,000(A), $625(A) | なし | 93 |
StatView | SAS | Win, Mac OS9のみ | 生産中止 | あり | 151 |
STATISTICA | スタットソフト | Win | ¥129,500 | あり | 62 |
SigmaStat | HULINKS | Win | ¥87,885(A) | なし | 103 |
SYSTAT | HULINKS | Win | ¥191,100(A) | あり | 33 |
MINITAB | インフォーマティック | Win | ¥41,790(A) | あり | 15 |
Prism | エムデーエフ | Win, Mac | $445.50(A) | なし | 393 |
JMP | SAS | Win, Mac | ¥54,000(A) | あり | 41 |
Excel | Microsoft | Win, Mac | あり | 187 |
※使用論文数はBMJ, JCI, JPET, PNAS, JAPに掲載された論文のうち該当ソフトが使われている論文数。。
※(A)はアカデミック価格。
統計解析の定番ソフトですが、残念ながら、Statview 5を最後に、2002年12月末で生産中止になってしまいました。解説本もいろいろ発売されています。私も愛用していましたが。Mac版はOS9でしか動きませんので、OSXからはClassic環境で動かす必要があります。また、Intel MacではClassic環境がサポートされませんので、StatViewを動かすことはできません。Windows版もあります。
Windows版の統計解析ソフトではもっとも使われているソフトです。Mac版もSPSS for Macとして存在しますが、英語版のみで、バージョンがWindows版に比べ遅れています(Macは11、Winは14)。SPSSはSASとほぼ同じ時期に作られた高い信頼性を持つ汎用統計パッケージです。通常はメニューにより操作しますが、コマンド式でも使えます。SPSS Baseを中心にして、必要なオプションを追加することになります(医学用であれば、BASE systemにAdvanced ModelsとRegression Modelsを追加すれば十分)。医学用のパッケージとして、SPSS Health Care PackとDr. SPSS IIが存在します。
Graphpad PrismはUCSDの薬学研究者であったMotulsky博士が作った統計ソフト、医学生物学における統計解析にフォーカスしているため、生存率解析などの統計解析がそろっています。残念ながら日本語化はされていません。Graphpad社、または、日本の代理店((有)エムデーエフ)から購入できます。Prismに関する書籍は現時点では発行されていませんが、日本の代理店を通して購入した場合は日本語のマニュアルが添付されています。Mac版とWindows版があり、どちらも、価格は$495(アカデミックプライスは$445.50)、日本の代理店から直接購入した場合は、¥79,380です。現在、Prism 4が最新版です。
統計ソフトはどれもそうなのですが各ソフトによって手順や操作性が異なります。Statviewに慣れていた私にはPrismの最初のデータテーブルの作り方からして、とまどいました。しかし、Statviewとの手順の違いに慣れてしまえば、インターフェースを含めとても使いやすいソフトだと感じました。統計解析の手法も私が使う範囲ではほぼ十分だと思いました(唯一、ANCOVAがないのが残念でした)。優れていると感じたのは、データセットに対して適切でない統計解析法は選択できないようになっていることです。また、グラフのクオリティは他の統計ソフトに対する大きなアドバンテージだと思います。
一つだけ、とても気になったのは、多重比較をおこなった際にp値が<0.05と表示されるだけで、実際のp値が出力されないという点です。多重比較というのは、非常によく使う解析法なので、この点が改善されないと私自身、乗り換えることができません。もし、実際のp値を出す方法をご存じの方がいらっしゃれば、是非教えて下さい。
昨年、アップル-MedicalでPrismが取り上げられましたので、是非読んでみて下さい。
アップル - Medical - Prism:医学統計解析をインタラクティブに処理
上記のp値の問題があるので、私自身は、完全に乗り換える決断は下せませんが、30日間のDEMO版がダウンロードできますので、気になる方は試してみて下さい。
なお、以下の書籍はPrismの解説書ではありませんが、Prismを開発したMotulsky博士の書で、統計の書籍として人気のある本です。
「数学いらずの医科統計学 〜コンピュータ・エイジのための統計学指南」
著者:Harvey Motulsky、津崎 晃一監訳、税込価格: ¥4,935 (本体: ¥4,700)、出版:メディカル・サイエンス・インターナショナル、ISBN:4-89592-175-1、発行年月:1997.12 【bk1】 【amazon.co.jp】
Prismと並んで、現在のMac OSXで動く統計ソフトとしてあげられるのがJMP。Statviewが開発中止になったときには、後継ソフトとしてJMPが指定されたわけですが、私の周囲を見ても、JMPに移行する人は多くなく、classic環境でStatviewを使い続ける人が大半でした。私自身もそうでした。
JMPはSASInstitute Inc.の創業者の一人であるJohn SallがMac用に開発したメニュー型ソフトで、John's Macintosh Productの頭文字を取ってJMPと名付けられました。JMPは操作性を重視して作られた SASの廉価版と位置づけと考えるとわかりやすいと思います。JMPの操作手順は探索的であり、適応すべき統計手法をソフト側が判断するというのが一番の特徴です。統計手法の選択に熟知していない人にはありがたい反面、統計手法に精通した人にはまどろっこしいという感じがするかもしれません。
私自身、操作手順やJMP独自のデータのヴィジュアル化に慣れていない部分もあり、食わず嫌いでしたが、うちの大学にはサイトライセンスがあるということで、JMP 5.1を使ってみることにしました。 ちなみに、現在は、JMP 6が最新版になっています。
「医薬研究者のための統計ソフトの選び方 改訂2版」【bk1】【amazon.co.jp】に沿って、実際にJMPを使ってみると意外と使いやすいソフトであることが気付きました。「バイオ研究がぐんぐん進むコンピュータ活用ガイド」【bk1】【amazon.co.jp】の統計ソフトの紹介で、田久先生が「SASやSPSSからJMPに乗り換える人はいるけれど、一度JMPを使ってほかのソフトに乗り換える人はいない」と言っているのがわかるような気がしました。
多重比較に関しては、TukeyのHSD検定、HsuのMCB検定、Dunnettの検定をサポートしています。TukeyとDunnettでほとんど対応ができると思いますが、Dunnettでは正確なp値は出るものの、Tukeyでは正確なp値は出ません。先日紹介したPrismはTukey, Newman-Keuls, Dunnett, Bonferroni といった多重比較法をサポートしていますが、いずれも正確なp値は算出しません。ちなみに、StatviewもTukeyとDunnettのP値は算出しません。
あと、一つの問題は、Intel Mac上でのJMP 5.1の動作は保証されていないと言うこと。実際MacBook ProでJMP5.1を動かした場合、一件問題なく動いているのですが、多重比較計算だけはエラーが出てしまって計算できません。来月、JMP 6のサイトライセンスが始まるようなので、それに乗り換えて検討してみたいと思いますが、JMPのUB化を待たないといけないかもしれません。いずれにしても、思っていたよりはるかに使いやすいソフトでした。
JMPの正規価格は153,300円ですが、アカデミック版は63,000円、また、東京大学、慶應義塾大学、関西学院大学はサイトライセンスを導入していますので、無料で使用可能です。
JMP関連の書籍は「研究者の書棚」>「統計関連書籍」をご覧下さい
Excelのアドイン統計ソフト
これは単体の統計ソフトではありませんが、Excelのマクロ機能を使って、Excel上で統計解析をおこなうアドインソフトと呼ばれるものを使っている方も多いようです。Excelのアドイン統計ソフトにはフリーウェアをふくめたくさんのものがあります。
- Statcel2: 4Stepsエクセル統計(第2版)についてきます
- StatMate III