2008.01.28

掲示板のデータが飛んでしまった

サイト管理者として恥ずかしい話なのですが、掲示板のデータを消失してしまいました。

おかしいなと思ったのは、先週末でした。トップページのカウンターの数字がリセットされていたのです。これはすぐに手持ちのデータを使って復旧できたので、これで直ったと思っていました。

2日後に再び、カウンターの数字がリセットされており、おかしいなと思い、掲示板を見てみると、研究留学フォーラムと、Biotechフォーラムのデータがすべて飛んでしまっていました。

私が借りているサーバー会社では、ちょうどサーバーの入れ換え作業をおこなっており、そのことが影響したんだろうと思います。

サーバー会社もミラーリングはしているものの、個人的にはデータを提供できないと言うことで、手元にある最新のバックアップを使って、復旧。しかし、Biotechフォーラムは一ヶ月強、研究留学フォーラムは半年分のデータを消失させてしまうことになりました。この間、非常に有用な情報の交換が行われていたことを考えると、みなさまにとても申し訳なく思います。

かれこれ、このサイトは8年間になります。さいわいなことに、これまで、一度も掲示板プログラムの問題が生じることがありませんでした。昔は、1ヶ月に1度は自分でバックアップを取っていたのですが、最近は、年に数回バックアップを取る程度になっていました。今後は、もう少し豆にバックアップをとりたいと考えています。

とりあえず、ご報告と、お詫びまで。

2008.01.27

留学中にビザステッカーの貼ってあるパスポートを紛失した場合の対処法(体験談)

miwaccoさんから、留学中にJ1ビザステッカーの貼ってあるパスポートを紛失されたときの体験談をいただきました。万が一の時にはとても参考になると思いますので、掲載いたします。

先日、J1ステータスのビザステッカーを貼ったパスポートを紛失してしまいました。アメリカで研究留学にこられた方がこのような経験をされることはまれかと思いますが、今後の参考になるかと思いますのでご報告申し上げた次第です。以下に私の質問に対する米国大使館からの回答を載せます。今後の参考としていただければ幸いです。なお、私はDS−2019とI-94を所持していました。もし盗難などにあわれ、この二つも紛失された場合は、移民局への届け出も必要になるようです。

以下回答↓

手元にI-94とDS-2019を保持していれば、ビザがなくてもI-94に記載されている滞在期間の間に米国に滞在することはできます。日本に一時帰国する必要がありませんが、帰国した場合、米国に戻るために新しいビザを再申請する必要があります。

ただし、ビザが紛失に関して、http://japan.usembassy.gov/j/visa/tvisaj-form-niv-lostppt.htmlに報告してください。

新しいJ1ビザを再申請するため、必要書類は以下の通りです:

  1. SEVISシステムによって発行された新しいDS-2019 (A-B)。このフォームは、学校の適切な担当者が記入し署名している必要があります。
  2. 米国での生活費がまかなえることの証明
  3. 機関求められる成績証明書またはその他の資格の証明書。
  4. 16歳以上の申請者:もれなく記入したDS-158
    補足情報:このフォームは、非移民ビザ申請者の連絡先情報と職歴を記入するものです。詳細は、以下のURLを参照してください。http://japan.usembassy.gov/e/visa/tvisa-nivforms.html
  5. SEVIS費用を支払った証明 (SEVISのステータスはまだ有効である場合、そのを証明できるものを持っててください。SEVIS費用を再支払う必要がありません)

上記以外の他、面接時に、一般的な出願書類の必要書類も必要となります。これらの文書のリストは、大使館のウェブサイトhttp://japan.usembassy.gov/e/visa/tvisa-niv-walkin1.htmlを参照してください。

詳細は、大使館のウェブサイトhttp://japan.usembassy.gov/e/visa/tvisa-niv-fm.htmlを参照してください。

2008.01.25

医家向け電脳道具箱その参「医中誌Webの検索達人をめざす」

前回の医家向け電脳道具箱では「医学中央雑誌刊行会訪問記」として医学中央雑誌(医中誌)データベースがどのように作られているのかを紹介した。データベース製作の裏側を見ることによって、医中誌Webでの検索ヒット率を上げる方法がいくつか見えてきたので紹介したい。なお、医中誌データベースのインターフェースは2つあり、大学や病院など法人での契約の場合「医中誌Web」となり、個人での契約では「医中誌パーソナルWeb」となる。両者には基本的な差異はないので、「医中誌Web」を使って話を進めることにする。

 

■アドバンスドモードを使う

医中誌Webの検索画面にはベーシックモード(左図)とアドバンスドモード(右図)の2つの検索モードが存在する。両者の違いは、ベーシックモードがシンプルなインターフェースであるのに対し、アドバンスドモードにはベーシックモードにはない2つの機能を備えていることにある。その機能とは、検索履歴が残り、その検索履歴を使った履歴検索ができることと、候補語辞書の参照ができることである。ユーザーの使用率では、ベーシックモードを使っているユーザーの方が多いようだが、検索達人を目指すなら、間違いなくアドバンスドモードを使うことをおすすめする。

 

 

■シソーラスを理解する

前回の「医学中央雑誌刊行会訪問記」では、医中誌データベース作製において、インデクシングという作業が行われているという話をした。インデクシングというのは、各文献に対してキーワードを付与する作業である。この際、重要なのが、勝手なキーワードを付けないように、キーワード集をあらかじめ用意しておくということである。このキーワード集をシソーラスという。医学領域のシソーラスとしてもっとも有名なのが、米国国立図書館(NLM)で作成しているMedical Subject Headings (MeSH)であり、MEDLINEの索引・検索に用いられている。医学中央雑誌刊行会でもMeSHにほぼ準拠した日本独自のシソーラスとして「医学用語シソーラス」を作製しており、最新版は第6版になっている。PubMedや医中誌Webの高い検索効率を支えているのが、シソーラスを用いたキーワード検索の仕組みである。

データベース検索には大きく分けて2つの方法がある。ひとつは、全文検索であり、データベース中に存在する文字列をすべて検索する方法である。全文検索はコンピュータ負荷が大きいが、近年ではコンピュータの高性能化が十分に進んだため、Googleなどの検索システムで採用されている。もう一つの検索方法がキーワード検索である。キーワード検索は、各データにキーワードを付け、それによって検索をおこなう方法である。キーワードを付与するという手間がかかるが、検索が高速になるとともに、主題が一致しているにもかかわらず全文検索でヒットしないデータもヒットできるという特徴がある。PubMedや医中誌Webの場合、格納されているデータは、タイトル、著者名、抄録など限られたデータであり、全文検索で高率にヒットさせるのは難しい。そこで、各文献データにシソーラスに基づいたキーワードを付与することにより、キーワード検索を可能にしている。実際には、キーワード検索と同時に全文検索もおこなうことで検索ヒット率を上げている。たとえば、「糖尿病性腎硬化症」で医中誌データベースを全文検索するとわずか5件しかヒットしない。しかし、「糖尿病性腎硬化症」をキーワード検索を使って検索すると4960件にまでヒット数が跳ね上がる。これは、「医学用語シソーラス」の中で「糖尿病性腎硬化症」は「糖尿病性腎症」と同義語であると索引されていて、「糖尿病性腎症」というキーワードで検索しているからである。

前述したように、シソーラスは同義語の中でどれかひとつをキーワード(統制語、またはディスクリプタと呼ぶ)として指定している用語集である。たとえば、医学用語シソーラスでは、糖尿病性腎症を意味する用語として、「糖尿病性腎症」「糖尿病性腎硬化症」「糖尿病性腎合併症」「糖尿病性腎糸球体硬化症」「糖尿病性腎障害」「糖尿病性腎不全」の中で、「糖尿病性腎症」を統制語とし、他の言葉を同義語として登録している。したがって、医中誌Webにおいて、「糖尿病性腎硬化症」で検索をかけると、「糖尿病性腎硬化症」が統制語である「糖尿病性腎症」にマッピングされ、「糖尿病性腎症」がキーワードとして索引されている論文がヒットするのである。

シソーラスにはもう一つの役割があり、統制語同士の階層関係が定められている。たとえば、「水-電解質平衡異常」の下位に「高ナトリウム血症」や「低カリウム血症」などが指定されている(右図)ため、「水-電解質平衡異常」でこれらすべての関連論文をヒットさせることができる。

「医学用語シソーラス」は4年に一度改訂作業が行われているが、日進月歩の医学の世界では4年もすれば、新しいテーマや用語がたくさん出現する。したがって、「医学用語シソーラス」とは別に、医中誌データベースでは、随時、同義語を登録したり、新しい用語については「医中誌フリーキーワード」として登録して最新の論文にも対応している。これらの用語は、「医学用語シソーラス」改訂時に、統制語や同義語として取り込まれるかが検討される。

 

■医中誌Webの検索システムを理解する

具体的に、医中誌Webの検索がどのようにおこなわれているか説明しよう。医中誌Webで「狂牛病」を検索した場合、まず、「狂牛病」と同義語の言葉がシソーラス上にないか調べられる。シソーラス上で「狂牛病」の同義語として登録されている統制語は「ウシ海綿状脳症」であるので、「ウシ海綿状脳症」がキーワードとして索引されている文献がヒットする(459件)。また、同時に「狂牛病」で全文検索がおこなわれる(52件がヒット)。最終的な検索結果はキーワード検索と全文検索の集合和となり、463件がヒットするということになる。実は、このような検索の過程が医中誌Webではきちんと見えるようになっており、検索式として「(ウシ海綿状脳症/TH or 狂牛病/AL)」と表示されている。/のうしろのTHは「シソーラス」、ALは「すべてのフィールド」という意味である。

PubMedにおいても医中誌Webと似たような検索プロセスがおこなわれている。ただし、PubMedのインターフェースポリシーは「なるべくシンプルに」ということであるようで、表面的には検索式を見ることはできない。しかし、「Details」というタブをクリックすると、検索式を見ることができる(右図)。たとえば、「diabetic nephropathy」で検索してみると、検索式は「"diabetic nephropathies"[MeSH Terms] OR diabetic nephropathy[Text Word]」となっており、「diabetic nephropathy」という統制語でのキーワード検索と「diabetic nephropathy」による全検索がおこなわれているというのが確認できる。

 

■シソーラスを使って検索ヒット数を上げる

シソーラスを理解した上で、検索ヒット率を上げるための工夫を紹介しよう。日本語固有の問題を考えた場合、医学用語シソーラスの存在は非常に大きい。日本語の医学用語の場合、原文のままアルファベットで表記したり、カタカナで表記したり、様々な訳語が付けられることがあるからである。たとえば、アンギオテンシンⅡ受容体拮抗薬について調べたいとする。実際に、「アンギオテンシンⅡ受容体拮抗薬」で検索してみると、なんと、ヒット数は0である。一瞬、目を疑うが、実は、これには日本語特有の問題が隠れている。医中誌データベースではローマ数字を扱うことができないので、この場合、ローマ数字のⅡを大文字の「I」二つとして入力する必要がある。「アンギオテンシンII受容体拮抗薬」と入力すると、4596件がヒットする。こういった問題は他にもあって、ギリシャ文字などは扱うのが難しい。NFκ-B(nuclear factor κ-B)を意図して、「NFkappa-B」と入力すると、1件しかヒットしない。統制語はNF-Kappa Bでスラッシュとスペースの位置が微妙に違うのである。

では、このように予想外にヒット数が低く、どのような用語で検索すればよいのかわからないといったケースではどうしたらよいだろうか?その場合は、統制語が何かを調べるとよい。統制語を調べるにはアドバンスドモードの「候補語辞書の参照」をクリックしてシソーラスを検索する。たとえば、アンギオテンシンⅡ受容体拮抗薬で検索した場合に、あまりにも少ないヒット数で統制語にたどり着いていないことが予想されれば、該当する統制語を調べる。「候補語辞書の参照」の検索窓に「アンギオテンシン」だけ入力して参照ボタンをクリックすれば、「アンギオテンシン」を含むたくさんの同義語、統制語が登場する。それによれば、「アンギオテンシンⅡ受容体拮抗薬」の統制語が「Angiotensin II Receptor Antagonists」であることがわかる。「Angiotensin II Receptor Antagonists」にチェックを入れて「採用」ボタンを押せば、「Angiotensin II Receptor Antagonists/TH」が検索窓にはいって、もっともヒット率の高い検索ができる。NFκ-Bの場合、「nuclear factor」でシソーラス検索すれば、「NF-Kappa B」が統制語であることがわかる。

 

■絞り込みを上手におこなう

シソーラスを使うことによって、より多くの文献をヒットすることができるが、実際にはかなりの数(数千)がヒットしてしまい、自分が探している文献にたどり着くためには、そこから上手に絞り込みをおこなっていく必要がある。絞り込むためには、条件を複数組み合わせることによっておこなうことが基本となるが、その際には、検索履歴を使うと便利である。また、「絞り込み検索へ」というボタンを押すと「絞り込み検索画面」が開き(右図)、検索結果を様々な条件で絞り込むことが可能である。特に、医中誌データベースは会議録を多く含んでいるので、会議録を除外したいときには、「論文種類」の「会議録除く」にチェックを入れて絞り込むだけで、かなり絞り込むことができる。また、私の場合、医中誌Webで検索するときには、日本語で書かれた総説記事を探すことが多いのだが、その場合は、「論文種類」の「総説」と「解説」にチェックを入れて絞り込むと便利である。

 

■その他の小技

その他、いくつか検索達人になるための小技を紹介しよう。

・ダブルクォーテーション
医中誌Webではスペースや記号を含む検索語を検索する場合は、一工夫が必要である。たとえば、「amino acids」で検索する場合は、このまま「amino acids」と入力すると、医中誌Webではスペースはandと解釈されるので、「amino」の検索結果と「acids」の検索結果の集合和が検索され2,098件がヒットする。それを避けるためには、"amino acids"という具合にダブルクォーテーションで囲めばよく、こうすれば目的のものが検索され14,560件がヒットする。

・論理演算子
医中誌Webの場合、空白で検索語を切った場合、andと判断される。論理演算子として、論理積(and/スペース/*)、論理和(or/+)、論理差(not)、()が使用できる。

・フィールドの指定
検索語の末尾に/とフィールド名を付けることで検索するフィールドを指定することができる。TH(統制語)、AB(抄録)、AU(著者名)、IN(所属機関)、JN(収載誌名)、TI(タイトル)、AL(All Field)などである。

・完全一致検索
「田中明」という著者名で検索をかけると、487件がヒットし、その中には、「田中明」だけでなく、「田中明彦」「田中明美」などが含まれてしまっている。「田中明」のみを検索したい場合は、検索語全体を[ ]で囲み、フィールドを指定する。つまり、[田中明]/AUを検索窓に入力すればよい。この場合、196件がヒットした。ちなみに、著者名で検索するときには姓と名の間にスペースは入れない。また、英語雑誌の著者名はちょっと扱いが特殊である。ローマ字の著者名もスペースなしで続ける必要がある。たとえば、Yutaka Kobayashiの場合は、KobayashiYutakaで検索する。Kobayashi Yutakaとすると、KobayashiとYutakaの集合和になってしまうので、ものすごい数の検索がヒットしてしまう。ちなみに、2002年以降はすべての著者の名前が入力されているが、それ以前は、必ずしもすべての著者の名前がデータベースに入力されているわけではないので注意されたい。

 

■全文テキストへのリンク

最後に、もう一つ。検索効率という話ではないが、全文テキストへのアクセスという話をしておく。近年、医学データベースにおいては、全文テキストへのリンクというのが重要な機能となっている。医中誌WebもVer4から、全文テキストへのリンク機能が追加された。検索結果にはオンラインジャーナル等へのリンク、図書館の所蔵検索システムOPAC(Online Public Access Catalogue)へのリンクが張られている。日本語医学文献の場合、まだ全文テキストのオンライン公開が十分には進んでいないが、メディカルオンライン(メテオインターゲートの国内医学雑誌の全文PDF配信サービス)、PubMed、Cross Ref(世界の主要な学術出版社が共同で運営している電子ジャーナルのリンク情報管理提供システム)、Pier Online(サンメディアがホスティングするオンラインジャーナルサイト)、CiNii(国立情報学研究所の論文情報ポータルサイトCiNiiとの相互リンク)のリンクが張られている。今後、日本語文献の全文テキストの公開も進んでいくと思われ、使い心地もよくなっていくことであろう。全文テキストのオンライン公開が進んでいない状況では、各図書館における所蔵状況がわかることは便利であるが、それに関してはOPAC連携によって機能が果たされている(ただし、機関ごとの事前の登録が必要)。検索結果にあるOPACのリンクをクリックするとOPAC検索がダイレクトにおこなわれる。また、機関が所蔵している雑誌だけに所蔵アイコンを表示することもできる。

今回のエッセイを書くに当たり、多くの資料を提供してくださったNPO医学中央雑誌刊行会の松田真美様に感謝いたします。

以上、医学のあゆみ220巻11号「医中誌Webの検索達人をめざす」より許可を得て転載

その他の回は医家向け電脳道具箱の一覧をごらん下さい。

2008.01.23

医家向け電脳道具箱その弐「医学中央雑誌刊行会訪問記」

■医学中央雑誌刊行会を訪問した

医学中央雑誌(医中誌)といえば、日本語文献データベースのほとんど唯一無二の存在。医学英語文献を探すならPubMed、医学和文文献を探すなら医中誌Webというくらい、医師・医学研究者にはなくてはならない存在である。今回、医中誌を発行しているNPO法人医学中央雑誌刊行会を訪問し、お話しを伺う機会があった。医学情報データベースの裏側を見ることができる貴重な機会であったので紹介したい。

 

■個人事業として始まった医中誌

医中誌は1903年(明治36年)に刊行された抄録誌である(図1)。医中誌の初代の主幹、尼子四郎(1865〜1930)は、1887年に広島医学校を卒業後、芸備医学会(現在の広島医学会)創立に関わるなどの活動を経て、1903年に東京の谷中で開業、すぐに千駄木に移り、同年、医中誌を刊行した。この千駄木での開業時代に、同じ町内に住んでいた夏目漱石に主治医として、また友人として親しんだ。「吾輩は猫である」の登場人物「甘木先生」のモデルは尼子四郎であったとされている。

創刊当時の医中誌の編集・発行の作業は家内工業的であったが、二代目理事長、尼子富士郎(1928-1972年、医学中央雑誌刊行会理事長、医中誌発行の功績により多くの賞を受賞した)の時代になっても、編集・発行作業の方法は創刊時とそれほど変わらなかったらしい。現在の医学中央雑誌刊行会は、「こんなところに!」というような杉並区高井戸の閑静な住宅街にひっそりと建っている(図2)。現在の社屋は二代目の理事長であった尼子富士郎氏の自宅あとに建てられたもので、改築される前は尼子富士郎氏の自宅を兼ねていた。尼子富士郎氏は高井戸にある浴風会病院の医長を兼務しており、浴風会病院と自宅兼事務所を往復する日々を送っていた。文献の採択、抄録の編集、校正については、すべて尼子富士郎氏が目を通していたという。

医中誌創刊時の年間収録文献数は2000件弱(収載誌約60誌)で、月1回の発行だったが、現在では、年間収録文献数は30万件を超えている(収載誌約2400誌)。医中誌の形態は時の流れとともに変わってきており、長い間冊子体として提供されていたが、1992年よりCD-ROM版の提供が始まり、2000年よりインターネットによる医中誌Webの提供が始まると、読む雑誌というより、検索のためのデータベースとしての意味合いが強くなってきた。そして、冊子体での発行は2002年終了、CD-ROM版の提供も2006年3月に終了、現在ではインターネットによる医中誌Web(法人向け、図3)、医中誌パーソナルWeb(個人向け)による提供のみとなっている。医中誌データベースは長い間、そして現在においても、医学、歯学、薬学、看護学、獣医学および関連領域の国内の最大の文献データベースとして活用されている。

 

■医中誌の抄録は第三者抄録が中心

今回、医中誌データベースの作製過程を伺ったのだが、データベースが完全電子化され、閲覧もインターネットベースになっているにもかかわらず、データベース作製の過程において多くのステップに人手がかかっているということに驚いた。出版社からデジタルデータが送られてきてそれをデータベースに流し込んでいるという、ほとんど自動化されている作業を私はイメージしていた。しかし、日本の出版社の電子化が遅れていることなど、様々な要因によって、自動化できない部分が多いとのことであった。

また、恥ずかしながら私が知らなかったのが、医中誌データベースに掲載される抄録の多くが第三者抄録であるという点であった。Medlineでは原文の抄録がそのまま抄録として収載されているが、医中誌データベースでは長い間にわたって第三者抄録を原則としていた。第三者抄録とは専門家である第三者が論文を読み、独自に抄録をまとめたものである。医中誌データベースに収載されているデータは原著論文の他に総説、解説記事、会議録など多岐にわたるのが特徴であるが、原著論文には原則として抄録を付けることになっている。おおよそ90%の原著論文には抄録が付与されている。その他、総説や解説などにも場合によっては抄録が付与される。近年では、学会、出版社の了解を得て、著者が書いた抄録(著者抄録)をそのまま掲載する方向で進んでいるが、現在でも、抄録のうち著者抄録は3割にとどまり、7割が第三者抄録である。また、日本の学会誌が発行している英文誌も医中誌データベースに収録されるが、その場合、日本語の第三者抄録を付けることになっている。このあたりは日本語で情報を提供するという医中誌データベースのこだわりが感じられる。著者抄録と第三者抄録の見分け方は、医中誌Webで抄録の末尾に「著者抄録」と但し書きがついているものが著者抄録であり、但し書きがついていないのが、第三者抄録である。

 

■実際に文献を見ながらインデクシングがおこなわれる

データベースの機能を高めるためにインデクシングという作業が重要である。インデクシングとは、医学中央雑誌刊行会発行の「医学用語シソーラス」に基づいて、各文献にキーワード、副標目、チェックタグ、研究デザインタグなどを付与する作業である。「医学用語シソーラス」と、膨大な同義語が登録されている用語辞書を元に、タイトルからキーワードの自動抽出がおこなわれるが、最終的には、インデクサーが実際の文献に目を通しながら、キーワードを付与するという、これまた手作業である。実際にインデクシングを行うのは職員約10名、契約者約20名のインデクサーで、毎月25000件あまりの文献にインデクシングをおこなっている。一人のインデクサーが1日に100件近くの文献にインデクシングをおこなっていることになる。

 

■医中誌データベースの作製過程

では、医学中央雑誌データベースがどのようにして作られているのか、具体的な作業を紹介する。

(1)資料の収集と採択
医中誌データベースに収録される文献情報のもととなる資料は国内の大学、研究所、病院などから発行されている紀要や学内誌、各学会が発行する会議録、医学系出版社が発行する商業誌、公共資料や講演集などで、現在は約2400誌を数える。資料の半数は学会、大学、病院、出版社からの寄贈であり、半数は購入したものである。資料の採択は1〜2ヶ月に一度の検討会で決められている。

(2)文献の採択
届いた資料に掲載された論文、記事のうちどれをデータベースにのせるのかを担当者が決める。たとえば、掲載されている論文でも医学と関連が薄いと思われる論文(たとえば、野生動物の生態)は採択されない。また、インタビュー記事や書評などは採択されない。採択された文献には論文種類が指定され、同時に抄録が付与されるかどうかが決められる。

(3)書誌情報の入力
文献の書誌情報の入力は外部の専門の業者に依頼している。業者によって入力されたデータは医中誌データベース作成システムにのせられ、以降の作業はローカルネットワークシステム上でおこなわれる。また、この段階のデータは<Pre 医中誌>として公開される。なお、Medlineの場合、書誌情報、著者抄録などは出版者側からデジタルデータで渡されることが大半であるが、日本の場合、少しずつそのようなケースも増えているが、今でも多くの文献は書誌情報の入力が必要とのことである。

(4)抄録の作成
書誌情報の入力と並行して抄録の作成がおこなわれる。抄録が存在し、学会、出版社からの了解が得られれば著者抄録が収録される。その他の場合は、外部の専門家(50名ほどの抄録作成者がいる)に依頼して第三者抄録を作成する。

(5)インデクシング
データ作成の最終段階としてインデクシングがおこなわれる(図4)。インデクシングでは、医学中央雑誌発行の「医学用語シソーラス」に基づいて、キーワード、副標目、チェックタグ、研究デザインタグを付与される。インデクシングが終了すると、毎月1日と16日に完成データとして追加される。

(1)〜(5)の行程に、最短で1ヶ月、平均3〜4ヶ月かかっている。今後、この行程をどれだけ短くできるかが現在の課題とのことである。

以上、医中誌データベースの作製過程について紹介したが、抄録誌の刊行、データベースの運営は経済的にも困難が伴うことは想像に難くない。諸外国においてはそのほとんどが公共機関に依存している中、100年を超える長きにわたって独自の情報を提供してきた医学中央雑誌刊行会の活動に敬意を払いたい。また、日本語文献特有の困難がある中、高い検索ヒット率を確保している医中誌データベースの中身に強い興味を持った。その秘密については次回紹介させて頂きたいと思う。

今回のエッセイを書くに当たり、多くの資料を提供してくださったNPO法人医学中央雑誌刊行会の松田真美様に感謝いたします。

 

以上、医学のあゆみ220巻7号「医学中央雑誌刊行会訪問記」より許可を得て転載

その他の回は医家向け電脳道具箱の一覧をごらん下さい。

2008.01.21

医家向け電脳道具箱その壱「Google Scholarを使い倒す」

■Google Scholarは学術情報に特化した検索エンジン

「ググル」といえば、「Googleで検索すること」というくらい、検索エンジンとしてGoogleは普及している。Google社は、Google検索以外にも数多くのwebサービスを提供している。その中に、Google Scholar(http://scholar.google.com/)という検索サービスがあるのをご存じだろうか。

Google Scholarは学術情報に特化した検索エンジンである。通常のGoogle検索はネット上のあらゆるドキュメントを検索対象としているが、Google Scholarは検索対象を学術論文、学位論文、書籍、学術出版会社や学会、学術機関からの抄録や論文といった学術情報に絞っていることが最大の特徴である。Google Scholarは検索対象が学術情報に限られているだけでなく、通常のGoogle検索にはないユニークな機能を提供している。

 

■Google Scholarで論文のインパクトファクターが簡単にわかる?

Google Scholarのユニークな機能の一つが文献の引用関係を表示する機能である。Google Scholarの検索結果にリストアップされる各文献データには、「引用元 ○○」というリンクがついており、その文献が他のどの文献で引用されているか、また、他の論文に引用された回数が表示される。わかりやすく言えば、各文献データの「インパクトファクター」が一目でわかるのである。

インパクトファクターは、雑誌ごとの掲載論文1報あたりの年間の平均引用回数を指標化したものであり、毎年、トムソンサイエンティフィック社の引用文献データベースWeb of Scienceに収録されるデータを元に算出されている。また、各論文ごとの引用回数や引用している論文へのリンクもWeb of Scienceで調べることができ、「Times Cited」というリンクで表現されている。Google Scholarの「引用元 ○○」というリンクはWeb of Scienceの「Times Cited」というリンクとほぼ同じものといえる。ただし、Web of Scienceで計算された引用回数とGoogle Scholarで表示された引用回数はまったく同じではない。両者では集計に用いる雑誌が異なるし、雑誌収載にあたって審査をおこない、公開しているWeb of Scienceに対し、Google Scholarの検索対象雑誌は明らかになっていない。しかし、Web of Scienceは契約料がとても高いデータベースで、契約をしていない大学図書館も多い。無料で引用関係が調べられるデータベースは現在のところ、Google Scholarしかなく、その点だけでもGoogle Scholarの存在価値は高いといえる。

 

■Google Scholarは逆引き検索ができる

また、Google Scholarの引用文献へのリンクは、逆引き検索として利用できる。「逆引き検索」とは何か、例を挙げて説明する。2000年にNature誌に掲載された論文Aに興味を持ち、その論文に関連した論文を探したいとする。2000年以前の関連論文は論文Aの最後にある引用文献リストから見つけることができる。しかし、論文Aの研究データが、その後、どのように発展していったのか、2000年以降の関連論文を見つけるのは大変なことである。せいぜいPubMedでキーワードなどを使って再検索するくらいしか方法はない。しかし、Google Scholarの「引用元 ○○」のリンクをクリックすれば、論文Aが発表されたあとに論文Aを引用した論文の一覧を見ることができるので、その後の研究の進展状況、最新の関連論文を見つけることができる。このような逆引き検索は使い始めるととても便利なものである。

 

■裏技その1:Google Scholarを英語論文を書く際のお供に

ここまで話をしたGoogle Scholarの便利な機能はすでにWeb of Scienceに搭載されている機能である。しかもWeb of Scienceの方が正確であり、Web of Scienceを使える環境にいる方には、メリットとはいえない。しかし、Google ScholarがPubMedやWeb of Scienceに対して持っている大きなアドバンテージが一つある。それは、PubMedとWeb of Scienceが主に抄録を対象にして検索をかけているのに対して、Google Scholarは全文を対象にして検索をかけているという点である。そこで、全文検索であるメリットを生かしたGoogle Scholarの裏技を2つ紹介する。

ひとつは、英語論文を書く際の例文辞書として有用ということである。英語論文を書くときには、「本当にこんないいまわしでよいのか」、「前置詞はこれでよいのか」といった不安がつきまとう。そんなとき、Google Scholarが役立つのである。たとえば、「最もヒトの慢性腎炎に近いモデル」という英語のフレーズを作るのに、「a model most resembling human chronic nephritis」という文章を考えたとする。こんな表現でよかったかと心配になったら、"model most resembling"をGoogle Scholarにかけてみる。 このときかならずダブルクォーテーション(")でくくってフレーズ検索にすることがポイントである。Google Scholarでは、ストップワーズ(冠詞や前置詞など頻繁に使われる単語、記号、文字など)を無視するが、”でくくった場合は、ストップワーズは無視されない。また、通常検索では、model、most、resemblingがどこかにでている文章が検索されるが、"でくくれば、まさにその語順のものだけが検索される。実際に"model most resembling"で検索してみると、1件しかヒットしない。間違いではなさそうだが、こなれた表現ではないのかと思い、"model that most resembles"で検索してみたら、今度は27件がマッチした。検索結果画面に表示されるページ数は、検索をかけた表現が、どの程度、一般的に使われているか把握する目安となる。この場合、"model that most resembles"の方が一般的ということがわかる。

適切な前置詞探しは得意中の得意である。この場合、アスターリスク(*)を使う。ダブルクォーテーションマークをつけてフレーズ検索にした場合、アスターリスクは1文字のワイルドカードとして機能する。たとえば、mechanismとapoptosisを結ぶ前置詞はofかforか?こういった場合は、アスターリスクが有効である。
"mechanis * apoptosis"で検索すると、4040件がヒットし、圧倒的にofが多く、一部forなどが見られる。実際にどのくらいの頻度で使われているのかを調べるために、"mechanis of apoptosis"で再検索すると3110件、"mechanis for apoptosis"で再検索すると314件がヒットした。ということで、ofが一般的なようである。また、他にもinvolvingが見つかり、場合によっては、こっちの方がしっくり来る場合もある。

こうした巨大な英語例文集としての使い方は、Googleを使ってもいいのだが、英語論文に使う英語は、英語論文に限って探した方が、ぴったりの表現を探しやすいので、Google Scholarがおすすめである。

 

■裏技その2:Google Scholarは研究にも役立つ

さて、もう一つの裏技が、実験で使う試料の情報を得るための検索エンジンとしての使い方である。「免疫組織化学の抗体をどこから手に入れればよいのか」、「薬剤を投与するのにどのくらいの量を使えばよいのか」、こんな疑問を見事に解消してくれる。たとえば、Covance社が出している抗Cre recombinase抗体が免疫組織に使えるのかどうか調べたいとする。PubMedで「cre antibody covance」を検索しても一つも文献が引っかからないが、Google Scholarでは337件もひっかかる。そのリンクをたどれば、実際にこの抗体が免疫組織化学で使われているという報告があるかすぐにわかる。さらに、その論文には、実験ための条件やプロトコールが書かれているので大変参考になる。

 

■Google Scholarは進化し続ける

と、ここまで、Google Scholarの使い方を紹介してきたが、実はGoogle Scholarは執筆時点で未だベーター版である。Google Scholarがベーター版として最初に公開されたのが、2004年。その後、少しずつ機能が追加され進化し続けている。2006年4月には、「Recent articles」というソートオプションが追加された。それまでGoogle Scholarでの検索結果は、関連度の高い順、つまり、被引用数の高い順に並んでいた。当然のことながら、古い論文ほど被引用回数が多くなるので、検索結果の先頭の方には、古い論文が並ぶことになる。検索結果を新しいものから順番に並べられないことは、Google Scholarの欠点の一つだったわけだが、その欠点が一部解消した。2006年7月には、Google Scholarの日本語版が開始された。これによって、日本語での検索が可能になった。ただし、日本語の論文の電子化およびwebへの掲載が進んでいないこと、PubMedに相当するような日本語の論文検索データベースが存在しないこともあり、使い物になるにはもう少し時間がかかると思われる。2006年8月には、指定した図書館へのリンクが追加された。このように、次々と機能が追加され、使いやすくなっている。

Google Scholarは、それだけですべてまかなえるわけではないが、PubMedや他のデータベースと併用しながら、うまく使っていきたいデータベースである。

 

以上、医学のあゆみ220巻3号掲載「Google Scholarを使い倒す」より許可を得て転載

その他の回は医家向け電脳道具箱の一覧をごらん下さい。

2008.01.19

「電脳道具箱」全10回終了

2007年1月から、週刊医学のあゆみ誌上で、月1回のペースで「電脳道具箱」というタイトルでエッセイを書かせていただきました。本当は、月1回で12回で終了する予定だったのですが、途中、さぼってしまい、最終的に10回ということになりました。私がいうのも何ですが、とてもおもしろい記事になっています。第10回掲載号が1/19より書店に並びますので、是非、ご覧下さい。

出版社の許可を得て、古い物から順番にこのサイトで掲載することを許可いただきましたので、順次掲載していく予定です。

  1. Google Scholarを使い倒す」220巻3号(2007年1月20日発行号)
  2. 医学中央雑誌刊行会訪問記」220巻7号(2007年2月17日発行号)
  3. 医中誌Webの検索達人をめざす」220巻11号(2007年3月17日発行号)
  4. 最新論文を見逃さないための小道具達」221巻3号(2007年4月21日発行号)
  5. ソーシャルブックマークの可能性」221巻7号(2007年5月19日発行号)
  6. インパクトファクターを正しく理解する」221巻10号(2007年6月9日発行号)
  7. インパクトファクターで研究者の業績評価ができるか」222巻3号(2007年7月21日発行号)
  8. 「Keynoteで人とは違ったプレゼンテーションを」222巻11号(2007年9月15日発行号)
  9. 「学会ポスター大判1枚刷りに挑戦」223巻11号(2007年12月15日発行号)
  10. 「これだけは守りたいプレゼンテーション10の原則」224巻3号(2008年1月19日発行号)

2008.01.17

iPod touchに有償で、5つのアプリがインストールされる

Apple Store(Japan) 今回のMac World Expoの中では、控えめな発表でしたが、うれしかったのが、iPod touchへのアプリケーションの追加。

追加されたのはメール、マップ、天気、メモ、株価の5種類。メモ以外のアプリケーションはすべてインターネット経由で利用するアプリケーションです。私は、iPotd touchを無線LAN経由で使うことはほとんどないので、あまりメリットはないかと思いましたが、購入することにしました。5つのアプリの中で、一番興味を引かれたのは、メールソフトで、gmailがそのまま使えるようにます。また、マップも単なるGoogleマップではなく、独自のインターフェースで使いやすくなっています。

残念だったのが、これら5つのソフトウェアのインストールに、2480円必要だということ。もちろん、1月16日以降に販売されたiPod touchははじめからインストールされています。2480円って、正直言って、高いと思います。以前のアップルなら、この程度のアップデートは無料でおこなっていたと思うのですが、この件に関しては、「Life is beautiful: MacWorld Expo: なぜiPod touchのアップグレードのみ有料なのか?」 を読んで合点がいきました。現在、アメリカの会計基準が厳しくなっていて、このようなアップデートを無料でおこなうと、ソフトウェアのメンテナンスに相当する部分の売上げを「不当に前倒しにして計上した」とSECから会計操作と見なされてしまうということらしいです。

iPod touchをWi-Fiでよく使っている人はマストバイでしょうね。ちなみに、私は、このインストールでようやくiPod touchをPDAとして使えるかな、と思っていたのですが。To Doリストがないので、PDAとしては、まだ役不足ですね。でも、iPhoneにもTo Doリストはないので、2月以降にSDKが公開されて、サードパーティが作ってくれるのを待たなければいけませんね。

2008.01.16

MacBook Airはどのような位置づけなのか

Apple Store(Japan) 何が出てもポチッと行くぞ、構えていましたが、だいたい私の予想通りのものが登場しました。MacBook Airはサブノートと言えますが、それは、画面サイズの小さいという意味でのサブノートではなく、メインノートとはなりえないという意味でのサブノートだと言えます。

たとえば、現在、Macを1台も持っていない人が、MacBook Airを買っても、不自由することが多いと思うのです。光学式ドライブを内蔵していない、有線LAN端子をもっていない、Firewire端子を持っていません。これらの解決策は一応用意されていますが、MacBook Air1台しか持っていないとなると、不自由することも多いでしょう。また、HDは80Gしかない(しかも、遅い)し、SDDはさらに容量が少なく、64Gしかありません。私の現在のコンピュータ環境をすべて入れることはできません。

したがって、私が思うに、MacBook Airは、すでにMacを1台持っていて、外に持ち出すサブ機として使うのが、ベストだと思うのです。でも、できれば、Firewire端子は付けて欲しかった。

そのような判断で私は、出張用Bookとして、MacBook Airをポチッとしました。選択は、サブ機で、絶対的なスピードを求めないので、HDの方を選択しました。

2月6日に出荷で、2月13日に配送とのことです。楽しみ。

2008.01.15

Mac World Expo 2008へ準備万端

Mac World Expoはの基調講演は生放送されないのですが、勝手にストリーミングするサイトもいくつかあるみたいです。

ストリーム系はいずれもダメなので、http://www.macrumorslive.com/がおすすめ。

アップルストアは24時間受付。0120-27753-1。何が出てもポチッと行くぞ。

よし、準備OK。

あまりの端子の少なさに、ちょっと迷いましたが、出張用と割り切って、ポチッと行きました。MacBook Air。

2008.01.14

Mac World Expo 2008への期待

今回のMac World Expo(キーノート講演は1月16日日本時間2:00より)は、当日のキーノート講演でしゃべりきれないMac Proのアップグレードが1週間前にフライイングで発表されるなど、かつてないほど盛り上がりを見せています。

注目の最大の理由は、小型(面積が小さいのか、薄型なのか、はたまたハンドヘルド機なのか)のMacBookが出る可能性が高いと噂されているからです。

私の個人的な予想では、New ハンドヘルド機が出る可能性はほとんどなく、サブノートサイズのMacBookとなるよりも、現行のMacBookのサイズのまま、厚さが半分、重量が1キロ前半になるのではないかと思います。この軽量化のために、光学ドライブが外付けになり、内蔵HDDはフラッシュメモリーにおきかえられるでしょう。Steve Jobsがサブノートが嫌いなので、小型化より、薄くすることを選ぶのではないかと予想します。

Expo準備中のMoscone Convention Centerには「There's something in the air」というキャッチコピーが掲載されていて、名前はMacBook Airになるのではないかと言われています。また、タブレット型MacBookになるのではという予想もあるようですが、時期尚早のような気がします。

その他、可能性があるのは、

  • iPhone 3G、日本での発売
  • MacBook Proのマイナーチェンジ
  • Cinema Displayのマイナーチェンジ(カメラ内蔵になる)

あたりでしょうか。でも、私なんかの予想を裏切る、あっと驚く新製品を待っています。

2008.01.13

本の紹介「スティーブ・ジョブズ 偉大なるクリエイティブ・ディレクターの軌跡」

「スティーブ・ジョブズ 偉大なるクリエイティブ・ディレクターの軌跡」

著者:林 信行、出版社:アスキー(2007/12/17)、ASIN:4756150721、価格:¥ 2,625(税込) 【amazon.co.jp】【bk1

Mac関連の有名ライター林信行さんの書かれたSteve Jobs本。テキスト量がそれほど多いわけではないので、この一冊で波瀾万丈のSteve Jobsの軌跡を理解することは出来ないかもしれないが、貴重なSteve Jobsの写真が満載であり、それだけでも、Macファン、Steve Jobsファンは持っていても損はない。


2008.01.10

ライブDVD「KIRINJI PREMIUM LIVE 2007 at 日比谷野外大音楽堂」

「KIRINJI PREMIUM LIVE 2007 at 日比谷野外大音楽堂」

コロムビアミュージックエンタテインメント(2008/01/01)、価格:¥ 3,107(税込)、ASIN:B000XQ9I90 【amazon.co.jp

私も聴きにいったKIRINJI PREMIUM LIVE 2007 at 日比谷野外大音楽堂(私の書いたレポート)がDVDになりました。今回は、新作アルバムがなかったので、比較的、古い楽曲から新しい楽曲までバラエティに富んだセットリストでした。バンドメンバーによるオーディオ・コメンタリーも収録されているようです。

野外には野外の趣があり、DVDでどのように再現されているのか興味があります。私自身は買うかどうか、ちょっと迷っています。


2008.01.07

2008年1月1日からビザ申請費用が値上げ

2008年1月1日より、非移民ビザ申請料金が$100から$131に変更されました。

http://tokyo.usembassy.gov/j/visa/tvisaj-important.htmlより引用します。

2008年1月1日より、非移民ビザ申請料金が$100から$131に変更されます。

この変更により国務省は、非移民ビザ申請手続きのセキュリティやその他保安強化要件に必要な費用を回収することが可能になります。この変更は、機械読取り式台紙に発行される通常の非移民ビザと、一部のメキシコ国籍の方に発行されるBorder Crossing Cardの両方に適用されます。

申請料金$100を2007年12月31日までに支払い、2008年1月31日までに面接を受ける場合、追加料金を支払う必要はありません。旧申請料金$100を支払い2008年2月1日以降に面接を受ける方は、面接当日に、大使館・領事館の会計で、面接を受ける前に$31の追加料金を支払ってください。料金は円またはドルの現金で支払ってください。

国務省は米国の法律に基づき、機械読取り式ビザ(MRV)をプロセスするための費用を非移民ビザ申請料金によって賄う努力をすることが義務付けられています。しかしながら、新たに課された保安要件にかかる費用や、新しい情報技術システム、そして物価高騰などにより、$100の申請料金は、2004年に調査が実施された時点でビザのプロセスに要する実費を既に下回っていました。以来、国務省は超過費用を負担してきましたが、各申請者から10本指の指紋を採集し、それらをFBIで照合してもらうための費用が上がったため、超過分を負担する事が不可能となりました。申請料金は、2001年9月11日以降2回変更されており、今回は2002年以来の変更となります。

2008.01.02

週刊文春「大リーグファン養成コラム」終了

私は、ときどき週刊文春を買います。柳田先生がおっしゃるように、メインの政治・社会記事は、レベルが低いと感じることが多いのですが、エッセイやインタビュー記事を目当てに買っています。その中でも、阿川佐和子さんのインタビュー記事と並んで、お気に入りなのが、李 啓充氏の「大リーグファン養成コラム」。

李 啓充氏は、京都大学医学部卒業し、ハーバード大学に研究留学。そのまま、ハーバード大学の助教授として活躍されていましたが、コラムニストに転身されました。アメリカの医療制度に関する「市場原理が医療を亡ぼす―アメリカの失敗」「アメリカ医療の光と影―医療過誤防止からマネジドケアまで」「市場原理に揺れるアメリカの医療」などの素晴らしい本を書かれています。私の書いた紹介文はこちらにあります。

一方で、6年前より、週刊文春で「大リーグファン養成コラム」を連載されていました。「アメリカの知識人もすなる野球ライティングというふものを、自分もしてみむ」と思い立って始められた本連載は、日本にはない上質の野球コラムでした。やや、というよりかなりレッドソックスに入れ込んだ記事ではありましたが、日本ではあまり知られていないOPSという指標や、メジャーリーガーたちの心温まるエピソード、薬物汚染のことなど、充実したものでありました。

しかし、残念ながら、2007年いっぱいで連載終了ということになってしまいました。「このコラムがなくなって淋しい」と思ってくださる方がいらっしゃるなら、是非、拙著「怪物と赤い靴下」をお読みいただきたい、とのことです。ボストンの方、必読の一冊です。

「怪物と赤い靴下」

著者:李 啓充、出版社:扶桑社(2007/11/15)、ASIN:4594055176、価格:¥ 1,470(税込) 【amazon.co.jp】【bk1

2008.01.01

New Year Resolution

明けましておめでとうございます。

今年のテーマは「集中」。

仕事においてもプライベートにおいても、やらないことをはっきりと決めて、やるべきことに自分のリソースを集中させる。

今年も1年よろしくお願いいたします。

アーカイブ

過去ログ一覧