home
MENUPREVNEXT

MacOSXでBioinfomatics入門その5

Bioperlを使う

 

■Bioperlとは

 

 

 

■Bioperlを使った例

perlは

 

 

シークエンスというのは所詮テキスト情報ですから、シークエンスの解析にはperlが非常に強い力を発揮します。

batchBLAST.tcsh

#!/bin/tcsh
set seqdir=$1
cd $seqdir
foreach file (*.Seq)
blastall -p blastn -d /bio/blast/db/nt -i $file > ${file:r}.bls
end

ちなみに、このスクリプトでは、結果をresult.outという形で一つのファイルにまとめるのでなく、test???.txtの結果はtest???.blsという形で個別のファイルになっています。batchBLAST.tcshの実行は、以下のようなコマンドをたたきます。

% tcsh /bio/scripts/batchBLAST.tcsh /bio/test

これで、理論上は何個のシークエンスでも上記のコマンドを1行書くだけでBLAST解析ができるようになりました。

 

■perlを使う。

perl -pe 's/¥r/¥n/g' (変換するファイル名)> (変換後のファイル名)

 

シークエンスファイルから任意の部分の配列だけ取り出すスクリプト

4日目

■Bioperlを使う。

一定のスコア以上の配列を取り出す。

5日目

■仕上げ

解析した結果を一つのテキストファイルにまとめ上げる。

ボタン一つで、これまでの内容を自動化する。

 

Optional

ファイルメーカーに自動的に取り込む。

ClustalWのインストール

 

 
 
 
     
 
 

 

 
 
 
     
 

 

 
 
 
     
 

 

 
 
 
     
 

LINUXの場合の設定手順

/usr/local/genome/blast/ など BLAST をセットアップしたいディレクトリで, $ zcat blast.linux.tar.Z | tar xvf -
$ zcat ecoli.aa.Z | tar xvf -
$ zcat ecoli.nt.Z | tar xvf -上のステップでできた data ディレクトリのパスを設定する。.ncbirc ファイルを作り, $ mule .ncbirc
Data=/usr/local/genome/blast/dataと入力。
.ncbirc を $HOME にコピーするか,シンボリックリンクを作る。(例えば,ユーザーが yui の場合) $ cd /home/yui
$ cp /usr/local/genome/blast/.ncbirc  ̄/. (コピーの場合)
$ ln -s /usr/local/genome/blast/.ncbirc  ̄/. (リンクの場合)データベースファイルを作る。multi fasta 形式のテキストファイルを BLAST 用のデータベールファイルにする。 $ formatdb -i ecoli.nt -p F -o T7つのファイルができる。
データベースファイルは分かりやすいように専用のディレクトリをつくる。必須ではない。 $ mkdir /usr/local/genome/blast/db
$ mv ecoli.* ./db/環境変数を設定する。BLAST を実行するユーザーの $HOME にある,.bashrc (Linux なら普通 bash でしょう)にデータベースファイルと .ncbirc の位置を設定する(例えば,ユーザーが yui の場合)。 $ mule  ̄/.bashrc
export NCBI=/home/yui
export BLASTDB=/usr/local/genome/db #(データベースファイルの置き場所)
export BLASTMAT=/usr/local/genome/data #(マトリックスファイルの置き場所).bashrc に設定した内容を現在の設定に読みこむ $ source  ̄/.bashrc以上.


 
     
 

■参考になるサイト

Installation (http://www.ncbi.nlm.nih.gov/Kuehl/prefinished/installation.html)

g

AppleのAG BLASTのページ(http://developer.apple.com/hardware/ve/acgresearch.html)

 

Installing NCBI's BLAST2.x Executables (http://genome.nhgri.nih.gov/blastall/blast_install/)

UNIX用に簡単に手順が書いてある。

NCBI BLASTのセットアップ手順(http://itoshi.tv/bioinformatics/blast2.html

Linux用のものだがほぼ流用できる。

 

Installing BioPerl on OS X (http://www.tc.umn.edu/ ̄cann0010/Bioperl_OSX_install.html)

 

linux for molbio(http://www.geocities.co.jp/Technopolis/7075/

linuxで各種分子生物学的ソフトウェアを動かすためのサイト

 

 

 

fink http://fink.sourceforge.net/

Mac OS Xにおいては大くのUnix Softwareが動作しますが、一部は変更が必要になる場合もあります。また動作するとしてもだれも試験していない場合もあります。
また./configureでインストールした場合uninstallがむずかしいsoftwareもあります。
FinkはUnixのOpen Source softwareをMac OS Xにパッケージとして移植するプロジェクト、および、移植したsoftwareを扱うためのソフトの名称です。
プロジェクトのWEBサイトはhttp://fink.sourceforge.net/です。

まず、finkをダウンロードしてインストール

echo "source /sw/bin/init.csh" >> .cshrc

 

nkf


 
     
更新記録

●2004年4月1日:新規掲載

home
MENUPREVNEXT