• ライフサイエンス分野の研究をIT技術で支援します

    2020/2/23にリリースしたcosgene_pack200223.tar.gzに、新しいtrj2pdbが入っています。UAP180119.tar.gzに入っている古いtrj2pdbを使った方が簡単に使えて便利です。以下の説明は、古いtrj2pdbについてのものです。

    myPrestoのトラジェクトリーファイルからPDBファイルを作成する方法について紹介します。myPrestoのトラジェクトリーファイルからPDBファイルを作成するツールはtrj2pdbです。trj2pdbは、UAP180119.tar.gzに含まれています(2020/1/24現在)。

    ここでは、cosgene_packのテスト計算プログラムが出力したトラジェクトリーをPDBファイルに変換してみます。myPresto5のサイトからcosgene_pack200119.tar.gzとUAP180119.tar.gzをダウンロードして、同じディレクトリに置きます。
    まず、cosgene_packを使った作業をします。

    tar xzvf cosgene_pack200119.tar.gz
    cd cosgene_pack200119
    bin/install.sh
    bin/install_cosgene_MPI.sh
    bin/test_MD_4HP0_CAP_cosgene_MPI.sh

    cosgene_pack200119/test_MD_4HP0_CAP_cosgene_MPI_4/の下で、MD計算が実行されます。

    MPIが設定されていない場合の手順は以下のものです。

    tar xzvf cosgene_pack200119.tar.gz
    cd cosgene_pack200119
    bin/install.sh
    bin/test_MD_4HP0_CAP_cosgene.sh

    cosgene_pack200119/test_MD_4HP0_CAP_cosgene/の下で、MD計算が実行されます。

    次にUAPを解凍してインストールします。

    tar xzvf UAP180119.tar.gz
    cd UAP180119
    bin/install.sh

    インストールに成功したら、以下のコマンドでwork/ディレクトリを作成して、その下で準備をします。

    mkdir work
    cp ../cosgene_pack200119/test_MD_4HP0_CAP_cosgene_MPI_4/Pro_3_md_1.pdb work
    cp ../cosgene_pack200119/test_MD_4HP0_CAP_cosgene_MPI_4/traject_1.cor work
    cd work
    sed -e "s/HETATM/ATOM  /g" Pro_3_md_1.pdb > Pro_mod.pdb
    grep ATOM Pro_mod.pdb > Pro_mod2.pdb

    workの下に、cosgene_packで計算したトラジェクトリーと最終構造のPDBファイルをコピーします。
    trj2pdbで使用するPDBファイルは、全ての行がATOMから始まる必要があります。HETATMから始まる行はATOMから始まるように変換し、ATOM行以外を除いておく必要があります。最後の2行のコマンドで作成されるPro_mod2.pdbは、この条件を満たすファイルです。

    work/の下にいる状態で、次のコマンドで、trj2pdbを対話形式で実行します。../bin/は、workからみたtrj2pdbへの相対パスです。

    ../bin/trj2pdb

    表示された項目について、設定したい内容を入力します。

    protein name =

    4HP0を入力(ファイル名のタグなので、任意で構いません。)

    input presto-PDB file =

    Pro_mod2.pdbを入力(PDBファイル名を入力します。)

    input presto-trajectry file =

    traject_1.corを入力(トラジェクトリーファイル名を入力します。)

    structer number =

    100を入力(多めの数を入れると、全てのスナップショットについて出力してくれます。)

    the number of atoms =

    1941を入力(ATOM NOの1番から、この番号までの原子について出力する。1941はタンパク質の最後の原子番号。)
    水とイオンを含む全原子について出力する場合には、19993を入力します。この数(1941、もしくは、19993)は、テキストエディタ等でPDBファイルを開いて調べて置きます。

    Single (s) Double (d) precision =

    sを入力(MD計算の際に設定した精度single/doubleをsもしくはdで指定します。)

    Warnning!! Not 100 files but  10 files were made.

    今回は、実際には10個のスナップショットしかないところに、100を入力したのでこのように表示されます。

    trj2pdbのコマンドが問題なく実行されると、4HP0.1.pdbから4HP0.10.pdbまでの10個のPBファイルが作成されます。
    1個ずつ構造を読み込むのは手間がかかる時があリますので、NMRの構造データのように複数のMODELとして、1つのファイルにしておくと便利です。
    次のコマンドを実行すると、MODEL 1からMODEL 10として、1つのファイルにまとめることができます。

    for i in `seq 10`;do echo "MODEL $i";grep ATOM 4HP0.$i.pdb;done > 4HP0_merge.pdb

    このコマンドは、bash/sh用のコマンドなので、シェルにcsh/tcshを使っている場合には、シェルをbash/shに変更してから使用してください。
    このコマンドは、変数iを1から10に変更して、それぞれのiにおいて、doからdoneの間のコマンドを実行します。
    つまり、MODEL (数字)を表示後に、PDBファイルの中身を表示することを10回繰り返します。その出力を4HP0_merge.pdbに保存しています。

    4HP0_merge.pdbをmyPresto Portalで読み込んだ画面が次の図になります。