インシリコデータ株式会社関連ブログ;Blog of the In Silico Data Ltd..

 ようこそ(株)インシリコデータブログへ。このブログでは、主としてインシリコデータのホームページでは直接編集できない細かな内容をフォローいたします。本ブログ内容等に関する質問/要望/意見等はこちらのブログか、インシリコデータのコンタクトアドレス(insilicodata.contact@gmail.com)にメールをいただければ幸いです。
 なお、一部で著者の私的な情報に関する掲示板としても本ブログを利用いたしますが、この点お許しください。
 In this blog, I discuss and write various themes which I cannot edit on the
homepage of the In Silico Data. This blog also partly include a little personal themes.

2012/09/13

EuroQSAR2012参加報告(1):Report of the poster presentation on the EuroQSAR2012

◆ 第19回EuroQSAR2012参加報告:


  8月26日から30日にかけてオーストリアのビエナ(ウイーン)で開催されたEuroQSAR2012に参加およびポスター発表を行いましたので報告いたします。
     EuroQSARは二年ごとに開催される欧州を中心とした構造-活性相関(QSAR)および創薬に関する国際学会です。 現在、QSARに関する大きな国際学会は他に存在しないので、本シンポジウムは事実上世界最大の構造-活性相関関連国際学会となります。
     前回の第18回EuroQSAR2010は2010年にギリシャのロードス島で開催されました。今回は第19回目となりオーストリアのビエナ(ウイーン)のウイーン大学で開催されました。ちなみに次回の第20回EuroQSAR2014はロシアのサンクスペテルブルクにて開催予定です。


     以下では、今回のEuroQSAR2012で私が感じた内容につきまして簡単にまとめます。

◇EuroQSARでの主たる討論議題とその傾向: 
     QSAR、 ドッキング、 インシリコスクリーニング

     現在のEuroQSARでの主たる討論議題はドッキング手法による薬理活性向上を目指した創薬研究となります。 今回のEuroQSAR2012では、QSARの創始者であるHansch先生が昨年の5月に逝去されましたので、Hanschメモリアルが特別セッションとして設けられ、QSARに関する様々な講演がありました。 残念ですが、QSARのルーツであるHansch-Fujita法に関する研究発表は年々少なくなり、これに代わりドッキングによるアプローチの議論が増えました。 ドッキング自体も、当初は手法的な議論が主体でしたが、手法的な技術が完成に近付くにつれ、ドッキングの主たるテーマは高速バーチャルスクリーニングに重点が変わってゆきました。 現在のドッキングにおける主たるテーマは、ADMEへの適用拡大等の研究となっています。
  最近の顕著な傾向として年々増えている発表が、インシリコスクリーニングに関するテーマです。 これも当初は、ドッキングによる薬理活性主体の高速スクリーニングに関する発表が中心でした。 しかし、創薬の関心が薬理活性のみならずADME/T/Pにもシフトしてくるのに従って、徐々にドッキング以外の技術によるアプローチ、特に化学多変量解析/パターン認識によるケモメトリックス主体のアプローチが増えてきました。

*薬理活性スクリーニングから、ADME/T(毒性)/P(物性)スクリーニングへ
     化学多変量解析/パターン認識手法によるインシリコスクリーニングが増えてきた大きな原因は、スクリーニング対象が薬理活性から、ADME、毒性(安全性)そして物性等にも広がってきたことが大きな原因です。 ドッキング手法は基本原理から薬理活性のみを対象としたアプローチであり、薬理活性以外のADME、毒性(安全性)、物性等を対象としたインシリコスクリーニングへの適用は困難であり、特に毒性や物性への適用は基本原理より実施出来ません。 このために、薬理活性はもちろんのこと、薬理活性以外の諸特性にも適用可能な手法としての化学多変量解析/パターン認識手法によるインシリコスクリーニングが注目を浴びています。

◇インシリコスクリーニングでの展開

     EuroQSAR2012でも、薬理活性のみならずADME/T/Pを含めたインシリコスクリーニングへの研究テーマが急速に増えており、発表の数のみならず、研究の幅そのものの広がりを強く感じるようになりました。

1.サンプル関連の拡充と広がり

     今回の発表で感じたのは、インシリコスクリーニング実施上での環境整備への広がりで、基本となるサンプルデータ関連の環境がWEB上でのデータベース構築や一般公開というように、より大きな広がりを持つようになってきたことです。 創薬分野でもサンプル群の扱いや収集等が大きな問題となり、多数で高品質、かつ多様性のあるデータソースが求められるようになっています。 サンプル群の収集という観点ではインターネットを介したWEB上での展開が最も効率的で、広がりを持つという点で現在の技術としては最も効率的であり、これらを目指した発表が見られました。
     但し、私の毒性インシリコスクリーニングの経験から述べると、サンプルの集積も大事であるが、サンプルデータの質がもっと重要であり、この点での考察、例えば実験プロトコルの統一や充実、サンプルデータの評価基準や手順等の拡充が重要と考えます。
     HTSやコンビナトリアルケミストリーが広く普及した現在、創薬研究分野も多数のサンプル群を扱うビッグデータ時代に突入するのも時間の問題と考えられます。 今後は、単なるデータ集積から、集積データの品質が問われ、その後はビッグデータを活用するデータ解析技術の展開が大きなテーマとなるでしょう。今後のこの分野での展開が楽しみです。

2.インシリコスクリーニングに関する技術関連の展開

     ここではドッキングによる薬理活性インシリコスクリーニングに関する話はしません。 薬理活性も含めたADME、毒性および物性に関するスクリーニングを行う化学多変量解析/パターン認識(ケモメトリックス)によるインシリコスクリーニングに関する発表について感想を書きます。

  その前に、化学多変量解析/パターン認識(ケモメトリックス)によるインシリコスクリーニングという言葉や研究にあまり親しみのない方のために、簡単にその歴史をまとめます。
  なお、ケモメトリックスは分野を超えた総合的な研究分野(化学、コンピュータ、データ解析、適用専門分野、等々)となります。 このため、ケモメトリックスを構成する基本技術は様々な分野に及び、その適用分野も様々な研究分野に及びます。 日本で、このような多種多様な研究分野を総合的にまとめて教育を受ける場やチャンスは殆ど無いと思います。 これらの技術的な詳細は、インシリコデータのホームページに、ケースバイケースで記述しておりますので、ご参照ください。

*化学多変量解析/パターン認識(ケモメトリックス)によるインシリコスクリーニングとは?
  多変量解析/パターン認識によるインシリコスクリーニングの基本技術はケモメトリックスと呼ばれるもので、歴史的には古くから実施されてきました。 化学分野に多変量解析/パターン認識の技術を本格的に導入した最初の研究は機器分析の分野で実施され、Isenhour,Jurs及びKowalskiの三人により展開されました。
  その後Jursは構造-活性相関分野での展開を行い、Kowalskiは機器分析分野での展開を中心に研究活動しました。 ケモメトリックス(日本語での正式な訳語は「化学計量学」と呼ばれています)という言葉はKowalskiとスエーデンのUmea大学のWold(SIMCA法を開発し、その後PLS法を開発)により定義され、一つの新しい研究分野となりました。
  一方、Jursは化学多変量解析/パターン認識による構造-活性相関の展開を行ない、毒性研究を中心に展開しました。 しかし、毒性分野でのインシリコ(コンピュータ)需要は当時の状況では大きくなく、その後は構造-活性/毒性相関研究と物性や機器分析分野での研究と半々程度の割合で研究を継続しました。
  しかし、この間の研究で創薬関連分野での多くの特徴や特性を経験し、これらの諸問題を解決するための基礎技術の多くを開発しました。 例えば、機器スペクトルデータと異なり構造-活性/毒性相関分野ではサンプル数が極端に少ないこと。 あるいは化合物情報を細かに取り出すためのパラメータの開発。また、パラメータ数が大きくなるので過剰適合や偶然相関を防ぐための強力な特徴抽出手法の開発等々です。 通常の多変量解析/パターン認識研究分野では、これらの事象は殆ど発生する事がないので、対応する必要がありません。この結果、これらの問題に対する対応策はあまり情報が無く、まともに討論、開発されていないのが現状です。 これらの、化学、創薬、毒性研究塔を行なう上で解決しなければならない様々な問題に関する解決技術がJursにより精力的に展開されました。 
  Jurs研究室で開発されたこれらの基礎技術を取り入れたコンピュータシステムとして、ADAPTAutomated Data Analysis by Pattern recognition Techniques)が開発されました。 このシステムは、当時の技術の最先端を行くもので、ディスプレイ上で化合物構造式を直接扱う事が出来、かつ対話的に化学データ解析研究を行う世界初の化学多変量解析/パターン認識による構造-活性相関支援システムとなりました。
  私はJurs教授の下に留学し、リサーチアソシエートとして二年間働き、このADAPTの部分開発を担当しつつ、ADAPTを用いた発癌性予測に関する研究を行ないました。 当時、日本では殆ど自由に使う事が出来ないミニコンを用いて、毎日最新のデータ解析を行えることが本当にうれしく、充実した日々を送ることが出来ました。 帰国の時にはJurs教授より自分の研究に使って良いということで、ADAPTのソースコードを日本に持ち帰ることが出来ました。 その後、大学から富士通に移り、Jurs教授の許可を得て富士通の汎用コンピュータ上にADAPTを移植しました。 この時はミニコン上のプログラムを汎用機上で稼働させるという事で、多くの富士通の方々の技術的な支援を受けて移植を完了させることができました。

*化学多変量解析/パターン認識は、その基本原理から薬理活性やADME/T(毒性)/P(物性)等の全ての項目をターゲットとしたインシリコスクリーニングへの適用が可能
  現在、この化学多変量解析/パターン認識(ケモメトリックス)によるインシリコスクリーニングが注目を浴びつつあります。  これは、現在大きな問題となりつつあるADME、毒性および物性の分類、予測、評価を行う事が出来るためです。




  化学多変量解析/パターン認識でも当然ですが薬理活性を扱う事は可能です。  しかし、研究を開始するのに様々な基礎知識と技術が必要であり、また多くの創薬研究者にとり多変量解析/パターン認識はあまり親しみの無い学問です。 このために、化学多変量解析/パターン認識(ケモメトリックス)による創薬研究アプローチは敬遠されてきました。 結果として、昔はHansch-Fujita法、その後はドッキング等、創薬研究者が比較的取り組みやすく、かつ理解しやすい手法が薬理活性研究の主体となってきました。 
  しかし、時代が大きく変化し、創薬研究、特にスクリーニング対象項目が薬理活性のみならず、ADMEや毒性(T)そして物性(P)等に変化する事で、これらのインシリコスクリーニング研究分野での化学多変量解析/パターン認識(ケモメトリックス)の適用が必要となりました。

*EuroQSAR2012での化学多変量解析/パターン認識によるインシリコスクリーニング関連発表


  化学多変量解析/パターン認識によるインシリコスクリーニングを実施するためには、その基礎技術は多岐の分野に及ぶことを意識する事が必要です。 これはケモメトリックスという研究分野が多くの基礎技術から形成されるためです。
  化学多変量解析/パターン認識によるインシリコスクリーニングを実施する上で必要となる技術や知識は大きく3種類存在します。 この他にも、化学とコンピュータを結び付けるコンピュータケミストリーの技術も重要になりますが、デフォルトの事項として省きます。
  1.化合物を数値データ(パラメータ)に変換する技術
  2.多変量解析/パターン認識に関する技術
  3.ターゲットとなる薬理活性/ADME/毒性/物性に関する知識
  EuroQSAR2012での発表は3を除いた、上記の1および2に関する発表が中心となります。 それぞれの研究分野で発表がありましたが、技術的にブレークスルーと思われるアプローチは残念ですがあまり見られませんでした。 化学多変量解析/パターン認識の手法的には従来からのデータ解析手法が用いられていました。 もちろん、ADMEや毒性スクリーニングでの予測精度向上のためにコンセンサス手法を取る等の工夫はされていましたが、特に大きな精度向上につながった例は報告されていませんでした。
  私の経験では、特に毒性分野での分類および予測は、

  (1)対象サンプルの構造変化性が極めて高いこと、
  (2)扱うサンプル数が多くなること、
  (3)高い分類/予測率の達成が求められる

 という以上の三つの関門を突破する事が必要です。 私の従来からの経験では、これら三つの問題を従来から展開されている多変量解析/パターン認識手法をそのまま適用すること、さらにはどんなに工夫して優れたパラメータ等を開発しても、良好な結果を得ることは殆ど出来ないと感じています。 そのために、これらの毒性分野特有の諸問題を解決する全く新しいデータ解析手法としてKYK-step Yard sampling)法を独自に開発しました。


3.ポスター発表に関しての感想

     今回私は「NEW APPROACH FOR QSAR AND QSTR TREND ANALYSIS ON LARGE SAMPLE DATA SET BY THE KY-METHODS」のタイトルで発表してきました。
  発表の趣旨ですが、私が開発したKY法は極めて多数のサンプル群の完全(100%)分類を実現するのみならず、QSAR的な、より精密な議論が可能になるという報告です。 このような精密な議論が可能となるのは、KY法の実施過程で対象サンプル群がきれいにポジおよびネガサンプル群にクラスター化され、かつ階層的に分類されるためです。従来手法によるデータ解析では、特に多数のサンプル群を扱う場合は一回のデータ解析で全てのサンプル群を対象として解析するために、完全分類実現には程遠く、サンプル数が多いために情報の整理が出来ないため、QSARレベルでの厳密な要因解析を行う事は殆ど不可能です。
  私のポスターでは前回のEuroQSAR2010での発表時と異なり、明らかに多くの研究者の方が聴きに来られました。 前回のKY法のデビューとなる発表では、完全(100%)分類実現という話を聞いても半信半疑という感じだったのですが、今回の発表では真剣に討論していただけたし、討論内容もより具体的なものへと明らかに変化していました。 その代表的な変化が、実際にシステムを用いて試してみたいという研究者が現れたことです。 また、私は覚えていなかったのですが、フランスの先生には「あの二本の判別関数を用いて分類する手法を開発した人ですね」と、声をかけてくれていただきました。 KY法の特殊なアプローチは記憶に強く残るようです。このように、今回のEuroQSAR2012では、KY法が徐々に認知度を増している様子を実感しました。















  

  次は、会場となったウイーン大学やウイーンの様子等について報告いたします。


文責:株式会社 インシリコデータ 湯田 浩太郎



0 件のコメント:

コメントを投稿