先日開催されたAI-SHIPSシンポジウムにてチャットにて質問した内容と追加の質問項目です。 当日は、時間的な制限もあり残念ながら以下の質問に対しての回答は殆どありませんでした。
■全体的かつ一般的な質問
・本PJではAIを標榜していますが、AI技術の適用はどのようにされたのでしょうか?
・機械学習を行ったのでAIであるということが多いのですが、機械学習は本質的にデータサイエンス分野での基本技術であってAIでは本質ではないと考えます。
現在のAIとはネットワーク型で、従って最低でもNNが基本で深層学習が中心と考えます。
機械学習を行えばAIであるならば、現在のMVA(多変量解析)やPR(パターン認識)は総てAIとなりますね。
□インシリコデータからの質問
・弊社もビッグデータをターゲットとするが、本PJでのビッグデータとはどのようなサイズなのでしょうか、参考にさせていただきます?
■化合物の選択関連
研究用データベースの構築においては化合物の選択は極めて重要な問題です。 どのような基準で実施されたのか?具体的に教えてください。
・化合物空間等意識したのでしょうか → データ解析上で重要です
・D体、L体、ラセミ体、メソ体化合物等の立体情報やEやZ等の幾何異性体の扱いはどのように選択、対応したのでしょうか → 生理活性物質を扱う点で重要と考えます。
・有機塩等の化合物は基準なく選択したのでしょうか。 塩の種類等は統一したのでしょうか → 塩の違いによる活性変化等への対応上重要です
・インシリコ予測ではサンプル数とパラメータ数のバランスが大事です。 過剰適合等の問題は考慮されているでしょうか?
・実験項目を細かく、正確にすると相対的にサンプル数も減りますので、インシリコでの毒性予測には不利・不安定となります。 インシリコ予測の特性を考えた対策は取られているでしょうか?
・混合物や不純物はどのように扱ったのか、考えたのか教えてください → 安全性分野での不純物の扱いにはICH M7等定められているが、化合物選択時にこのようなことは考慮されたのでしょうか?
■予測関連に関する質問です
・予測モデルや予測用ツリーはどのような形で、いつ公開されるのでしょうか?
・オートスケーリングはどのようにされていますでしょうか?
・三次元パラメータは使っていますでしょうか?
・予測モデルは更新が必要となりますが、可能であれば更新のスケジュール等を教えていただきたいのですが
■山崎先生への質問です:船津座長より、これは質問でなくコメントであると修正いただきました。
・化合物選択の戦略とアプローチ素晴らしいと感じました。参考にさせていただきます。
・重回帰での予測はrだけで評価するものではないと考えます。 S字曲線(非線形)のグラフでも、線上から外れた化合物群の特徴や別の解析に適用する等臨機応変に対応できます。 これらの展開で新しいことが見えてくるかもしれません。
■システム・データベース関連への質問です。
化合物のコンピュータ上での扱いで極めて大事な「一元一項や一元多項」への対応はどのような手段で対応されているのでしょうか。 具体的に教えてほしいと思います。
・一元一項対応がされなければ、化合物データベースでの扱いはメチャクチャとなります。
・この一元一項対応に対する処置はどのように対処されているでしょうか?
・一元多項対応がされなければ、データ解析はうまくゆかないことは明らかです。
・化合物データベースはいつ公開されるのでしょうか?
化合物データベースが公開されれば、一元一項や一元多項対応がされているかは直ぐにわかりますし、他のプロジェクトでの展開や検証も可能となります。
■AIに関する一般的な質問です
現在のAI技術の展開ではサンプル数が多いことが必要条件となっています。
・安定的なAI実施のために必要なサンプル数はどのくらいと考えるでしょうか。
・サンプル確保のための工夫として何か工夫されましたでしょうか?
・本PJでは毒性に関するAOPの考えや、それへのチャレンジが提唱されています。 AOPに対するAIでの要因解析はどのようにされているのでしょうか?
・AIによる要因解析にはディープテンソルやSHAP Value等複数ありますが実施されたのでしょうか?
・機械学習を適用したからAIであるというのは疑問です。 機械学習は基本的にデータサイエンス分野での基本技術であってAI分野では本質ではありません。
・現在のAIはネットワーク型で、最低でもNNが基本で深層学習が中心と考えています。 もしも機械学習を行えばAIであるとするならば、現在のMVAやPRは総てAIとなりますね。
以上の他にも気になる観点の項目等ありましたが、時間も限られていることもあり総てを尽くすことはできませんでした。
□AIに関する討論の場です。化学AIを学ぶ上での参考にしてください。
Drug Design and Toxicity Prediction by AI:人工知能による創薬、毒性評価