◇多変量解析/パターン認識における、「最少サンプル数」に関する特許が日本で承認されました
本特許は、サンプル数が少ない条件下に行われる多変量解析/パターン認識によるデータ解析の解析信頼性を保つための手法に関する特許です。
一般的に多変量解析/パターン認識を用いてデータ解析を行う場合、利用可能なサンプル数が少なくなってくると「チャンスコリレーション(偶然相関)」や「オーバーフィッティング(過剰適合)」等の問題等が顕著となり、データ解析そのものの信頼性が急激に低下してきます。 本特許はこのように、サンプル数が少ない時のデータ解析を安全に実施出来るようにするための操作技術に関する特許であり、この意味では基本特許となります。
サンプルデータを集めることが極めて困難な研究分野の場合、多変量解析/パターン認識によるデータ解析を行うには多くの場合困難が付きまといます。 本特許は、サンプル数が少ない場合であっても安心してデータ解析を実施する技術に関するものです。
サンプルの総数が大きい場合であっても、例えば「KY法」を実施すると、ステップ(個々の繰り返し操作)数が大きくなり、最後のステップ近くになるとサンプル数が急激に減少し、解析に利用できるサンプル数が少なくなります。 この点で「KY法」を実施する場合、最終ステップに近づいてくるとデータ解析そのものの信頼性が落ちてくることになります。 このために「KY法」実施において、最後の方のステップではこのような問題を避けるべく最新の注意を払ってデータ解析を行う事が必要となります。 本特許はこのような場合にも適用可能であり、「KY法」の実施をより安全かつ容易にする特許となります。
◇ より具体的にはどのような特許ですか?
サンプルの絶対数が小さい時、データ解析実施上での禁じ手である「チャンスコレレーション」や「過剰適合」が発生しやすくなり、信頼性の高いデータ解析を実施することが困難となります。 本特許は、このようにサンプル数が小さい時でも安心してデータ解析を行えるように環境を整える手法に関する特許です。
サンプル数が少ないという事は、多変量解析/パターン認識を行う場合には様々な観点からデータ解析の信頼性に関する問題が出てきます。 この結果、データ解析自体が出来なくなる、たとえデータ解析が出来たとしてもその解析結果の信頼性が低くなる、等々の問題が発生し、先に説明しました「チャンスコリレーション」や「過剰適合」自体の問題も顕著化してきます。
本特許は、サンプル数の絶対数が小さい時に行う多変量解析/パターン認識によるデータ解析のデータ解析信頼性を高度に保つようにすることに関する特許です。
これらの問題に対して、仮想サンプルの創出という手法でサンプル数の問題を解決します。 つまり、サンプル数が少ないのであるから、サンプル数を追加してデータ解析を行うというものです。 この場合のサンプル追加に関する様々なテクニックをまとめて特許としたものです。
内容に関しましては、今後時間がある時にまとめて本ブログにアップします。
文責:株式会社 インシリコデータ 湯田 浩太郎
0 件のコメント:
コメントを投稿