量子化学計算と機械学習に基づいて、肉眼で検出可能な蛍光分子をゼロから作成する

量子化学計算と機械学習に基づいて、肉眼で検出可能な蛍光分子をゼロから作成する

蛍光分子を設計するには、分子の光吸収など、分子構造に直接関連するものだけでなく、相互に関連する複数の分子特性を考慮する必要があります。

本研究では、理化学研究所革新知能統合研究センターや東京大学などの研究者が協力し、量子化学計算(QC)と組み合わせたデノボ分子ジェネレータ(DNMG)を使用して、さまざまな分野で注目を集めている蛍光分子を開発しました。 DNMG は、超並列コンピューティング (1024 コア、5 日間) を使用して、3643 個の候補分子を生成しました。

研究者らは、報告されていない分子1つと報告されている分子7つを選択し、それらを合成した。フォトルミネッセンス分光測定により、DNMG は 75% の精度 (n = 6/8) で蛍光分子を設計でき、肉眼で検出可能な蛍光を発する未報告の分子を生成できることが示されました。

「量子化学計算と機械学習に基づく肉眼で検出可能な蛍光分子の新規作成」と題されたこの研究は、2022年3月9日に『サイエンス・アドバンス』誌に掲載された。

導入

蛍光化合物は、有機発光ダイオード、センサー、バイオイメージングなど、さまざまな分野のアプリケーションにおいて可視光エミッターとして重要です。これらの用途やその他の用途向けに多くの蛍光分子が開発されていますが、機能性、持続可能性、低コストの面で現在の材料の欠点を解決するために、新しい分子が継続的に必要とされています。化学構造のわずかな変化でも大きな改善につながる可能性があります。

蛍光は量子力学によって支配される光化学的性質です。しかし、蛍光研究の長い歴史にもかかわらず、光吸収分子を作成する場合と同様に、蛍光分子を作成するための明確なガイドラインは存在しません。

分子蛍光発光の簡略化された物理化学的メカニズムを下図に示します。当初、研究者らは分子が一重項 (S0) 状態にあると考えていました。S0 の最小値では、分子は光を吸収し、一重項の最初の励起状態 (S1) に遷移します。 S1 励起分子は S1 状態で最小値まで緩和し、S0 状態に戻り、S1 状態と S0 状態間のエネルギー差を光 (蛍光) として放出します。励起された分子は、失活することなく光を放射するためには、S1 状態の最小値まで移動する必要があります。

酸素分子との反応、分子衝突、分子内/分子間の電子移動、凝集などのいくつかの要因により、励起状態で運動中の分子が不活性化される可能性があり、これにより蛍光と分子構造を相関させることが困難になります。したがって、自動化された蛍光分子設計が役立つでしょう。

図: 蛍光分子の一重項基底状態 (S0) と第一励起状態 (S1) の PES の模式図。 (出典:論文)

最近、分子の成分から推定できる分配係数の対数 (logP) などの単純で予測可能な値を持つ分子を設計するために、機械学習 (ML) ベースの de novo 分子ジェネレーター (DNMG) が開発されました。

DNMG と古典的なシミュレーションを組み合わせることで、汎用性と実用性が向上した分子を生成することに成功しました。たとえば、DNMG とドッキング シミュレーションの組み合わせを使用して生物活性分子を設計することができ、これは有機合成を通じて研究されています。分子動力学や予測モデルと組み合わせることで、DNMG は機能性ポリマーの合成を導くこともできます。

これまでの研究では、研究者らは量子化学計算 (QC) と DNMG を組み合わせた ChemTS という手法を採用しており、これにより (原理的には) 量子力学 (QM) 特性を特徴とする機能性分子の新規設計が可能となっている。そのため、QC と組み合わせた ChemTS を適用して、目的の波長の光を吸収できる分子を設計しました。設計および生成された 86 個の分子のうち、トレーニング データセットに含まれていなかった 6 個の既知の分子が、紫外可視 (UV-vis) 吸収測定用に選択されました。結果はジェネレータの目標波長と一致しています。

さらに、DNMG では、従来のハイスループット QM や ML モデルを使用したスクリーニングと比較して、データセット内での検索領域が制限されないため、新しい分子を発見する可能性が高まります。研究者らはまた、電子利得エネルギーを最大化するために QC を使用して ChemTS によって生成された分子の官能基濃縮分析を実行し、エレクトレットの文献には含まれていなかった重要な官能基を発見しました。

図: B3LYP/3-21G* レベルで生成された分子の S1 状態吸収と蛍光の OS 分布曲線。 (出典:論文)

光吸収や電子利得エネルギーなどの比較的単純な特性は分子構造に直接関連付けることができますが、特定の分子によってのみ示される蛍光などの複雑な現象ははるかに困難です。

蛍光の場合、複雑に絡み合った複数の特性を考慮する必要があります。このため、分子構造の設計に関する直感的なガイドラインを確立することが困難になります。実用的な化合物を設計するには、対象分子の特性を制御する複雑なメカニズムを DNMG 用に適切にデジタル化する必要があります。さらに、化学空間の探索におけるメカニズムの複雑さが増すにつれて、計算コストが増加することを考慮する必要があります。

図: ChemTS を使用して設計された未報告の蛍光分子。 (出典:論文)

この研究では、研究チームはChemTSの大規模並列化バージョンを使用して蛍光分子を設計しました。このパッケージは、QC を使用して蛍光メカニズムの最小要件をデジタル化します。分子や材料の品質管理には、電子構造理論に基づいた使いやすいソフトウェア パッケージが数多く利用可能です。

信頼性と計算コストのバランスをとるために、研究者らは密度汎関数理論(DFT)(29)を使用してポテンシャルエネルギー面(PES)を評価した。化学空間を広範囲に探索する際の計算コストに対処するため、ChemTS は仮想損失に基づく概念を使用して大規模に並列化され、1024 個のコアを使用して 3643 個の分子が生成されました。

検証のために、彼らは報告されていない化合物といくつかの報告されている化合物を合成しました。報告されていない化合物 1 つを含む 6 つの化合物が予想どおりに蛍光を発しました。市販の試薬をカップリングさせることで、共通のフラグメント(クマリン、ピリジン、ピラゾロピリミジン)で構成されていたものの、予想外の特性を持つ未報告の分子を合成することができました。これは、超並列 DNMG が分子設計におけるパラダイムシフトを引き起こす可能性があることを示唆しています。

図: PC の光誘起プロセス。 (出典:論文)

話し合う

QC は数十年にわたって化学および材料科学において重要な役割を果たしてきました。この期間中、コンピュータ支援分子設計は医薬品の発見に使用されてきました。しかし、QC では実験結果の分析と推論のみに重点が置かれており、さまざまな現象の予測や材料の設計といった創造的な作業はほとんど考慮されていません。

化学および材料科学における ML アルゴリズムの最近の応用は、コンピューター支援化学および材料科学における前向きな転換点を表しています。有機エレクトロニクスに役立つ分子を自動的に設計するには、量子力学を無視できないため、QC と DNMG を組み合わせることが重要です。ただし、QC ベースの DNMG を実際に導入する前に、その価値を実証する必要があります。

この研究では、研究者らは DNMG を使用して、現時点では容易に予測できない特性、つまり蛍光を持つ分子を作成しました。彼らは、本質的に量子力学的なアプローチである DFT を使用して蛍光化合物を設計しました。分子は量子力学の法則に支配されていることはよく知られていますが、量子力学のみを使用してゼロから新しい分子を作成することは困難です。蛍光分子は、PES が単純であるにもかかわらず、その多様性により蛍光と分子構造を相関させることが困難であり、第一原理から設計することが困難です。

図:PC の光化学的性質。 (出典:論文)

しかし、ジェネレーターはこの多様性に対処し、蛍光分子をゼロから設計することに成功しました。 QC に基づく大規模な ab initio 計算には、大規模な並列計算 (1024 コア、5 日間) が必要でしたが、それでもジェネレーターは 3643 個の候補分子を生成することに成功しました。ジェネレーターは、専門家と同様の方法で分子の共役長を制御し、長波長の光を吸収する分子を作成しますが、分子の蛍光波長/強度と芳香族環の共役長/数の間に明確な相関関係を見つけることはできません。これは、蛍光分子を新規に設計することの難しさを示しています。

研究者らは、合成可能性と可視​​蛍光基準に基づいて、検証のために 7 つの既知の化合物と、さらなる研究のための 1 つの候補化合物を選択しました。実験検証の結果、DNMG は蛍光化合物の 75% (8 種類中 6 種類) を正常に設計できたことが示されました。 PC の蛍光(肉眼で見える)は、DNMG の革新的な可能性を示しています。

PC を設計する際、ジェネレーターはクマリンにピラゾロピリミジンという未知の基を導入しました。この結合により、高い立体反発が生じましたが、それでも OS は増加しました。

平均的な化学者にとって、断片間の立体反発を増大させることによって蛍光とその強度を高める方法を見つけることは難しいでしょう。これは、ジェネレータが専門知識や直感を超えたツールであることを示しています。 DNMG は分子設計におけるパラダイムシフトを引き起こす可能性があります。

本研究で合成した分子の蛍光は肉眼で検出できる程度ですが、原子の種類の制限を取り除き、設計時間を延長することで、より興味深い分子が生成されるでしょう。

さらに、分子の光誘起ダイナミクスを考慮することで、より優れた分子設計が可能になります。 QCをさらに発展させることで、より複雑な機能性分子を設計できるようになります。

したがって、超並列計算を備えたジェネレーターにより、多様で興味深い機能を備えた複雑な分子の作成が可能になり、非常に複雑な合成経路につながる可能性があり、逆合成経路を計画するための最近開発された ML ベースの方法の要件が増加することになります。

オープンソースアドレス:

https://github.com/tsudalab/GaussianRunPack

https://github.com/tsudalab/FL_ChemTS

<<:  テスラがFSDベータ版のメジャーアップデートをリリース、完全自動運転に近づく

>>:  iCubヒューマノイドロボットは目を動かしたり、話したり、人を抱きしめたりすることができ、今回は遠隔操作も可能だ

ブログ    
ブログ    

推薦する

AIは敵ではなく友達でしょうか?自殺防止技術が25人の命を救うことに成功

世界保健機関によれば、毎年80万人が自殺で亡くなっている。 この数字は年々高いままですが、人工知能と...

ロボット工学、自動化、AIでイノベーションを加速

デジタル変革の結果、テクノロジーは長年にわたってどのように変化してきましたか?アクセンチュアが第 2...

TensorRT はどのようにしてより高速なアーキテクチャを実現するのでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

次世代の顔認識技術とは何でしょうか?ここを見て

アクセス制御業界における顔認識の需要の高まりに応えて、このコンセプトをより高い技術レベルで拡張する新...

最近、ソラは子供たちの間でパニックを引き起こしています!

昨晩、娘がぼんやりしてリビングルームに立っていたので、私は彼女に尋ねました。「何をしているの?」彼女...

ブロックチェーンは人工知能をどのように変えるのでしょうか?

人工知能とブロックチェーンは、現在人気が高まっている2つの人気産業です。 2つの技術は異なり、商業的...

BiLSTMとCRFアルゴリズムを徹底的に理解する

CRF は、品詞タグ付け、単語分割、固有表現認識などのタスクに使用できる、一般的に使用されるシーケン...

...

...

PromptAppGPT メジャーアップデート! AIアシスタントの開発と運用のハードルはゼロ:AutoGPTはわずか数十行のコードで実装可能

最近、初めて自社開発した完全にオープンソースの自然言語ローコード GPT アプリケーション迅速開発フ...

AI研究所が超大規模知能モデル「Wudao 1.0」をリリース

3月20日、北京人工知能研究院は超大規模知能モデル「五道1.0」を発表した。 「五道1.0」は中国初...

機械学習を実装するには?

機械学習の実装は、AI を活用した製品やサービスの成功にとって重要なステップです。 MLOps が企...

...

人工知能業界における「人材獲得競争」をどう打破するか?

人材不足により人工知能業界全体の給与水準が上昇しており、有名企業の多くが「年俸13倍」「年俸15倍」...