彼の人工知能ツールは生きた細胞の内部を覗くことができる

彼の人工知能ツールは生きた細胞の内部を覗くことができる

[[272732]]

▲ 図:アレン細胞科学研究所のコンピュータービジョン研究者、グレッグ・ジョンソン氏は、ディープラーニングニューラルネットワークがラベルのない顕微鏡写真から細胞構造の詳細を抽出し、それに基づいて複雑な細胞モデルを作成できることを実証しました。 (チョナ・カシンガー/写真提供)

まず最初に、高校の生物学の教科書で誰もが学ぶ細胞に関する知識は基本的に間違っていることを明確にしておきます。典型的な体細胞、例えば筋肉、神経、さらには皮膚などの人間の組織に分化できる多能性幹細胞などは、単純な半透明の球体ではありません。その内部構造は、ゼラチンの中に浮かぶパイナップルの角切りのように、簡単に識別できる静的な構造ではありません。対照的に、生きた細胞は、小さなサンドイッチに詰められた半分溶けたジェリービーンズのようなもので、その内部構造は絶えず変化しており、その構成はコンピューターチップよりもはるかに正確で複雑です。

つまり、21 世紀になっても、細胞の内部がどのような状態なのかを理解することは依然として困難であり、ましてやその構成要素が互いにどのように相互作用するのかを理解することは困難です。 「細胞を車のような複雑な機械だと考えてください」とアレン細胞科学研究所のコンピュータービジョンと機械学習の研究者、グレッグ・ジョンソン氏は言う。「細胞は1日24時間稼働しているだけでなく、時には2台の車が並んで走ったり、4台の車が並んで走ったりします。世界で最も優秀なエンジニアでさえ、これほど高度な機械を再現することはできません。細胞の働きについて私たちが知っていることの少なさを考えると、いつも悲しくなります。」

生きた細胞の内部の仕組みを観察するために、生物学者は現在、遺伝子工学と高度な光学顕微鏡を組み合わせています。 (電子顕微鏡は細胞の内部を非常に詳細に画像化できますが、動いている生きた標本を捉えることはできません。) 通常、細胞は、ミトコンドリアや微小管などの特定の細胞内構造に付着する蛍光タンパク質を生成するように遺伝子組み換えされます。細胞が特定の波長の光で照らされると、蛍光タンパク質が光り、問題の構造の視覚的なマーカーとなります。しかし、この技術は高価で、非常に時間がかかり、一度に細胞内の構造的特徴の一部しか観察できません。

しかし、ソフトウェア エンジニアリングのバックグラウンドを持つジョンソン氏は、研究者が AI に細胞内の特徴を認識し、自動的にラベル付けすることを教えることができたらどうなるのかを知りたかったのです。 2018年、彼とアレン研究所の数人の協力者はこの探求の旅を始めました。研究者たちは蛍光画像サンプルを使用して、ディープラーニング システムをトレーニングし、これまでに見たことのない細胞内の 12 個の細胞内構造を識別できるようにしました。さらに重要なのは、トレーニング後、ジョンソンのシステムは細胞の「明視野画像」も処理できるということだ。明視野画像とは、通常の光学顕微鏡で直接取得された画像で、その内容は「懐中電灯の照明下にある細胞のように見える」ものだ。

これまでの高価な蛍光イメージング実験とは異なり、科学者はこの「ラベルフリーアッセイ」を使用して、生きた細胞の内部の高精度な 3D 画像を効率的に構築できるようになりました。

このデータは、理想的な細胞生物学の正確なモデルを構築するためにも使用できます。基本的には高校の教科書に載っているようなきれいな画像ですが、科学的精度ははるかに高くなります。これもまたこのプロジェクトの最終目標です。

▲ 図: 生きた細胞の単純な「明視野」光学顕微鏡画像では、ジョンソンのシステムは、ラベルのない DNA、核小体、核膜、細胞膜、およびミトコンドリア (システムが複数の色で強調表示) を識別できます。システムはこれらの細胞の動的な 3D モデルを作成できます。

「正常な細胞を取り出し、観察し、解剖し、その内部にあるものを分析できるようにしたいのです」とジョンソン氏は言う。「そして、結果は統計的なものなので、予想されるすべての変動が含まれます。つまり、この異常な細胞を観察し、それがどのように構成されているか解明できるのです。」

ジョンソン氏が機械学習を使って細胞の内部を視覚化する取り組みは、ディープラーニング技術が人工知能の一連のブレークスルーを引き起こす前の2010年にカーネギーメロン大学で始まった。それからほぼ10年が経ち、ジョンソン氏は、AIを活用した生細胞イメージング手法によってソフトウェアモデルの精度が大幅に向上し、特定の実験の必要性が減ったり、まったくなくなったりする可能性があると考えています。 「できるだけ安価に細胞を画像化しつつ、細胞の形態についてできるだけ多くのことを予測できるようにしたいのです」と彼は言う。「細胞はどのように構築されているのか? 遺伝子発現はどのようなものか? 周囲の細胞は細胞とどのように相互作用するのか? 私にとって、ラベルフリーアッセイは、将来のより複雑な目標に向けた基礎に過ぎません。」

私たちはジョンソン氏にインタビューし、基礎細胞生物学の課題と顕微鏡検査における AI の将来について詳しく聞きました。この会話はわかりやすくするために編集されています。

[[272735]]

(チョナ・カシンガー/写真提供)

Q: 生きた細胞の内部構造を観察するのはなぜ難しいのでしょうか?

ジョンソン:生きた細胞の内部を観察するには、2つの大きな制限を克服する必要があります。レーザーを使用して細胞を照射し、各蛍光タンパク質マーカーを光らせることはできますが、この特定のレーザーは有害であり、砂漠の太陽光と同じくらい細胞に致命的です。

もう 1 つの制限は、これらのタグが細胞内の元のタンパク質に付​​着することです。これらのタンパク質は、本来は他の場所に移動して機能する必要があるが、この大きな蛍光分子の付着はタンパク質の活動に影響を与えるため、標識が多すぎると細胞の動作が変わってしまう。場合によっては、蛍光マーカーの導入により実験を完了できなくなることがあり、また、これらの標準物質が標的細胞を死滅させてしまうことさえあります。

Q: でも、それが機能すれば十分ではないでしょうか?結局のところ、このアプローチは今日まで生物学を支えてきました。

ジョンソン:車の例えに戻りましょう。それはまるで、車全体がガラスでできているようなものです。車の内部は見えますが、部品同士がどのように相互作用するかはわかりません。これを基に、蛍光分子を使用して車内の 1 つまたは 2 つのコンポーネントを強調表示します。今では、どれがドアハンドルなのか、車にタイヤがいくつあるのかをはっきりと区別できます。しかし、時には、車輪が 2 つしかなく、ドア ハンドルがない「車​​」に遭遇することがあります。研究者たちは「これは一体何だ?」と不思議がっています。結局、おそらくバイクだと思われますが、私たちはバイクが何なのかさえ知りません。なぜなら、これまで目にした細胞は4つの車輪とドアの取っ手だけだったからです。それはそれくらいです。

生きた細胞を画像化できれば、細胞の構造をすべて同時に観察することができ、生物学の分野を新たな高みへと押し上げることになるでしょう。車を分解し、X線を使って構造を確認し、さらには自分で運転することもできます。いつか私たち独自のエンジンを作ることができるかもしれません。全体として、これにより、少なくとも細胞内で実際に何が起こっているのかをよりよく理解できるようになります。

Q: 細胞内部にラベルを付ける際にディープラーニング技術を使用するきっかけは何でしたか?

ジョンソン:ディープラーニング(2014年に生成的敵対的ネットワークで初めて使用)を使ってリアルな顔を生成し始めた人々を見て、「これを使って細胞も生成できる」とひらめきました。それが私が取り組んでいること、つまり細胞構造のシミュレーションです。私は、「特定のマーカーから細胞の画像を生成し、生物学者でさえ本物かどうか判断できないレベルの品質にすることができたらどうなるだろうか」と考えました。それができれば、ある意味では実際の実験を行うことができるモデルを構築したことになります。

Q: AIが存在しない構造物を生成するリスクはありますか?

ジョンソン:私たちが本当に必要としているのは、実験結果を予測して、科学者が最も価値があると考える実験を優先できるようにすることです。

たとえば、細胞の画像があり、ソフトウェアが細胞内の物質(たとえばミトコンドリア)の位置と配置を予測するとします。ラベルフリー モデルでミトコンドリアを観察すると、実際に目にするのは、ミトコンドリアの位置に関する AI の予測です。言い換えれば、これは細胞内のミトコンドリアの平均的な位置を示すことに似ています。

これを別の方法で使用することもできます。実際の実験を実施し、蛍光タンパク質を使用して特定の細胞にラベルを付ける予定であるとします。しかし、実際に実験を行う代わりに、安価な明視野顕微鏡画像を取得し、機械を使用してこのラベル付け実験の可能性のある結果を予測しました。次に、生成された予測画像に調査する価値のある結果が見られたら、実際の実験に進むことができます。

Q: では、AI を使って実験を改善したり、実験を置き換えたりするのでしょうか?

ジョンソン:どちらの答えも正しいと思います。ある科学者はかつてこう言いました。「実験の目的は、モデルが間違っていることを証明することです。」当社のディープラーニング モデルは、蛍光イメージング実験データのみでトレーニングされているため、収集する新しい実験データはすべて、モデルのエラーを指摘します。このデータをモデルに追加することで、次回の予測精度を向上させることができます。

これは、モデルが実験結果を正しく予測するかどうかに関係なく、モデルが取得する新しいデータが将来より正確な予測を行うのに役立つため、双方にメリットがあります。

このプロセスを極限まで進めると、実行したいあらゆる実験パラメータに入力できる機械学習モデルが得られます。次に、測定したいものの結果が表示されます。そして、これらの結論が実際の実験から得られた実際のデータと一致していれば、生物学的原理を根本的に正確に反映したモデルが得られることになります。

Q: このアプローチは議論の余地がありますか?

ジョンソン:2、3年前なら、人々はそれを見て「これは本当に信じられない」と言っていたでしょう。私は自分の研究を発表した多くの会議に参加しましたが、中には「こんなくだらないものは捨ててしまえ」と言う人もいました。しかし今では、人々は基本的な考え方を受け入れ始めています。実際、AI 技術は細胞生物学イメージングの分野全体で急速に推進されています。

Q: なぜこのような変更が起こったのでしょうか?

ジョンソン:私の博士論文は、この種の研究を達成するために古典的な統計モデリングを使用することに焦点を当てていました。統計は確かに非常に強力なツールですが、統計ツールによって現実的な品質の細胞画像が生成されるかどうかはわかりません。細胞内にぼかしを分散させて、より明るい場所をミトコンドリアの位置として指定することができます。しかし、人々は「これは本物の細胞にはまったく見えない」と言うのです。私が使っていた数学と確率の計算はすべて正しかったので、それは私にとって本当にイライラするものでした。

しかし、ラベルなし予測モデルからの最初の画像を見たとき、それは本当にリアルに見えました。細胞内の各成分の分布位置を明確に確認できます。人々はとても驚いていたので、私たちはこの方向で探求することに決めました。

質問: あなたが見ているものは現実ですか?

ジョンソン:はい、もちろんその通りです。実際、明視野画像をガイドとして使用した結果は人々を驚かせました。なぜなら、イメージングの世界では、明視野画像は主に 1 回限りのデータとして使用されるからです。組織の画像を撮影するときは、顕微鏡がサンプルに適切に焦点を合わせているかどうかを確認するために、通常の光を当てるだけです。その後、画像はディスク上のどこかに保存され、二度と使用されることはありません。非常に高価な蛍光分子標識実験と比較すると、明視野画像のコストはほとんど無視できるほどです。この高価なデータを使用してディープラーニング モデルをトレーニングし、撮影した明視野画像から細胞の内部構造を予測することができれば、多くの時間と費用を節約できます。

Q: 細胞内のさまざまな部分を識別するには、複数の独立したディープラーニング モデルをトレーニングする必要がありますか?これらのモデルの認識性能には実際の違いがあるのでしょうか?

ジョンソン:核やミトコンドリアなどの膜で囲まれた細胞小器官は、一般的に予測が容易です。微小管やゴルジ体などの膜に結合しない他の細胞小器官は、予測が困難です。その理由は、これらの細胞小器官の密度が細胞内の周囲の領域の密度とあまり変わらないからです。

Q: こうした制限をどのように克服したのですか?

ジョンソン: 通常、画像内でさまざまなレベルのコントラストを得るために、通常の透過光を使用するのではなく、偏光やその他の光学画像技術を使用します。

あるいは、現在の実験で 3 つの蛍光マーカーしか使用できない場合は、システムがすでに予測に優れている構造をマークするためにそれらを使用することを意図的に避け、代わりにアクチンや微小管などの細胞内構造など、予測が比較的難しい構造にそれらを使用します。

Q: あなたやアレン研究所の他の科学者たちは、これらのモデルを継続的に改良してきましたが、Integrated Cell はその研究の続編です。では、アレン研究所以外の科学者も、これによって得られる利益を享受できるのでしょうか?  

ジョンソン:はい、これも私たちのプロジェクト全体の中で非常に重要な部分です。 Google が AlphaGo を開発し、世界最強の囲碁プレイヤーを破ったとき、そのシステムはすでに 200 年間の人間によるトレーニングに相当する成果を蓄積していた。 Amazon や Microsoft 以外の組織では、これほど広範なトレーニングに同じリソースを割くことはできません。私たちは、他の人たちが私たちの細胞株と技術を使って、それぞれの研究室で独自の研究を行えるようになることを願っています。もちろん、彼らが私たちのような非常に複雑なプロトコルを必ずしも設定する必要はありません。

私たちの取り組みの 1 つは、こうしたタイプのモデルを汎用ハードウェア、つまりグラフィック カードを搭載した通常のコンピューター上に構築することです。システムに必要なトレーニング画像は、通常の研究室で一般の研究者が簡単に入手できます。当社のすべてのモデルは、トレーニングに蛍光標識された細胞構造の画像約 30 枚のみを必要とし、大学院生が午後 1 日で完了できます。さらに、この作業に使用したコンピューターの価格はわずか 2,000 ドル程度で、研究機器としては非常に安価です。本当に実用的なモデルを構築する必要がある場合、そのような前提条件はすでに非常に緩いです。

Q: この技術の進歩についてどう思いますか? AI の助けを借りて、細胞生物学者がどのような観察能力を獲得することを期待していますか?

ジョンソン:私たちがやりたいのは、細胞の動画を撮影し、その内部構造間の関係が予測レベルでどのように変化するかを見ることです。

微小管と DNA を例に挙げてみましょう。細胞が2つに分裂すると、通常は細胞の形状維持を助ける役割を持つ微小管がDNAを取り出して、細胞の両側に2つのコピーに分割します。この現象は誰もが認識しており、細胞生物学者にとっては必須科目でもあります。ただし、これら 2 つの構造の間には微妙なつながりが多くあり、直接観察するのが難しい場合があります。私たちは、最先端のコンピュータービジョンと機械学習の手法を使用して、さまざまな構造間の関係性を自動的に分析したいと考えています。

Q: この作業は画像データにのみ適用されますか?

ジョンソン:いいえ、私たちは自分自身を制限する必要はありません。細胞からさまざまな信号を抽出し、細胞の形態を測定し、さまざまな構造間の関係を確立することができます。ガラスの車の例えをもう一度使ってみましょう。すべての部品に明確なラベルが貼られているだけでなく、車両の走行距離、組み立てられた時期、部品の使用期間、交換されたかどうかなども確認できます。

この技術トレーニングは、将来的には仮想現実ディスプレイが搭載される可能性のある顕微鏡のデータ駆動型メカニズムと考えることができます。私たちは細胞やその他の測定プロセスであらゆるものを測定し、それらのオブジェクト間の関係を理解することができます。これは生物学や科学全般についての私たちの考え方を完全に変えます。科学者が自分の組織サンプルを見るとき、このようなディスプレイを使用して、細胞内で測定できるすべてのことを予測できるようになることを願っています。

<<:  AIを安全で信頼できるものにするためには、まずアルゴリズムの一般化能力を理解することから始める

>>:  人工知能と遠隔監視:宇宙でのマッチング

ブログ    

推薦する

...

ディープラーニングに加えて、これらの開発の方向性も理解する必要があります

[[214266]] AI の究極の未来は人間の知能に到達し、それを上回ることであることに疑いの余地...

...

機械学習のケーススタディ: クレジットカード詐欺検出

私は51CTOアカデミー講師の唐玉迪です。51CTOアカデミーの「4.20 ITリチャージフェスティ...

ペンシルバニア大学は、ディープニューラルネットワークの対称構造を研究し、層ごとの剥離解析モデルを提案した。

[[435206]]近年、ディープニューラルネットワークは多くの科学技術上の問題において優れたパフ...

AIの今後の4つの動向、人類は集団的に失業するのか?

人工知能、特に機械学習とディープラーニングは 2018 年にあらゆるところで話題になりましたが、今後...

...

...

AI による効率化: データセンターのエネルギー使用を再定義

今日のデジタル時代において、データ センターは、私たちのつながった世界を動かし続けるための膨大な情報...

これらの比較的成功している人工知能アプリケーションを使用したことがありますか?

人工知能に関して言えば、人気の科学映画をいくつか挙げなければなりません。多くの映画では、人工知能ロボ...

タクシー無料!百度:北京の自動運転タクシーサービスが全面オープン

簡単に体験できるものではないため、自動運転技術が実用化にはまだ遠いと感じている人も多いでしょう。しか...

ディープニューラルネットワークの数学的基礎は難しすぎますか?

ディープフィードフォワードネットワーク統計学から始めると、自然に関数 f を定義し、データサンプルは...

...

Github のデータサイエンスと機械学習のリポジトリ トップ 10

この記事では、データサイエンスと機械学習の愛好家にとって最も役立つ Github リポジトリをいくつ...

エッジAIとは何ですか?

エッジ AI は、今日のデジタル変革の時代に台頭している 2 つのテクノロジー、エッジ コンピューテ...