6月14日、マイクロソフトの研究者らは、主に生物医学研究に使用され、CTやX線画像に基づいて患者の病状を推測できるLLaVA-Medモデルのデモを行った。 マイクロソフトの研究者らは、マルチモーダル AI モデルのトレーニングに向け、バイオメディカル画像とテキストの対応に関する大規模なデータセットを取得するため、病院グループと協力したと報じられています。データセットには、胸部X線、MRI、組織学、病理学、CT画像などが含まれており、比較的包括的にカバーされています。 ▲ 画像出典:Microsoft Microsoft は、Vision Transformer と Vicuna 言語モデルに基づいて、8 つの NVIDIA A100 GPU 上で LLaVA-Med を GPT-4 でトレーニングしました。このモデルには、「各画像のすべての事前分析情報」が含まれており、画像に関する質問と回答を生成して、「生物医学画像に関する質問に自然言語で答えられる」というアシスタントのビジョンを実現します。 学習プロセス中、モデルは主に「そのような画像の内容を説明すること」と「生物医学的概念を詳しく説明すること(ITホーム注:画像からどのように見えるかを判断する)」を中心に展開します。 Microsoft によれば、このモデルは最終的に「優れたマルチモーダル会話機能」を備えており、「LLaVA-Med は、視覚的な質問に答えるための 3 つの標準的な生物医学データセットのいくつかの指標において、他の最先端モデルよりも優れています。」 ▲ 画像出典:Microsoft 研究チームは次のように述べている。「LLaVA-Med モデルは、有用なバイオメディカル視覚アシスタントの構築に向けた重要なステップであると考えていますが、現在の LLaVA-Med モデルには、大規模モデルに共通する誤った例や精度の低さといった欠点がまだあります。今後、研究チームはモデルの品質と信頼性の向上に注力し、将来このモデルが商用バイオメディカルで使用できるようになる予定です。」 IT Home は、このモデルがオープンソース化され、誰でも GitHub で関連情報を見つけることができることに気づきました。 |
<<: 日本俳優連合がAI法案を提案、「声の肖像権」創設求める
「人工知能」という用語を Google で検索して、何らかの形でこの記事にたどり着いた場合、または ...
近年、人工知能技術は飛躍的な進歩を遂げており、各国は人工知能技術の戦略的意義を認識し、国家戦略レベル...
ここ2年間、RPA+AI(インテリジェント自動化プロセス)が頻繁に言及されています。企業/機関のデジ...
人工知能は現代世界のあらゆる分野を征服しつつあります。しかし、それらはすべて私たちにとって良いことな...
過去 20 年間で、世界はテクノロジーにおいて驚異的な進歩を遂げ、人間の生活のさまざまな側面に影響を...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
世界中の人工知能の人材が徐々に量産モードに入りつつあります。今年6月、百度と浙江大学は、潜在的な人工...
ご存知のとおり、コンピューティング パワーの文字通りの意味はコンピューティング能力です。 「コンピュ...
[[433825]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
[[246854]]私の意見では、警告、悲観、パニックはすべて「廬山の本当の顔を知らない」根拠のない...
[[197317]] [51CTO.com からのオリジナル記事]今週の金曜日 (2017 年 7...
AIが医療業界を変える[[397937]] AIとロボットはすでにいくつかの医療機関で活用されていま...
人工知能は、生産性の向上、売上の増加、ユーザーエクスペリエンスの向上など、さまざまな状況で使用されて...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[209094]]大学時代の専攻は自動制御で、当時は人工知能の冬でした。ある日、ニューラルネット...