6月14日、マイクロソフトの研究者らは、主に生物医学研究に使用され、CTやX線画像に基づいて患者の病状を推測できるLLaVA-Medモデルのデモを行った。 マイクロソフトの研究者らは、マルチモーダル AI モデルのトレーニングに向け、バイオメディカル画像とテキストの対応に関する大規模なデータセットを取得するため、病院グループと協力したと報じられています。データセットには、胸部X線、MRI、組織学、病理学、CT画像などが含まれており、比較的包括的にカバーされています。 ▲ 画像出典:Microsoft Microsoft は、Vision Transformer と Vicuna 言語モデルに基づいて、8 つの NVIDIA A100 GPU 上で LLaVA-Med を GPT-4 でトレーニングしました。このモデルには、「各画像のすべての事前分析情報」が含まれており、画像に関する質問と回答を生成して、「生物医学画像に関する質問に自然言語で答えられる」というアシスタントのビジョンを実現します。 学習プロセス中、モデルは主に「そのような画像の内容を説明すること」と「生物医学的概念を詳しく説明すること(ITホーム注:画像からどのように見えるかを判断する)」を中心に展開します。 Microsoft によれば、このモデルは最終的に「優れたマルチモーダル会話機能」を備えており、「LLaVA-Med は、視覚的な質問に答えるための 3 つの標準的な生物医学データセットのいくつかの指標において、他の最先端モデルよりも優れています。」 ▲ 画像出典:Microsoft 研究チームは次のように述べている。「LLaVA-Med モデルは、有用なバイオメディカル視覚アシスタントの構築に向けた重要なステップであると考えていますが、現在の LLaVA-Med モデルには、大規模モデルに共通する誤った例や精度の低さといった欠点がまだあります。今後、研究チームはモデルの品質と信頼性の向上に注力し、将来このモデルが商用バイオメディカルで使用できるようになる予定です。」 IT Home は、このモデルがオープンソース化され、誰でも GitHub で関連情報を見つけることができることに気づきました。 |
<<: 日本俳優連合がAI法案を提案、「声の肖像権」創設求める
[[269803]]最近、研究者たちはニューラルネットワークに基づく新しいアルゴリズムを使用して量子...
[[440141]]過去数年間で、人工知能はエンタープライズ アプリケーション市場で大きな進歩を遂げ...
近年、ディープラーニングは音声、画像、自然言語処理などの分野で非常に優れた成果を上げており、当然なが...
人工知能が進歩し続けるにつれて、研究者たちはその能力を向上させ、さまざまな分野で倫理的かつ責任を持っ...
AIは心臓病の予測やアルツハイマー病の検出など、医療分野で幅広い応用が期待されています。新たな研究に...
OpenAI が成功に忙しい一方で、シリコンバレーの最大のライバルである Anthropic は、...
9月19日、大手AIインフラ企業であるFabartaは、北京で初の製品およびユーザーカンファレンスを...
スターアルゴリズムの手順: 1. 最初に、オープン リストに開始点を追加します。 2. オープンリス...
ChatGPTからAI描画技術まで、人工知能分野における最近の進歩はTransformerのおかげか...
著名なテクノロジー記者マーク・ガーマン氏によると、Appleはバグ修正に集中するため、iOS 18の...
3 月 8 日、ベンチャー キャピタル業界の 2 人の巨人、マーク アンドリーセン氏とヴィノド コ...
水曜日の早朝、著名な物理学者スティーブン・ホーキング教授の家族は声明を発表し、ホーキング教授がイギリ...
エネルギー業界は、気候変動、需要の増大、送電網の安定性といった課題に直面しながら、化石燃料から再生可...
突然の感染拡大に直面し、国民は情報の適時性、透明性、伝達効率にさらに注目するようになった。このような...