NLP フィールド インデックス ツール、3000 以上のコード ベース、論文や GitHub ライブラリのワンクリック検索

NLP フィールド インデックス ツール、3000 以上のコード ベース、論文や GitHub ライブラリのワンクリック検索

検索について言えば、学術的な検索も科学です。

検索を上手に使いこなすと、必要な学術情報を素早く見つけることができ、半分の労力で 2 倍の結果を得ることができます。例えば、よく使われる論文とそれに対応するソースコードを提供するツール Papers With Code には、多くの SOTA 論文とコードが含まれています。論文のキーワードを直接検索して関連する論文やコードを取得できるほか、分野別に検索することもできます。もう 1 つの例は、arXiv と文献調査ツール Connected Papers の強力な組み合わせです。arXiv の各論文は、アブストラクト ページの Connected Papers 内の関連論文マップに直接リンクできます。

この非常に実用的な検索ツールは、研究者が学術資料を簡単に見つけ、多くの時間を節約し、最良の検索結果を提供するのに役立ちます。

ここでは、学術検索用に開発された、非常に実用的な NLP インデックス作成ツール「The NLP Index」を紹介します。これは無料のオープンソースです。

プロジェクトアドレス: https://index.quantumstat.com/

NLP インデックスには 3,000 を超えるコード リポジトリがあり、ユーザーは、今日の NLP で最も重要なトピックのいくつかを含むサイドバーの 1 つを検索できます。入力しながら検索できます。そのインデックスには、arxiv 研究論文 PDF 形式、文献研究成果物 ConnectedPapers リンク、およびそれらに対応する GitHub コード リポジトリが含まれており、これら 3 つの学術成果物を組み合わせたものと言えます。

「NLP インデックス」の紹介

「The NLP Index」の左の列には、下図のように、データ(データ拡張、データセットなど)、タスク(関係抽出、音声認識など)、関連分野(医療、金融など)、モデル(BERT、BARTなど)、言語タイプ(クロスランゲージ、多言語など)、モデルスコープ(文字レベル、文レベルなど)、含まれるアーキテクチャ(エンコーダー、デコーダーなど)、PIPELINEなど、10個のモジュールがあります。

左の列の 3 番目のモジュール「MODELS」を例に挙げてみましょう。モジュールをクリックすると、ドロップダウン ボックスに下の図に示すインターフェイスが表示されます。「モデル」の下には、CNN、RNN、BART、BERT、GPT-2 などのよく使用されるモデルがあります。

[モデル] ドロップダウン ボックスには、コンテンツの一部が含まれています。

「bert」などのモデルをランダムにクリックすると、キーワード「BERT」を含む関連論文が右側に青いフォントで強調表示されます。さらに、論文の概要、論文の著者、論文の PDF リンク、グラフ リンク、GitHub リンクも表示され、ユーザーがすぐに見つけられるようになります。

マウスを対応するモジュール(要約、著者など)に置くと、関連するすべてのコンテンツが表示され、ユーザーは論文の全体的な内容を理解できるようになります。

さらに、「The NLP Index」もConnected Papersに関連付けられています。グラフインターフェイスをクリックすると、生成された文献分析ネットワーク図にジャンプします。結果ページは3つの列に分かれています。左の列はこの記事のタイトルと関連文献、右の列は関連文献の具体的な内容、中央の列は文献検索分析マップです。文書の引用情報をオンラインで分析し、特定の文書の引用と引用関係を簡単に把握し、文書の過去と現在を分析し、研究者が文書または特定の分野に関する研究をより簡単に行うことができます。

この無料でオープンなインデックス作成ツールについて、あるネットユーザーはこうコメントした。「これはすごい。このデータは Papers With Code からのものなのか?」

別のネットユーザーは「他の人に便利にしていただいて本当にありがとうございます」とコメントした。

<<:  機械学習モデルを構築するときに避けるべき 6 つの間違い

>>:  Google は、DQN と同等で、より優れた一般化パフォーマンスを備えた 2 つの新しい強化学習アルゴリズムを実装しました。

ブログ    
ブログ    

推薦する

AIはイベント業界の未来を形作ることができるでしょうか?

ライブイベントは優れたマーケティング形式であり、ビジネスと顧客との関係を強化する優れた方法です。調査...

アルゴリズムエンジニアとして働くために養豚場に行く?月20,000

[[282855]]皆さんご存知の通り、今年の「ブラザーツー」の値段は大変高く、信じられないほど高...

テンセントがキング・オブ・グローリーAIの最新情報を公開、トッププロ選手を一騎打ちで圧倒

[[286697]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

AI+ビデオ分析: ユビキタスセキュリティリスクのリアルタイム監視

[[352986]] 2020 年の多くの運用上の課題を踏まえて、公益事業会社は、運用する物理的およ...

2019年に主流となった10のAIテクノロジー

1956年にコンピューターの専門家ジョン・マッカーシーが「人工知能」という言葉を作り出して以来、わず...

そうだ!機械学習を使用してビリビリの株価動向を予測する

[[419019]]この記事では、主にPythonを使用してビリビリの株価を分析する方法について説明...

2023 年までにデータセンターで注目される AI と ML の 10 大アプリケーション

人工知能 (AI) と機械学習 (ML) は、データセンター分野の重要なテクノロジーとなっています。...

...

Caffeine ソースコード解釈 - キャッシュ有効期限の削除に関連するアルゴリズム

[[410588]]この記事はWeChatの公開アカウント「Muscular Coder」から転載し...

...

プラットフォームのイノベーションを加速し、「クラウド、ビッグデータ、IoT、インテリジェンス」の新たな章を切り開く

世界を席巻するデジタル変革は、あらゆる分野に大きな発展のチャンスをもたらしました。技術革新を推進する...

AIoTは公共交通機関をよりスマートかつ安全にします

さまざまな公共交通機関を頻繁に利用する人にとって、安全性と質の高い体験は最も重要です。人工知能やモノ...