アリババ、1秒でフェイクニュースを暴く「AI噂クラッシャー」を正式リリース

アリババ、1秒でフェイクニュースを暴く「AI噂クラッシャー」を正式リリース

[[261230]]

エイプリルフールは私たちにとってただ楽しい日です。親にとって、ネット上の噂は日々の悩みの種となることがあります。

4月1日の特別な日に、アリババはDAMOアカデミーが開発した「AI Rumor Crusher」技術を正式にリリースした。この技術はフェイクニュースを1秒という速さで識別することができる。ソーシャルプラットフォームやニュースサイトが噂を発信源で封じ込め、親たちが毎日エイプリルフールを祝わなくても済むようにすることが狙いだ。

この動きについて、ネットユーザーたちはこれを良心的な行為と呼び、意見を述べた。

では、このAI噂粉砕機はどんなブラックテクノロジーを持っているのでしょうか?編集者と一緒に詳しく見ていきましょう。

アリババ、噂を81%の精度で判別するAI噂クラッシャーを開発

アリババのDAMOアカデミーの科学者たちは、真実と偽りのニュースを識別でき、将来さまざまな分野に応用できるアルゴリズムモデルである噂クラッシャーを開発した。

これはどのようなアルゴリズムなのか?正確なのか?本当に噂を終わらせることができるのか?「噂クラッシャー」の開発者、李全志氏が解説した。

①「クラッシャー」の以前の役割は、ジャーナリストに信頼できる手がかりを提供することだった

「急いで!科学者は、漢方薬が48時間以内に癌細胞の60%を殺すことができることを発見しました!」 「夜に沸騰したお湯を飲む友人、これを読まないと手遅れになりますよ!」 「専門家は、これを食べないようにと言っています!」...

皆さんは親からこのような「心配」を受けたことはありませんか?「忘れて、あなたが幸せならそれでいい」という態度で会話を終わらせたことが何度ありますか?「情報が正確かどうかは保証できませんが、噂かどうかは基本的にわかります。」

DAMO アカデミーの NLP チームの中心メンバーの 1 人である Li Quanzhi は、清華大学を卒業し、その後米国で自然言語理解の博士号を取得しました。現在は、DAMO アカデミーのシアトル オフィスに勤務しています。

DAMOアカデミーに入社する前、彼はロイターの重要な「情報担当官」であり、機械を使って何万ものオンライン情報を精査し、何千人もの最前線の記者に信頼できる手がかりを提供していた。

「AI噂粉砕機」は自然言語の助けを借りて実現されます。先日終了したSemEval(計算言語学会主催の自然言語処理分野における国際的に権威のあるコンテスト)のグローバル意味テストにおいて、「AI Rumor Crusher」がフェイクニュース識別精度で新記録を樹立し、81%に達した。

[[261231]]

② ニュースが真実か虚偽かを判断するには3つのステップがあります。

「AI噂クラッシャー」はどのようにして噂かどうかを判断するのでしょうか?李全志氏は、それは3つのステップに分かれていると述べました。

まず、モデルは情報の元のソースを見つけ、専門分野、以前に配布または転送された内容、個人か組織か、登録時間、活動パターンなど、ユーザーのプロフィールを分析して、発行者が「信頼できる」かどうかを判断します。

そして、異なる態度を持つ人の割合やそれぞれの信憑性などの情報をもとに、ニュースの信憑性を算出します。

2 番目のステップは、インターネット上のすべての情報ソースを検索し、リンクのドメイン名が新華社通信、政府医療管理局などの信頼できる Web サイトのものであるかどうかを確認することです。

3 番目のステップは、テキスト内の主要な引数を知識ポイントに抽出し、それをナレッジ グラフ内の信頼できるナレッジ ベースと照合して検証することです。

関連性や矛盾がない場合は減点となります。李全志氏は、「AI噂粉砕機」はある程度の人間の考えも考慮するが、より重要なのはAIを活用することだと説明した。

人工知能には、人間には真似できない部分がたくさんあります。例えば、SNSで噂があっという間に広まったとき、それが本当か嘘かを判断するのは人間には難しいです。誰がそれを受け取ったのか、なぜ転送したのか、人によってどう思うのかはわかりません。AIならそれができるんです。

「噂が出たら、人々はウェブサイトを通じてそれを検証できるが、AIはすぐに科学研究やニュースを引き出し、背景知識ベースと比較して検証することができる。人間の脳には基本的な判断力はあるが、大規模な知識ベースはない」と李全志氏は語った。

「AI 噂クラッシャー」のトレーニング サンプルを例に挙げてみましょう。少なくとも 2 つのレベルがあります。

  • まず、基礎となる 2 億件の情報と数百万件のニュース項目を使用して、言語サンプルをトレーニングします。
  • 次に、モデルは噂の信憑性についてトレーニングされます。

「これは複雑で時間のかかるプロセスだ」と李全志氏は語った。

[[261232]]

③噂を広めたのは誰?論文は盗作?将来のクラッシャーはより多くの機能を持つでしょう

実際、そのようなデータ モデルを構築するのは簡単ではありません。李全志氏は、以前の会社でこの研究を始めていたが、まだ改善の余地があると認めた。

一般的に言えば、これは単独でリストできる技術ではなく、すべての自然言語技術の組み合わせであるため、彼らにはこの技術の研究に専念する小さなチームがあります。

現時点では、このモデルはアリババのどの事業にも適用されていない。李全志氏は、データモデルは絶えず「訓練」され、社会に認知される必要があり、これらは短期間で解決できるものではないと認めた。

今後、「AI 噂潰し」がさまざまな場面で活用されるようになると考えられます。たとえば、個人の執筆スタイル、方法論、主題など、複数の側面から論文が盗用されているかどうかを判断するテクノロジーを使用することで、論文が盗用されているかどうかを識別することができます。

かつては、若い作家の後期作品はゴーストライターによるものだという意見もあったが、将来的にはAIを使って分析し、結論を導き出すことも可能になるだろう。

一方、それは警察が本当の噂の発信者を見つけるのに役立つ可能性があります。 AI を使って伝播経路を追跡し、伝播経路から伝播を分解することで、パターンを発見できます。

たとえば、どのユーザーが情報を広めたのか、その反応はどうだったのか、単に転送したのか、同意したのか、反対したのか、あるいは二次処理を受けたのかなどです。

「もちろん、モデルにはさらなる言語トレーニングが必要です。例えば、一部のユーザーがメッセージを転送する際、皮肉やアイロニーを言う場合もあれば、隠喩である場合もあります。それが本当の感情表現であるかどうかはわかりません。機械がこれらを判断するのは難しいですが、多くのトレーニングを通じて達成できます。」李全志氏は、彼と彼のチームは引き続きモデルを研究すると述べた。

Alibaba Motion Research Instituteが発表した「AI Rumor Crusher」テクノロジーについてどう思いますか? ぜひ下部にメッセージを残して、ご意見をお聞かせください。

<<:  人工知能は止められない。アドバンテックのWISE-PaaS 3.0がイノベーションを推進

>>:  自動化ロボットのHMI設計の詳細な説明

ブログ    

推薦する

...

...

URLベースのクライアント監視と分析における機械学習の最適化と実践

従来のクライアント監視および分析シナリオでは、特定の URL に基づく統計分析方法が使用されます。た...

...

...

データセンター不足がAIの未来を阻害している理由

多くの企業が AI テクノロジーの開発と導入に数十億ドルを投資しています。知的財産の問題、潜在的な規...

2019年の中国人工知能産業の競争環境の分析

近年、人工知能の技術と応用は成熟を続けており、人工知能市場の規模は徐々に拡大しています。中国情報通信...

MITは、大規模な問題を解決するにはアルゴリズムがハードウェアよりも有用であることを証明した。

[[425167]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

AIが農業用水効率の課題をどう解決するか

[[388190]] • 食糧需要が増加するにつれて、世界は水の使用を管理する必要があります。 • ...

機械学習で避けるべき3つの落とし穴

[[274438]]機械学習の分野は数十年にわたって「タンク問題」に悩まされてきました。この話は 1...

人工知能で最も人気のあるアルゴリズムトップ10をわかりやすく解説

機械学習は業界にとって革新的で重要な分野です。機械学習プログラムに選択するアルゴリズムの種類は、達成...

人工知能技術が身元調査業界に革命を起こしている

これは、AI テクノロジーが身元調査業界に革命をもたらし、これまで以上に効率的でコスト効率の高いソリ...

制御可能な人工知能には未来がある

8月29日、2019年世界人工知能会議が上海で開幕した。世界各国の著名なテクノロジー企業や学界、産業...