目視で観察すると、コメント欄は中国文学の巨匠の密度が比較的高く、侮辱やおどけのレベルも比較的高く、A駅とB駅ではコメントが集中砲火にさえなっている場所である。
プラットフォームベースのアプリは、「コメント」文化の違いにより、美学と関心が異なります。知乎スタイルと「私の青春が戻ってきた」は「ファッション性」のコードになっています。 マクロレベルでは、「インターネットユーザーのコメント」は世論の特性と広範な社会的動員力を持つものとして定義されます。そのため、調査、面談、停止、是正、見直しなども管理機関でよく使われる「ハンマー」です。 コメント欄は無視することが難しい公開エリアです。 コミュニティのブランドに共感し、大量の高品質なコンテンツを生み出すアクティブなユーザーのグループが存在することは、コミュニティにとってありがたいことです。 表面的には、「コメント欄」はコミュニティの雰囲気を作る役割を担っており、インターネット上の「公共の場」です。 舞台裏では、共有された意見が消費者の意思決定に影響を与え、それがビジネスに影響を与えます。 (英国政府によれば、英国だけでも、オンラインレビューは毎年約280億ドルのホテルや旅行の予約に影響を与えている。) コメント欄はユートピアではありません。
これは孤立した現象ではない。海外メディアのCNNは、世界中のインターネット上でのホテルや旅行に関するオンラインレビューの7分の1が偽物であるという数字さえ発表した。 「コメント欄」は常に人でいっぱいですが、コンピューターが人間のように「中国語/テキスト」を理解できるようにする人工知能(AI)、自然言語処理(NLP)の重要な方向性を避けることはできません。 国民は、コンテンツの検出、ネット荒らしの特定、罵り言葉の削除、不適切なコンテンツの処理のために AI を早急にオンラインに導入するよう求めました。 1.自然言語処理技術はかなり優れている ちなみに、NLP 技術は大手インターネット企業で非常によく利用されており、検索、推奨、広告、インテリジェント アシスタントなどの多くのシステムに採用されており、技術チームは学術の最先端を常に追い続けています。 まずは業界を見てみましょう。New Oriental Educationは、レベル分類を行うために、2018年に学生ユーザープロファイリングプロジェクトを開始しました。 NLP テクノロジーは、関連する構造化データ テキストにラベルを付け、ユーザー選択および行動イベント分析機能を追加します。各ビジネス部門は、ラベルに基づいて学生を選択できます。 Autohome 機械学習グループは、Autohome ユーザー製品センター傘下の認知インテリジェンス グループです。NLP テクノロジを使用して、ユーザーの車の選択や複数ラウンドの会話をサポートします。 2020年、JD AI Cloudは感情認識や音声対話などのインテリジェント技術を活用し、ダブルイレブンの最初の1時間に138万件の感情知能顧客サービスサービスを提供しました。 Meituan Search は、機械を使用してユーザーのさまざまな検索意図を理解します。ただし、ユーザーの意図は時間の経過とともに変化するため、さまざまな検索での想起、ランキング、表示のために、限られた数のキーワードから非常に豊富なシグナルを解釈することができます。 Meituan には専用の AI プラットフォーム/検索および NLP 部門があります。 さらに、Meituan Brainはさまざまなシナリオからデータをマイニングして関連付け、人工知能アルゴリズムを使用して、機械がユーザーの商店に対する公開コメントを「読み取り」、料理、価格、サービス、環境などに関するユーザーの好みを理解し、人、店舗、製品、シナリオの間に知識のつながりを構築できるようにします。これは「ケータリングとエンターテイメントの知識脳」と見なされ、検索、SaaSレジ、金融、食品配達サービスをサポートします。 非構造化テキストの一種であるユーザーコメントには、非標準的な表現の「単語」が多数含まれています。 機械は、文章の文脈にある一連の「単語」に基づいて、どの「単語」が続くかを予測します。予測は確率に関するものです。文章内の各「単語」には、文脈に基づいた予測プロセスがあります。これらすべての「単語」の確率は掛け合わされます。値が大きいほど、文章がゴーストワードやナンセンスではなく、人間の言葉のように表現されます。 そのため、人間だけでなく、機械もどの文が人間の言葉に近いかを判断することができます。 「黄鶴楼」という言葉には3つの意味があるかもしれません。武昌の蛇山の頂上にある有名な建物、北京の商人、湖北省のタバコのブランド。 AIアルゴリズムは愚かではありません。文脈に基づいて予測することができます。前のテキストは揚子江、景勝地、観光、チケットの価格、高いところに登って外を眺めることなどについて話しているから、ここの「黄鶴楼」がタバコについて話しているとは推測しませんが、景勝地である可能性が高いです。 もう 1 つの例は、映画、テレビ シリーズ、アーティストなどの情報を取得して「辞書」を作成できる Maoyan Entertainment です。しかし、検索量が増え、検索表現が複雑になってくると、辞書だけではユーザーのニーズに応えられなくなるため、辞書の補助としてAIモデルが使われるようになるでしょう。 学術界に目を向けると、Transformer(ディープニューラルネットワーク)と呼ばれるモデル、TransformerをベースにしたBERTモデル(2018年の主要な技術革新)、GTPモデル(シリコンバレーのOpenAI研究所が制作)などがあり、いずれも事前トレーニングと微調整の考え方を使って問題を解決しています。 言語モデルの事前トレーニングは、各タスクごとに大量のトレーニング データに個別にラベルを付ける必要がなく、ラベルのないテキストの海から潜在的な意味情報を学習するようなものです。言語モデルは事前トレーニングされた後、少量の注釈付きコーパスを使用して微調整され、分類、シーケンスのラベル付け、文の関係性の判断、機械による読解などの特定の NLP タスクを完了します。 つまり、アルゴリズムの「パフォーマンス」が大幅に向上し、BERT によって NLP テクノロジーの範囲が拡大したのです。 2. 運営チームもかなり優秀 「Dear Data」は、大手インターネット企業の数名の運用担当者と話をしました。彼らは、各社の「コメント」の運用には多くの配慮が払われていることを知りました。 Tik Tok のコメント欄には、最も人気のあるコメントと最新のコメントの両方が表示されるデュアルトラックシステムがあります。最新のコメントは小さなプールとして理解できます。ユーザーからのいいねの数に応じて、プッシュし続けるかどうかを決定できます。これにより、後から投稿された良いコメントも上位にランク付けされるようになり、コメント セクションの推奨アイデアが応用されます。 Douyin 検索では、コメント欄に質問する人が多いかどうかを識別し、検索候補を表示することを検討しています。しかし、パスが長すぎるため、現在人気のソーシャル動画の下にToutiaoの記事へのリンクを追加するように直接変更しました。 コメントエリアのデータを処理する一般的な方法は構造化です。電子商取引やホテル、旅行アプリは、数十億のコメントエリアに対して構造化処理を実行してきました。ここで言う構造化とは、データを構造化することを意味します。コンピューターは構造化データしか処理できず、非構造化データを理解できないためです。したがって、「理解」レベルになると、まずテキストを構造化する必要があります。 NLP はレビューを分析し、「セグメンテーション」を洗練し、構造化されたアウトリーチを追加します。これは「注釈」を見つけることと同等であり、ユーザーがレビューを閲覧する際の効率を向上させます。偉大な心は同じように考えます。そして、ユーザーは当然、人数が多ければ多いほど意見の信頼性が高くなると信じます。 日常生活では、タオバオでリフティングテーブルを購入するとき、「設置効果が良い」、「品質が良い」、「使用後の感触が良い」と思います。ホテルを選ぶ際に、「安い」「快適」を重視する人が何人いるか、「静か」「交通の便が良い」を重視する人が何人いるかがわかります。 明らかに、Taobao、Xiaohongshu、Dianping、Mafengwo などの消費 + コミュニティでは、コメントにしきい値があります。商品を注文したことがなく、使用経験のないユーザーはレビューに参加できません。 楽しみを見ている人は素人ですが、店舗を訪れる人は専門家であることが多いです。プラットフォームはコンバージョンを促進するために良いレビューを前面に出す傾向があり、消費後の需要も増え、特別な対応と処理が必要になります。 Tik Tok、Kuaishou、Bilibili、Mango、Douban など、コメントへの参加のハードルが低く、純粋に娯楽と議論のためのコミュニティです。一般的に、電子商取引のレビューが適切に管理され、商品を販売したいという意欲があれば、誰もが商品に関連する事柄について話すようになります。 小紅書の熱狂的なファンは、多くのレビューがお金で買われていると信じている。ビッグVにたくさんのファンがいれば、広告も受けるでしょう。しかし、小紅書の全体的な評価はかなり強く、頭の悪い水軍とは違っていて、たとえ宣伝文句であっても、とても誠実に書かれています。 コメントは「UGC(ユーザー生成コンテンツ)」であり、リアルかつ新鮮で、潜在的な商業価値を引き出すことができます。ユーザーにとって、それが「体験」であれ、「乾物」であれ、「ガイド」であれ、誰もが「リアル」かつ「役に立つ」レビューを必要としています。 3. コメントが適切に管理されないのはなぜですか? こんなに高度なスキルと高い出発点を持っているのに、なぜ「コメント欄」をうまく管理できないのでしょうか? ここで、3 つの障害があります。 まず、レビュー データの品質が特に悪いです。「特に」という言葉に注意してください。 データガバナンスのレベルが低いと、多くの場合、人工知能アルゴリズムが効果を発揮しなくなります。アルゴリズムの有効性はトレーニング データと密接に関係しています。適切なラベル付きデータ セットがあれば、通常のアルゴリズムを使用しても優れたパフォーマンスを実現できると言えます。実際には、企業が NLP をうまく活用したい場合、まず基本データを接続する必要があります。コメントデータの基礎が貧弱すぎて、袋に刺繍をするようなもので、労力の無駄です。 次に、それを使用する「ふり」をします。 とにかく、誰もがインテリジェントテクノロジーを採用しているので、それを使用しているふりをする必要があります。 AI技術の活用は「上司」にとって急務だ。場合によっては、エンジニアリングが自動化へと退化し、そのごく一部にのみアルゴリズムによる知能が使用されることがあります。私たちが現在最も取り組んでいるのは、感情分析、スパムコメントのフィルタリングなどです。 AI は適切に使用されなければ単なる小道具となり、最も基本的な統計分析チャートにまで後退してしまう可能性もあります。 3番目に、真剣に受け止めないでください。 多くのインターネット企業は、コメント欄は二流のものであり、二級市民的な意味合いがあると考えています。はっきり言って、配慮が足りていないというか、メイン事業である「(レコメンドや検索)」を支える技術が十分ではないので、コメント欄にまで配慮が行き届いていないのです。十分に調査されておらず、適用の深さと幅も十分ではありません。規制レビューの主な動機の 1 つは、単に政府規制機関の規制要件を満たすことです。 要約すると、NLP テクノロジーの運用に対する魅力は十分ではなく、その影響は十分に大きくなく、NLP と運用はまだ切り離せない関係を形成していません。 英国サウサンプトン大学卒のAIアルゴリズム科学者、袁雪堯氏もインタビューで次のように明らかにした。「インターネット企業は、ユーザーが投稿したコメントを半手動で識別し、手動でデータ注釈を追加するだろう。現在、NLPのより成熟した分野には、感情分析、世論分析、ユーザープロファイリングなどがあり、業務への影響は比較的穏やかだろう。」 (ディープラーニングに基づく感情分類法は、大量のデータからテキスト内の意味情報を能動的に学習し、テキストの特徴と感情分類を取得し、テキストデータと感情を正確に抽出するという目的を達成します。たとえば、「否定的」と「肯定的」など) 平安知輝企業有限公司のアルゴリズム専門家も次のように考えている。「コメントには無意味な内容が多く、分析によって価値のあるものを自動的に除外する。NLP技術は問題を解決しているが、病気を治すことはできない。」 「中程度」という言葉が特によく使われています。NLP はまだ大きな戦場を抱えており、ビジネス面での困難を乗り越えるためには運用との同盟を形成する必要があります。コメントで使用されるマイニング手法には、ルール、従来の機械学習モデル、ディープラーニング モデルなど、さまざまな種類があります。 「コメント」の商業的価値を探求することに特化したスターAI製品はまだ登場していないようだが、注目している人もいる。 東京大学のスタートアップであるTDAI Labは、人工知能ツールをレビューサイトやその他の機関に販売すべきだと考えています。 日本のラーメン店4,000店以上の口コミを分析し、「AIランキング ラーメン店ベスト100」の東京版を発表した。 人工知能は「偽のレビュー」や「悪質な悪いレビュー」の疑いを排除した上で、レビューの高い店舗を選定した。 直ちに生命を脅かすものではないが、企業のコスト削減と効率性の向上に役立つ可能性がある「コメント セクション」のシナリオの分析を無視すべきではありません。 AI テクノロジーには、コンピューティング能力、データ、アルゴリズム モデル、そしてさらに重要なアプリケーション シナリオが必要です。多くのAI企業は、当初から高速鉄道の車輪を変えたいと考えていました。しかし、顧客が新しい技術やAI企業を信頼していないため、そのような野心を持って従来の企業のドアをノックしても成功率は非常に低いのです。 偽りの肯定的なレビューや悪意のある否定的なレビューにより、消費者とレストランの両方が損失を被ります。消費者は良い店を見つけることができず、良い店もビジネスチャンスを失うことになります。 1968 年、ギャレット・ヘイディンは「コモンズの悲劇」と題する記事をサイエンス誌に発表しました。 「コモンズの悲劇」と翻訳されていますが、原文のコモンズには公共空間も含まれます。 コメント欄の環境が悪化すると誰も勝者にならない。 AIによるレビューやコメント欄のAI化は避けられないトレンドです。「コメント」には才能が必要ですが、「コメント」の管理にはさらに才能が必要です。 |
>>: 2021年には、人工知能が私たちの生活にさらに統合されるでしょう。これは何を意味するのでしょうか?
2020 年には人工知能 (AI) が飛躍的に進歩し、機械学習はこのテクノロジーの最も成功し、広く普...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
機械学習モデルはますます洗練され、正確になってきていますが、その不透明性は依然として大きな課題となっ...
現在の国際情勢から判断すると、将来の軍事兵器の開発は主に宇宙に向けられることになるが、スペースシャト...
セルフメディアの時代において、すべてのパブリックアカウントは、自分の記事をより多くの人に見てもらえる...
[[440335]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
これから起こることは、やがて起こるでしょう! OpenAIが開発者会議で正式発表した「GPTストア」...
ロイター通信は10月4日、ソフトバンクグループの創業者兼CEOの孫正義氏が本日、汎用人工知能(AGI...
世界的なデジタル変革ブームが到来し、ビジネス環境が急速に変化する中、業界の再編と再編が加速しています...
マスク氏はついに我慢できなくなり、X のデータを AI に入力し始めました。過去 2 日間で、X が...
今年も大学入試シーズンがやってきました。私が大学受験をしていた頃には、この言葉が流行っていたのを覚え...
よく訓練された兵士であっても、手ぶらで任務を遂行することはできない。 データ サイエンティストには、...