ビッグモデルが明らかに:ユーザーレビューから金脈を抽出する方法

ビッグモデルが明らかに:ユーザーレビューから金脈を抽出する方法

著者 | 崔昊

レビュー | Chonglou

まとめ

この論文では、大規模な言語モデルと LangChain ライブラリを使用して、ユーザーレビューから重要な情報を分析および抽出する方法について説明します。この記事ではまず、運用チームが直面している課題、つまり大量のユーザーレビューから貴重なデータを取得する方法について説明します。次に、LangChain の抽出チェーンとタグ付けチェーンを使用してこの問題を解決するための具体的な手順とコード実装について説明します。最後に、この記事では、レーダーチャートを使用してユーザーからのフィードバックを視覚化し、ユーザーが製品やサービスについてどのように感じているかをより直感的に理解する方法についても説明します。

導入

このようなシナリオに遭遇したことはありませんか?同社の運用チームは、将来の運用戦略をより適切に策定するために、ユーザーレビューを通じて新製品の市場での受け入れ状況を把握する必要があります。ユーザーレビューをクロールするのは簡単ですがデータを抽出して分析するのは難しい問題です

大規模言語モデルが登場する前は、データ分析は基本的な統計、手動のラベル付け、および単純な機械学習モデルに依存していました。これらの方法は、時間と労力がかかるだけでなく、専門的なツールと複雑なルールの維持も必要です。したがって、大規模なデータや非構造化データを分析しても、効果が限られることがよくあります。ユーザーコメントなどの非構造化データを処理することで、大規模な言語モデルを適用するための幅広い基盤が提供されます。

需要背景

現在のビジネス環境では、ユーザーレビューは製品やサービスの品質を示す重要な指標となっています。運用チームは、製品機能を調整したり、マーケティング戦略を最適化したりするために、この情報を利用することがよくあります。しかし、大量のユーザーレビューから有用な情報を抽出し、その情報を実行可能な戦略に変換する方法は、依然として課題となっています。

分析のために、ユーザーコメントの例をいくつか挙げてみましょう。インターネットからユーザーコメント情報をいくつかクロールしました。情報から、ユーザーがカメラ、画面、パフォーマンスなど、携帯電話製品のいくつかの機能についてコメントしていることがわかります。コメントには、素晴らしい顧客サービス、非常に満足など、ユーザーの個人的な感想も含まれています。

风之子: 我刚入手华为的新款手机,电池续航让我大吃一惊,真是不错!摄像头表现一般,但屏幕颜色非常出色。手感很好,流畅度也很高。外观方面,我觉得挺时尚的。总的来说,我非常满意这台手机,性价比非常高,用起来也很可靠。快递也很快,我一定会推荐给朋友。月光仙子: 这款华为手机手感超好,操作非常流畅,客服也很给力。产品质量优秀,物流速度也快,外观非常吸引我,非常满意。独孤求败: 摄像头是这款华为手机的一大亮点,但电池续航有点短。外观设计一般,品牌信誉也还行。产品质量不错,但可靠性一般,性价比也就一般。剑圣: 用了一段时间这款华为,外观很赞,操作也流畅。品牌也是我信赖的。不过屏幕有点让人失望,功能还算齐全。总体来说,性价比还是不错的。小白龙: 个人不太喜欢这款华为手机的外观,但性价比很高,操作流畅度也不错。摄像头性能强大,但屏幕显示效果一般。个性化需求满足度一般,不确定是否推荐给朋友。雷霆之怒: 这款华为手机是个好东西,电池续航很长,摄像头表现也相当专业。用户体验上,我觉得是非常好的,流畅度高,一定会推荐给别人。夜行者: 这款华为手机的屏幕是亮点,但电池上稍微不如意。物流速度一般,外观也挺好看的,总体满意度一般。魔法少女: 我觉得这款华为手机在功能完整性上做得非常好,而且手感很不错。客服态度也好,就是物流速度一般。品牌信誉很高。暗夜精灵: 实际使用下来,这款华为手机流畅度很好,而且非常可靠。快递速度也非常快,品牌也是值得信赖的。星河战士: 这款华为手机性价比高,电池和屏幕都不错。满足了我所有的个性化需求,外观设计也很有特点,我一定会推荐给其他人。

最も直接的なアイデアは、これらのレビューから製品に関する部分を抽出し、人々が当社の製品をどの程度認識しているかを確認することです。

製品情報を抽出する

目標は製品に対するユーザーの意見を理解することなので、製品から始めます。情報抽出に関しては、LangChainはOpenAIの抽出技術を統合している。 関数を作成し、次のようにチェーンにカプセル化します。

 langchain.chains.openai_functions.extraction.create_extraction_chain(schema: dict, llm: BaseLanguageModel, prompt: Optional[BasePromptTemplate] = None, verbose: bool = False) → Chain Parameters schema – The schema of the entities to extract. llm – The language model to use. prompt – The prompt to use for extraction. verbose – Whether to run in verbose mode. In verbose mode, some intermediate logs will be printed to the console. Defaults to langchain.verbose value. Returns Chain that can be used to extract information from a passage.

このクラスについて簡単に説明します。

create_extraction_chainを通じてチェーンを作成し、情報を抽出します。入力パラメータは次のとおりです。

  • スキーマ:テキストから抽出する必要があるエンティティを記述する辞書です。
  • Llm :言語モデルインスタンス。
  • プロンプト:モデル入力を生成するために使用されるプロンプト テンプレート。
  • Verbose :中間ログをコンソールに出力するかどうか。

戻り値は、テキストから情報を抽出するために使用できる Chain オブジェクトです。

パラメータの中でスキーマは非常に重要です。情報を抽出するための属性値を定義する必要があります。

プログラミング

基本的な考え方を念頭に置き、関数の実装を見つけた後、その関数に基づいてアプリケーションを設計できます。下の図に示すように、ユーザーが要求すると、ユーザーコメント情報がアプリケーションに提供されます。 LangChainでの抽出を利用したアプリケーション 大規模モデルは、ユーザーコメント内の製品情報の説明を抽出するために呼び出されます。抽出プロセス中、抽出する必要がある製品属性を定義するスキーマ ファイルに依存します。

LangChainでの抽出により chainの機能はopenaiのモデルをサポートしているため、GPT -3.5のバージョンを選択します次の質問は、 Sスキーマをどのように定義するかですスキーマは、製品属性情報を定義します。オペレーション ガールがこの要件を挙げる場合、多ければ多いほど良いです。ただし、ユーザーのコメントを分析し、オペレーション ガールと交渉した結果スキーマ属性を次のように定義しました。

 schema = { "properties": { "用户名": {"type": "string"}, "电池": {"type": "string"}, "摄像头": {"type": "string"}, "屏幕": {"type": "string"}, "手感": {"type": "string"}, "流畅度": {"type": "string"}, "外观": {"type": "string"}, "品牌": {"type": "string"} }, "required": ["用户名"] }

主にバッテリー、カメラ、画面、感触、滑らかさ、外観、ブランド。

製品情報抽出: コード実装

ビジネス要件と設計アイデアがあれば、コードの作成を開始できます。表示を容易にするために、ここではユーザーコメント情報を inp 変数に入れます。一般的には、ネットワークからクロールした後、ローカルファイルまたはデータベースに保存する必要がありますそして、それを読んで使ってみてください。ここではプロセスを簡略化し、大規模モデルとLangChain の使い方に焦点を当てています

 from langchain.chat_models import ChatOpenAI from langchain.llms.baidu_qianfan_endpoint import QianfanLLMEndpoint from langchain.chains import create_extraction_chain # Schema schema = { "properties": { "用户名": {"type": "string"}, "电池": {"type": "string"}, "摄像头": {"type": "string"}, "屏幕": {"type": "string"}, "手感": {"type": "string"}, "流畅度": {"type": "string"}, "外观": {"type": "string"}, "品牌": {"type": "string"} }, "required": ["用户名"] } # Input inp = """风之子: 我刚入手华为的新款手机,电池续航让我大吃一惊,真是不错!摄像头表现一般,但屏幕颜色非常出色。手感很好,流畅度也很高。外观方面,我觉得挺时尚的。总的来说,我非常满意这台手机,性价比非常高,用起来也很可靠。快递也很快,我一定会推荐给朋友。月光仙子: 这款华为手机手感超好,操作非常流畅,客服也很给力。产品质量优秀,物流速度也快,外观非常吸引我,非常满意。独孤求败: 摄像头是这款华为手机的一大亮点,但电池续航有点短。外观设计一般,品牌信誉也还行。产品质量不错,但可靠性一般,性价比也就一般。剑圣: 用了一段时间这款华为,外观很赞,操作也流畅。品牌也是我信赖的。不过屏幕有点让人失望,功能还算齐全。总体来说,性价比还是不错的。小白龙: 个人不太喜欢这款华为手机的外观,但性价比很高,操作流畅度也不错。摄像头性能强大,但屏幕显示效果一般。个性化需求满足度一般,不确定是否推荐给朋友。雷霆之怒: 这款华为手机是个好东西,电池续航很长,摄像头表现也相当专业。用户体验上,我觉得是非常好的,流畅度高,一定会推荐给别人。夜行者: 这款华为手机的屏幕是亮点,但电池上稍微不如意。物流速度一般,外观也挺好看的,总体满意度一般。魔法少女: 我觉得这款华为手机在功能完整性上做得非常好,而且手感很不错。客服态度也好,就是物流速度一般。品牌信誉很高。暗夜精灵: 实际使用下来,这款华为手机流畅度很好,而且非常可靠。快递速度也非常快,品牌也是值得信赖的。星河战士: 这款华为手机性价比高,电池和屏幕都不错。满足了我所有的个性化需求,外观设计也很有特点,我一定会推荐给其他人。 """ # Initialize the ChatOpenAI model llm = ChatOpenAI(temperature=0, model="gpt-3.5-turbo") # Create the extraction chain chain = create_extraction_chain(schema, llm) # Run the chain results = chain.run(inp) # 'results' 变量将包含抽取的信息。

コードは複雑ではありません。簡単に説明します。

1. 抽出スキーマを定義する: `schema` という辞書を使用して、ユーザーのコメントから抽出する情報を定義します。これには、ユーザー名、バッテリー、カメラなどの複数のディメンションが含まれます。

2. 自然言語モデルを初期化します。GPT-3.5-turbo モデルのラッパーである `llm` という名前の `ChatOpenAI` オブジェクトを作成します。このオブジェクトは、後続のテキスト生成と理解を担当します。

3. 情報抽出チェーンを作成する: `create_extraction_chain` 関数を、以前に定義した `schema` と初期化されたモデル `llm` と組み合わせて使用​​し、情報抽出チェーンを生成して `chain` 変数として保存します。

4. 情報抽出を実行する: 最後に、`chain.run(inp)` メソッドを使用してこの情報抽出チェーンを実行します。これにより、入力されたユーザーレビュー (`inp` 変数に保存) が分析され、結果が `results` 変数に保存されます。

結果の出力は次のようになります。

 [{'用户名': '风之子', '电池': '续航', '摄像头': '表现', '屏幕': '颜色', '手感': '好', '流畅度': '高', '外观': '时尚', '品牌': '华为'}, {'用户名': '月光仙子', '手感': '好', '流畅度': '流畅', '外观': '吸引', '品牌': '华为'}, {'用户名': '独孤求败', '摄像头': '亮点', '电池': '续航', '外观': '设计', '品牌': '华为'}, {'用户名': '剑圣', '外观': '赞', '操作': '流畅', '品牌': '华为'}, {'用户名': '小白龙', '外观': '不喜欢', '性价比': '高', '操作': '流畅', '摄像头': '强大', '屏幕': '显示效果', '个性化需求': '满足'}, {'用户名': '雷霆之怒', '电池': '续航', '摄像头': '专业', '用户体验': '好', '流畅度': '高'}, {'用户名': '夜行者', '屏幕': '亮点', '电池': '不如意', '物流速度': '一般', '外观': '好看'}, {'用户名': '魔法少女', '功能完整性': '好', '手感': '不错', '客服态度': '好', '物流速度': '一般', '品牌信誉': '高'}, {'用户名': '暗夜精灵', '流畅度': '好', '可靠性': '可靠', '快递速度': '快', '品牌': '值得信赖'}, {'用户名': '星河战士', '性价比': '高', '电池': '不错', '屏幕': '不错', '个性化需求': '满足', '外观设计': '特点'}]

見て!データ分析は4つの簡単なステップで完了します。オペレーションの女の子はそれを見て拍手しましたが、よく見るとユーザーの感情は出力に反映されていないようです。

要件の変更

商品情報を取得できるのはもちろん良いのですが、ユーザーの感情情報も抽出できれば完璧です。オペレーションガールにニーズがあるのだから、プログラマーには方法がある。

実際、ユーザーの感情は製品やサービスに向けられています。他のシステムのユーザーサービス満足度表を包括的に「借用」することで、満足度、製品の品質、費用対効果、ユーザーエクスペリエンス、カスタマーサービス、推奨意欲、機能の完全性、配信速度、信頼性、需要満足の実現可能性などの側面に注意を払う必要があるという結論に達しました。これらのサービスは通常、 非常に満足 、「満足」、「平均的」などのように評価され、多くのレベルに分かれています。この機能は抽出のようです 実装できないが、問題ではない。プログラマーには方法がある。langchainapiを検索して、タグ付けを見つけた。 チェーンクラス。

 langchain.chains.openai_functions.tagging.create_tagging_chain(schema: dict, llm: BaseLanguageModel, prompt: Optional[ChatPromptTemplate] = None, **kwargs: Any) → Chain[source] Creates a chain that extracts information from a passage based on a schema. Parameters schema – The schema of the entities to extract. llm – The language model to use. Returns Chain (LLMChain) that can be used to extract information from a passage.

コードは依然として同じ古いルーチンです。抽出するデータのタイプを大きなモデルに伝えるために、shcema を定義する必要があります。

プログラムの再設計

ニーズを把握し、それをテクノロジーで実現できるようになったので、次はデザインを少し調整します。下の図に示すように、抽出 チェーンコンポーネントと同様に、タグ付けを追加しました チェーンコンポーネントは互いに並列関係にあります。どちらも、ユーザーから渡されたユーザーコメント情報を受け入れ、スキーマで定義された属性を使用してビッグモデルを呼び出して情報を抽出する必要があります。

感情情報抽出: コード実装

プログラミングは比較的簡単、プログラマーは勝利に一歩近づきます。すぐにコーディングを始めましょう。今日は仕事が終わった後にデートがあるんです!

 from langchain.chat_models import ChatOpenAI from langchain.prompts import ChatPromptTemplate from langchain.chains import create_tagging_chain, create_tagging_chain_pydantic # 定义schema,用于描述我们想要标记的属性schema = { "properties": { "满意度": { "type": "string", "enum": ["非常满意", "满意", "一般", "不满意", "非常不满意"], "description": "描述对产品或服务的整体满意度" }, "产品质量": { "type": "string", "enum": ["优秀", "良好", "一般", "差劲"], "description": "描述产品的质量" }, "性价比": { "type": "string", "enum": ["非常高", "高", "一般", "低"], "description": "描述产品的性价比" }, "用户体验": { "type": "string", "enum": ["非常好", "好", "一般", "差"], "description": "描述用户体验" }, "客户服务": { "type": "string", "enum": ["非常满意", "满意", "一般", "不满意"], "description": "描述客户服务" }, "推荐意愿": { "type": "string", "enum": ["一定会", "可能会", "不确定", "不会"], "description": "描述推荐意愿" }, "功能完整性": { "type": "string", "enum": ["非常好", "好", "一般", "差"], "description": "描述功能完整性" }, "交付速度": { "type": "string", "enum": ["非常快", "快", "一般", "慢"], "description": "描述交付速度" }, "可靠性": { "type": "string", "enum": ["非常可靠", "可靠", "一般", "不可靠"], "description": "描述可靠性" }, "个性化需求满足度": { "type": "string", "enum": ["非常满意", "满意", "一般", "不满意"], "description": "描述个性化需求满足度" } }, "required": ["满意度", "产品质量", "性价比"] # 示例中一些必须要有的属性} # 初始化LLM模型llm = ChatOpenAI(temperature=0, model="gpt-3.5-turbo") # 创建标记链chain = create_tagging_chain(schema, llm) # 分割输入文本以获取单个用户的评论user_comments = inp.strip().split("\n") # 创建一个空字典用于保存每个用户的标记结果tagged_results = {} # 遍历每个用户的评论for comment in user_comments: user, user_comment = comment.split(": ", 1) # 执行标记操作result = chain.run(user_comment) # 将标记结果保存到字典中tagged_results[user] = result # 遍历tagged_results字典for user, feedback in tagged_results.items(): # 格式化反馈内容为一个字符串feedback_str = ", ".join(f"{key}: {value}" for key, value in feedback.items()) # 打印用户名和反馈print(f"用户名:{user},反馈:{feedback_str}")

コードはまだおなじみの式であり、その人がすでにそれに精通していることは明らかです。

1. 依存ライブラリをインポートする: `ChatOpenAI`、`ChatPromptTemplate`、`create_tagging_chain`、`create_tagging_chain_pydantic` などの必要なライブラリと関数をインポートします。

2. タグ付けスキーマを定義する: `schema` 変数を使用して、満足度、製品の品質、費用対効果などの複数の次元を含む、ユーザーレビューからタグ付けする必要がある情報を定義します。

3. 自然言語モデルを初期化する:後続のテキスト生成および理解タスク用に、`llm` という名前の `ChatOpenAI` オブジェクトを作成します。

4. タグ付けチェーンを作成する: `create_tagging_chain` 関数と、以前に定義した `schema` および初期化した `llm` オブジェクトを使用して、情報タグ付けチェーンが生成され、`chain` 変数として保存されます。

5. ユーザーのコメントを取得する: `inp` 変数から 1 人のユーザーのコメントを抽出し、`user_comments` リストに保存します。

6. 結果ストレージを初期化する:各ユーザーのタグ付けされた結果を保存するために、`tagged_results` という名前の空の辞書を作成します。

7. ユーザーのコメントをループする:各ユーザーのコメントを反復処理し、`chain.run()` メソッドを使用してタグ付けチェーンを実行し、タグ付けの結果を `tagged_results` 辞書に保存します。

8. タグ付け結果を出力する:最後に、`tagged_results` 辞書を走査し、各ユーザーのタグ付け結果を文字列にフォーマットして出力します。

出力は次のようになります

用户名:风之子,反馈:满意度: 非常满意, 性价比: 非常高, 可靠性: 很可靠, 交付速度: 很快, 推荐意愿: 一定会用户名:月光仙子,反馈:满意度: 非常满意, 产品质量: 优秀, 客户服务: 满意, 交付速度: 快用户名:独孤求败,反馈:产品质量: 一般, 可靠性: 一般, 性价比: 一般用户名:剑圣,反馈:满意度: 一般, 产品质量: 一般, 性价比: 不错, 功能完整性: 好用户名:小白龙,反馈:性价比: 高, 个性化需求满足度: 一般, 推荐意愿: 不确定用户名:雷霆之怒,反馈:用户体验: 非常好, 推荐意愿: 一定会用户名:夜行者,反馈:满意度: 一般, 产品质量: 一般, 性价比: 一般用户名:魔法少女,反馈:功能完整性: 非常好, 客户服务: 好, 交付速度: 一般, 可靠性: 一般用户名:暗夜精灵,反馈:可靠性: 非常可靠, 交付速度: 非常快用户名:星河战士,反馈:性价比: 高, 个性化需求满足度: 非常满意, 推荐意愿: 一定会

各ユーザーの製品やサービスに対する姿勢はコンテンツからわかりますが、オペレーション担当者は、ユーザーを区別するために統計を実施してほしいと要望しました。たとえば、非常に満足しているユーザーの割合、製品の品質が優れていると感じているユーザーの割合などです。

これは私にとっては問題ではないので、コードの追加を続けます。

 # 初始化计数器count_very_satisfied = 0 count_excellent_quality = 0 # 计算总用户数total_users = len(tagged_results) # 遍历tagged_results字典for user, feedback in tagged_results.items(): # 检查满意度是否为“非常满意” if feedback.get("满意度") == "非常满意": count_very_satisfied += 1 # 检查产品质量是否为“优秀” if feedback.get("产品质量") == "优秀": count_excellent_quality += 1 # 计算百分比percent_very_satisfied = (count_very_satisfied / total_users) * 100 percent_excellent_quality = (count_excellent_quality / total_users) * 100 # 打印百分比print(f"非常满意的用户百分比: {percent_very_satisfied}%") print(f"产品质量优秀的用户百分比: {percent_excellent_quality}%")

出力は次のようになります。

非常满意的用户百分比: 20.0%产品质量优秀的用户百分比: 10.0%

要件が簡単に満たされたので、時間通りに帰宅できそうです。

レビューデータのレーダーチャートを生成する

オペレーション担当の女性は、プログラマーが機能を非常に早く完成させたのを見て、難しくないと感じ、ユーザーフィードバックデータをレーダーチャート形式で表示できるかどうか尋ねました。プログラマーは突然、「喜びから悲しみに変わった」。心の中で千頭身の馬が疾走している。しかし、よく考えてみれば、レーダーチャートの異なる頂点はそれぞれ異なる感情の次元を表していることに気づきました。各ユーザーのフィードバックにはレベルに応じてスコアが与えられ、スコアを平均した値は、特定の次元の最終的な表示値を表すことができます。この考えはすぐに意味を成し、次のようなコードが生まれました。

 import pandas as pd import matplotlib.pyplot as plt import numpy as np from matplotlib.font_manager import FontProperties # 转换为DataFrame df = pd.DataFrame.from_dict(tagged_results, orient='index') # 定义枚举到数值的映射mapping = { "非常满意": 5, "满意": 4, "一般": 3, "不满意": 2, "非常不满意": 1, "优秀": 4, "良好": 3, "一般": 2, "差劲": 1, "非常高": 4, "高": 3, "一般": 2, "低": 1, "非常好": 4, "好": 3, "一般": 2, "差": 1, "非常满意": 4, "满意": 3, "一般": 2, "不满意": 1, "一定会": 4, "可能会": 3, "不确定": 2, "不会": 1, "非常快": 4, "快": 3, "一般": 2, "慢": 1, "非常可靠": 4, "可靠": 3, "一般": 2, "不可靠": 1 } # 将标签转换为数值for column in df.columns: df[column] = df[column].map(mapping) # 计算每个属性(列)的平均得分averages = df.mean() # 准备绘制雷达图attributes = list(df.columns) num_vars = len(attributes) # 计算角度angles = np.linspace(0, 2 * np.pi, num_vars, endpoint=False).tolist() angles += angles[:1] # 使雷达图封闭# 平均得分averages = averages.tolist() + averages.tolist()[:1] # 设置字体font = FontProperties(fname='SimHei.ttf') # 绘制雷达图plt.figure(figsize=(8, 8)) ax = plt.subplot(polar=True) # 画线ax.fill(angles, averages, color='blue', alpha=0.25) ax.set_xticks(angles[:-1]) ax.set_xticklabels(attributes, fontproperties=font) # 添加标题plt.title('标记结果的雷达图', size=20, color='blue', y=1.1, fontproperties=font) plt.show()

コードは単純ですが、誰もが理解できないかもしれないと心配したので、説明をしました。

1. 依存ライブラリをインポートします: Pandas、Matplotlib、NumPy などのライブラリ、およびいくつかのフォント設定ツール。

2. 辞書から DataFrame へ: `pd.DataFrame.from_dict()` を使用して、`tagged_results` 辞書を Pandas DataFrame に変換します。これにより、後で処理しやすくなります。

3. ラベルから値へのマッピングを定義する:ユーザー フィードバック ラベル (「非常に満足」、「満足」など) を値にマッピングするための「mapping」という名前の辞書を作成します。

4. ラベルを値に変換する: DataFrame の各列を反復処理し、`map()` 関数を使用してすべてのラベルを対応する値に変換します。

5. 平均スコアを計算する: DataFrame の各列 (つまり、各属性) の平均スコアを計算し、それを `averages` 変数に保存します。

6. レーダー チャートの準備:レーダー チャートの頂点ラベル (つまり `attributes`) を設定し、各頂点に対応する角度を計算します。

7. 角度と平均スコア:各属性に対応する角度を計算し、レーダー チャートが閉じた形状であることを確認します。同時に、レーダー チャートが閉じられるように `averages` リストが操作されます。

8. フォントを設定する: `FontProperties` を使用してフォントを設定し、中国語が正しく表示されるようにします。

9. レーダー チャートを描画する: Matplotlib の `subplot` およびその他の関数を使用してレーダー チャートを描画します。画像のサイズ、色、透明度などを設定します。

10. タイトルとラベルを設定する:最後に、タイトルを追加し、各軸のラベルを設定します。

レーダーチャートに結果が表示されます。

要約する

大規模言語モデルとLangChainライブラリを使用することで、ユーザーレビューから製品関連情報を効率的に抽出できるだけでなく、ユーザーの感情的なフィードバックも取得できます。この完全なソリューションにより、従来のデータ分析プロセスが大幅に簡素化され、手動でのラベル付けや複雑なルールのメンテナンスの必要性が軽減されます。さらにデータを視覚化することで、運用チームはユーザーのニーズや感情をより簡単に理解できるようになり、製品の機能やマーケティング戦略をより正確に調整できるようになります。これにより、データ分析の精度が向上するだけでなく、作業効率も大幅に向上します。

著者について

51CTO コミュニティ エディター兼シニア アーキテクトの Cui Hao 氏は、ソフトウェア開発とアーキテクチャで 18 年の経験があり、分散アーキテクチャでは 10 年の経験があります。



<<:  Microsoft が 8 つの Nvidia H100 GPU を搭載した Azure ND H100 v5 仮想マシンをリリース

>>:  GPT-4V の医師免許試験の点数は、ほとんどの医学生よりも高いです。AI がクリニックに参加するまでにはどれくらい時間がかかりますか?

ブログ    
ブログ    
ブログ    

推薦する

マイクロソフトの新特許公開:機械学習で「赤面」するリアルなアバターを作成

11月16日、現地時間の火曜日、米国特許商標庁のウェブサイトでマイクロソフトの新しい特許が公開された...

顔認識だけでなく、「心を読む」こともできます。このような AI は好きですか?

世界はとてもカラフルです。この美しい地球に住むすべての人は、理解されることを望み、注目されることを待...

「半導体第一の都市」上海、ついに半導体製造再開の夜明けを迎える

上海市経済情報化委員会は4月16日、「上海市工業企業の業務・生産再開に関する防疫対策ガイドライン(第...

アリババがコアテクノロジーを公開:推論性能が2位より5倍速く、4つの世界選手権で優勝した方法

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google がディープラーニング ライブラリ TensorFlow Fold をリリース、動的計算グラフをサポート

ほとんどの機械学習プロセスでは、トレーニングと推論に使用するデータを前処理する必要があります。前処理...

最大速度アップは20億倍! AIが物理シミュレーションエンジンに革命を起こす

[[422090]]オックスフォード大学の研究によると、機械学習モデルは従来の物理ソルバーに比べて物...

異常分析のための技術的ソリューション - 異常帰属の指標分析

著者 | イー・リアン1. はじめに唯一不変なのは変化です。変化を受け入れる前に、調査し、属性を特定...

MetaのAIディレクターは、AIスーパーインテリジェンスがすぐに実現するとは考えておらず、量子コンピューティングにも懐疑的だ。

メタの主任科学者であり、ディープラーニングの先駆者であるヤン・ルカン氏は、現在のAIシステムが、山の...

国連チーフAIアドバイザーとの独占インタビュー:AIは完璧だと期待しているが、決して完璧ではない

[[384962]]ビッグデータダイジェスト制作出典: informationweek編纂者:張大毓...

...

CMU と Adob​​e が協力: GAN モデルは事前トレーニングの時代を先導し、トレーニング サンプルのわずか 1% しか必要としません

事前トレーニングの時代に入ってから、視覚認識モデルのパフォーマンスは急速に向上しましたが、生成的敵対...

強化学習 AI は 1 対 5 の戦いに役立ちますか? MITの新研究:AIは人間にとって最高のチームメイトではない

[[433351]]強化学習AIは囲碁、スタークラフト、王者栄耀などのゲームで絶対的な優位性を持って...

3.15を利用して、あなたの周りの偽の人工知能を数えましょう

他のインターネットの概念と同様に、AI は人気が出ると数え切れないほどの支持者を獲得しました。彼らは...

人工知能が科学を変える4つの方法

新たな医学研究から宇宙の新たな理解まで、新しいモデルは科学界に衝撃を与えました。世界中のほとんどの人...