文章1. 通訳モード言語に対して、その文法表現(言語のルールを定義するために使用される、言語内の文法記述ツール)を与え、その言語で定義された文を解釈するインタープリタを定義します。 定義は抽象的に聞こえるかもしれません。たとえば、一般的な Web サイトで多言語を実装する場合、まず言語の種類を決定し、さまざまな言語のコーパスを事前に設計する必要があります。次に、構成と統一された変数ルールに基づいて、それらをさまざまな言語にマッピングします。 2. 要素のXpathパスXPath は、XML ドキュメント内の要素と属性を移動するために使用されます。 XPath は XML ノードの検索に使用されますが、HTML と XML は構造が似ているため、HTML ドキュメント内のノードの検索にも使用できます。ここでは HTML、つまり HTML ページ内で要素が配置されているパスのみを考慮します。 では、要素の Xpath パスを素早く取得するにはどうすればよいでしょうか。実はとても簡単です。Google デバッグ ツールを開いてみましょう。 要素の XPath パスをコピーするには、[XPath のコピー] を選択します。形式は次のようになります。
要素の Xpath パスを取得するアプリケーション シナリオは多数あります。たとえば、よく使用する Python クローラーは、クローラー フレームワークを使用して、Xpath パスを介してページ内の dom ノードを簡単に制御し、目的のデータと要素を取得できます。たとえば、要素の Xpath パスをバックエンドに送信すると、バックエンドは特定の機能の使用状況とインタラクション データをカウントできます。たとえば、Web サイトを閲覧しているユーザーの熱分布マップ、パス ポートレートなどを分析できます。 3.jsは要素のXpathパスの取得を実装します実装する前に、まず Xpath パスの構造を分析してみましょう。たとえば、ページがある場合、要素 span の構造は次のようになります。
その場合、Xpath パスは次のようになります。
上記からわかるように、右端の要素がターゲット要素であり、左端の最初の要素が最も外側のコンテナーです。このプロセスを完了するには、まず、要素の parentNode を介して現在の要素の親要素を取得し、最上位の位置を見つける必要があります。ただし、前のレイヤーを見つけるたびに、その要素の前の兄弟要素もトラバースする必要があることにも注意する必要があります。この兄弟要素の名前がその後ろの要素の名前と同じ場合は、要素名に 1 を追加します。 最初のステップは、同じレベルの兄弟要素を走査するメソッド getSameLevelName を実装することです。
2 番目のステップは、ドキュメント ツリーをトラバースすることです。
これら 2 つの方法を使用すると、要素の XPath パスを簡単に取得できます。次に例を示します。
これは、開始と同じデータ構造を返します。例: HTML/BODY|HEAD/DIV/SPAN |
>>: 人工知能の時代においても、人間同士の交流は依然として重要である
Google は最近、検索ページの新しい機能である Google ナレッジグラフをリリースしました。...
翻訳者 |陳俊レビュー | Chonglou異常検出は、企業が競合他社よりも先に今後のトレンドを特定...
人間の知能は「マルチモーダル学習」の総体であり、分類の境界を越えてさまざまな情報源や形式からの情報と...
[[205745]] MLlib は、機械学習のエンジニアリング実践を簡素化し、大規模への拡張を容...
浙江省メディアの報道によると、現在浙江大学医学部第二付属病院で治療を受けている72歳の張さんは、意識...
[[382351]] [51CTO.com クイック翻訳] 人々が今日のニーズについて話すとき、彼ら...
[[397576]]システムに閉じ込められた配達員から人々が飽きることのないソーシャルメディアまで、...
古典的なデータマイニングアルゴリズムのトップ 10 は次のとおりです。導入C4.5 は決定木アルゴリ...
自然言語処理は、人工知能研究における中心的な課題の 1 つです。最近、Salesforceによる買収...
MarketsandMarkets は、エッジ AI ソフトウェア市場が 2019 年から 2021...
近年、人工知能の技術と応用は成熟を続けており、人工知能市場の規模は徐々に拡大しています。中国情報通信...
[51CTO.com クイック翻訳] 長い間、Google などのクラウドベンダーは、自社のデータセ...