0 レビュー
1 回答
PHP Curl(またはそのようなもの)は、すべてのHTMLタグではなく、レンダリングされた結果のみを取得します
私は、PHPを使用してWebページで人が目にするすべての単語を取り込む方法を探していました。 curlまたはfilegetcontentsを使用できることはわかっていますが、すべてのHTMLが返されるので、レンダリングされたテキストだけが必要です(テキストや画像などのフォーマットではありません)。誰かが私を正しい方向に向けることができますか?
わからない
0
レビュー
答え :
解決策:
curlはhtmlプロセッサではありません。 LynxはHTMLプロセッサですlynx -dump Https://stackoverflow.com
デフォルトのドキュメントまたはコマンドラインで指定されたフォーマットされた出力を標準出力にダンプします。インタラクティブモードとは異なり、すべてのドキュメントが処理されます。
proc_open()関数を使用してphpでLinux / Windowsコマンドを実行できます。マニュアルへのリンク: php proc_open
わからない
同様の質問
私たちのウェブサイトで同様の質問で答えを見つけてください。