Como o coletor de trem de alta velocidade coleta a paginação/clique JS para carregar o conteúdo da lista ajax

A coleta convencional de artigos é simples, mas é difícil para os coletores de trens de alta velocidade coletarem paginação JS e fluxo em cascata.Clicar no JavaScript carregado e no menu suspenso carregando uma página de lista semelhante ao Ajax faz com que muitos novatos não consigam iniciar.

Chen WeiliangO blog compartilhará aqui como o coletor de trens de alta velocidade coleta a paginação JS e clica para carregar a lista de ajax.

O coletor de trem coleta a URL da página de conteúdo e a grava em JS

Antes de tudo, a página de destino precisa capturar o pacote, basta pegar os dados json do site, o site mais difícil precisa do método post, e também precisa preencher cookies, valores aleatórios, comorua cogumeloe muitos mais……

  • É mais simples analisar a paginação JS sem capturar pacotes, como o URL na segunda página dos resultados de pesquisa de vídeo da Tencent.cur=2 
  • os números por trás2, é definir "Iniciar assistente de adição de URL" → "URL de lote" → "Formato de endereço"[parâmetro de endereço]

Aqui está um simples coletor de locomotivas como obter o conteúdo das chamadas JS, tomando como exemplo a rede de cascas de frutas.  

Como o coletor de locomotivas ferroviárias de alta velocidade obtém o conteúdo das chamadas JS?

A primeira coisa que você precisa usar é o navegador Chrome ▼

1. Primeiro clique na página de destinoF12Ctrl+Shift+CAbra o elemento inspecionar e clique na guia Rede ▼

Como o coletor de trem de alta velocidade coleta a paginação/clique JS para carregar o conteúdo da lista ajax

2. Clique no botão XHR para acionar o carregamento do ajax na página e o navegador monitorará a execução e as alterações dos dados da página▼

2. Clique no botão XHR para acionar o carregamento do ajax na página, e o navegador monitorará a execução e as alterações dos dados da página.

A caixa vermelha é o endereço dos dados capturados ▲

3. Clique no endereço de dados e as informações detalhadas aparecerão à direita.Preste atenção à lei do url do endereço de solicitação.Por exemplo, na figura abaixo, há carimbos de data e hora e números de página ▼

3. Clique no endereço de dados e as informações detalhadas aparecerão à direita.Preste atenção à lei do URL do endereço de solicitação.Por exemplo, na imagem abaixo, há carimbos de data e hora e números de página.

4. Adicione os seguintes endereços capturados no coletor de trem e defina as regras de endereço e, em seguida, as configurações regulares do coletor de trem▼

4. Adicione o endereço capturado da seguinte forma no coletor de trem e defina as regras de endereço e, em seguida, defina a 5ª folha para o coletor de trem regular

Hope Chen Weiliang Blog ( https://www.chenweiliang.com/ ) compartilhou "Como o coletor de trem de alta velocidade coleta a paginação/clique JS para carregar o conteúdo da lista ajax", o que é útil para você.

Bem-vindo a compartilhar o link deste artigo:https://www.chenweiliang.com/cwl-1906.html

Bem-vindo ao canal Telegram do blog de Chen Weiliang para receber as últimas atualizações!

🔔 Seja o primeiro a obter o valioso "Guia de uso da ferramenta de IA de marketing de conteúdo ChatGPT" no diretório superior do canal! 🌟
📚 Este guia contém um valor enorme, 🌟Esta é uma oportunidade rara, não perca! ⏰⌛💨
Compartilhe e curta se gostar!
Seus compartilhamentos e curtidas são nossa motivação contínua!

 

发表 评论

Seu endereço de e-mail não será publicado. 必填 项 已 用 * 标注

滚动 到 顶部