高鐵火車採集器如何採集JS分頁/點擊加載ajax列表內容

常規的文章採集簡單,但是高鐵(火車)採集器採集JS分頁、瀑布流比較困難,點擊加載的JavaScript,下拉加載類似ajax的列表頁面,讓很多新手無法下手。

陳溈亮博客會在此分享高鐵火車採集器如何採集JS分頁、點擊加載ajax的列表。

火車採集器採集內容頁網址寫在JS中

首先目標頁面需要抓包,簡單的從網站抓取json數據,比較難的網站需要post方法,還需要填cookies、隨機值、例如蘑菇街等等…

  • 更簡單不用抓包分析JS分頁的,比如騰訊視頻搜索結果第2頁網址裡的cur=2 
  • 後面的數字2,就是設置“起始網址添加嚮導” →“批量網址”→“地址格式”的[地址參數]

這裡就來一個簡單的火車頭採集器如何獲取JS調用的內容,以果殼網為例。  

高鐵火車頭採集器如何獲取JS調用的內容?

首先需要使用的是Chrome瀏覽器 ▼

1、首先在目標頁面按F12Ctrl+Shift+C打開檢查元素,然後點擊Network選項卡 ▼

高鐵火車採集器如何採集JS分頁/點擊加載ajax列表內容

2、點擊XHR按鈕,在頁面上觸發ajax加載,瀏覽器會監聽頁面數據的執行和變化▼

2、點擊XHR按鈕,在頁面上觸發ajax加載,瀏覽器會監聽頁面數據的執行和變化第3張

紅框是抓取數據的地址 ▲

3、點擊數據地址,右側出現詳細信息。注意請求地址url的規律。比如下圖中,有時間戳和頁碼 ▼

3、點擊數據地址,右側出現詳細信息。注意請求地址url的規律。比如下圖中,有時間戳和頁碼 第4張

4、在火車採集器中添加如下捕獲的地址,並設置地址規則,然後是常規火車採集器設置▼

4、在火車採集器中添加如下捕獲的地址,並設置地址規則,然後是常規火車採集器設置第5張

希望陳溈亮博客( https://www.chenweiliang.com/ ) 分享的《高鐵火車採集器如何採集JS分頁/點擊加載ajax列表內容》,對您有幫助。

歡迎分享本文鏈接:https://www.chenweiliang.com/cwl-1906.html

歡迎加入陳溈亮博客的Telegram 頻道,獲取最新更新!

🔔 率先在頻道置頂目錄獲取寶貴的《ChatGPT 內容行銷AI 工具使用指南》! 🌟
📚 這份指南蘊含價值巨大,🌟難逢的機遇,切勿錯失良機! ⏰⌛💨
喜歡就分享和按贊!
您的分享和按贊,是我們持續的動力!

 

發表評論

您的電子郵箱地址不會被公開。 必填項已用 * 標註

滾動到頂部