說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
一個大型的資訊網站在發表文章時,如果是一條條的文章網上發,這不僅浪費時間,效率還不高,這時為了提高更新網站的效率,就出現了火車頭采集器,可是火車頭采集規則怎么寫呢?接下來就由小編來詳細的介紹吧。
火車頭采集規則寫法介紹
步驟一:新建一個文章采集節點
登錄后臺,依次點擊 采集>>采集節點管理>>增加新節點>>選擇普通文章>>確定
步驟二 :填寫采集列表規則
1.節點名稱:隨便(注意你要能分清哦,因為節點多了的話,有可能會搞得自己混亂)
2.目標頁面編碼:看目標頁面的編碼
3.匹配網址:去到采集目標列表頁面,查看它的列表規則!比如說很多網站的列表的第一面跟其它內頁是有很大的差別的,所以我一般不采集目標列表的第一頁!
最好是從第二頁開始(雖然可以找出第一頁,但很多的網站是根本沒第一頁的,所以,這里就不說怎么找第一頁了)
4.區域結束的HTML:在采集目標列表頁打開源代碼!在要采集的文章標題后面的附近找一段在本頁是唯一并且其它要采集的的頁面也是唯一的html標簽!
寫好了,點擊保存信息并進入下一步!如果寫正確了規則的話,那這些就會出現一個有內容的網址獲取規則測試
再按下一步!進入填寫采集內容規則
步驟三:采集內容規則
1.文章標題:在文章標題前后找兩個標簽,能識別出標題的!
2.文章內容:在文章內容前后找兩個標簽,能識別出內容的!我采集的網站的文章內容前后唯一標簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫成<div class=”content”>[內容]<ul class=”page clearfix”>!
其它的功能,也不用管!這里只分享怎么能采到文章!然后,點擊保存配置并預覽,如果前面的列表規則跟內容規則都寫對了的話,那現在就會預覽到內容了!
點擊僅保存,如果你要馬上采集的話,也可以點擊隔壁的保存并馬上采集!
火車頭采集規則導入方法
1.導入規則方法一
右鍵點擊剛才新建的分組,選擇“導入任務至該分組”(記住:不是“導入分組規則”),在彈出的對話框中選擇已經采集規則文件(后綴為.ljobx)。
2.導入規則方法二
也可以選擇剛才新建的分組,然后依次點擊菜單“分組”->“導入任務至該分組” 在彈出的對話框中選擇已經采集規則文件(后綴為.ljobx)。
3.導入分組規則
如果你手上的規則文件后綴名為“.lgrp”,那么你需要通過菜單或右鍵快捷菜單選擇“導入分組規則”,而不是“導入任務至該分組”。
好了,有關火車頭采集規則寫法就介紹到這里了,當然想要掌握這個寫法的可不是馬上就能完成的事情,是需要在不斷的實踐中去掌握和運用的,所以想要掌握格則寫法的,現在就開始練習吧。如果想了解更多的內容,歡迎關注我們文軍營銷的官網。
推薦閱讀
火車頭采集規則寫法介紹 火車頭采集規則如何導入? | 文軍營銷點擊僅保存,如果你要馬上采集的話,也可以點擊隔壁的保存并馬上采集! 火車頭采集規則導入方法 1.導入規則方法一 右鍵點擊剛才新建的分組,選擇“導入任務至該分組”(記住:不是“導入分組規則”),在彈出的對話框中選擇已經采集規則文件(后綴為.ljobx)。 2.導入規則方法二 也可以選擇剛才新建的分組,然后依次點擊菜單“...火車頭采集器教程步驟 火車頭采集器使用教程介紹 | 文軍營銷1點擊右下角的“網址采集測試”, 2測試后,如果網址是這么顯示出來的,那就是采集成功了。點擊其中一個網址左邊的“+”符號,可以看到該欄目頁面采集到的內容。 火車頭采集器教程之數據采集步驟 火車采集器采集數據是分成兩個步驟的,一是采集數據,二是發布數據。這兩個過程是可以分開的。 1、采集數據,這個包括采集...火車頭采集器 火車頭采集器是什么 | 文軍營銷這種方式可以將采集的數據發布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式。 方式三:導入到自定義數據庫 這種方式可以通過采集器連接到其他數據庫從而將采集的數據從軟件內置數據庫中導入到其他的數據庫中,采集器支持連接Mysql、Access、Oracle、MSsql數據庫。 方式四:保存為本地Sql文件(Insert語句) ...火車頭采集器視頻教程大全 火車頭采集器v9使用視頻教程 | 文軍營銷點擊右下角的“網址采集測試”,如圖: 2 測試后,如果網址是這么顯示出來的,那就是采集成功了。點擊其中一個網址左邊的“+”符號 ,可以看到該欄目頁面采集到的內容,如圖: 3 好了,以上是火車頭采集器,采集欄目頁面寫法規則。采集內容文章頁面的寫法規則,我在下 ...火車頭采集器 火車頭采集器是什么 | 文軍營銷火車頭采集器的四種保存方法 方式一:Web在線發布到網站 這種發布方式類似于在網站后臺手工添加數據一樣。采集器將數據發送給網站后臺程序,由網站后臺程序去處理數據通常后臺程序講數據存入網站數據庫中。 方式二:保存為本地文件 這種方式可以將采集的數據發布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式...
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732