亚洲中文久久精品无码,国产亚洲精品久久久久蜜臀,无码人妻少妇伦在线电影,国产成人av一区二区三区

網(wǎng)址導(dǎo)航網(wǎng)站采集發(fā)布教程

簡(jiǎn)數(shù)采集器可自動(dòng)采集導(dǎo)航網(wǎng)站的網(wǎng)址鏈接(如AI導(dǎo)航站、軟件資源站等),并發(fā)布到指定網(wǎng)站。

導(dǎo)航站網(wǎng)址采集發(fā)布基本流程:定位網(wǎng)頁(yè)中的網(wǎng)址位置 -> 配置網(wǎng)址采集規(guī)則 -> 采集發(fā)布網(wǎng)站。

1. 定位網(wǎng)頁(yè)中的鏈接地址

查找要采集的鏈接地址在網(wǎng)頁(yè)中的具體位置,并使用XPath語(yǔ)法定位提取。查找鏈接方法主要有兩種:右鍵快速查找和源代碼精準(zhǔn)查找。

1)右鍵快速查找

在瀏覽器打開(kāi)目標(biāo)頁(yè)面,對(duì)包含網(wǎng)址的區(qū)域,鼠標(biāo)右鍵選擇 "檢查" ,可快速查看對(duì)應(yīng)的HTML代碼。


當(dāng)網(wǎng)址為<a>標(biāo)簽的href屬性時(shí),可直接使用簡(jiǎn)數(shù)【獲取網(wǎng)址】功能一鍵提取。

若代碼中未發(fā)現(xiàn)目標(biāo)網(wǎng)址(如上圖示例中的 "鏈接直達(dá)"),建議打開(kāi)網(wǎng)頁(yè)完整源代碼進(jìn)行搜索。


2)源代碼精準(zhǔn)查找

在網(wǎng)頁(yè)源代碼中查找目標(biāo)網(wǎng)址,是更全面且準(zhǔn)確的方法。

I. 查看源代碼

瀏覽器打開(kāi)目標(biāo)頁(yè)面,在網(wǎng)頁(yè)空白處(無(wú)文本與圖片),鼠標(biāo)右鍵選擇 "查看網(wǎng)頁(yè)源代碼" 。

源代碼查看方式二:在瀏覽器地址欄輸入 view-source:https://www.網(wǎng)站.com/


II. 精準(zhǔn)搜索

在網(wǎng)頁(yè)源代碼頁(yè)面,快捷鍵 Ctrl + F 打開(kāi)搜索框,輸入目標(biāo)網(wǎng)址(如 trae.com),可精準(zhǔn)定位所有匹配網(wǎng)址的具體位置。


如示例圖,目標(biāo)網(wǎng)址在 class="btn btn-arrow qr-img" 類的標(biāo)簽 title 屬性值中。


2. 配置網(wǎng)址采集規(guī)則

網(wǎng)址采集配置方法主要有兩種:提取標(biāo)簽屬性值(如<a>標(biāo)簽的href,data-url屬性),和抓取跳轉(zhuǎn)子頁(yè)面的內(nèi)容。

1)提取標(biāo)簽屬性中的網(wǎng)址

打開(kāi)簡(jiǎn)數(shù)詳情提取器,填寫(xiě)對(duì)應(yīng)字段Xpath值(沿用前面示例,值應(yīng)為//*[@class="btn btn-arrow qr-img"]) -> 字段數(shù)據(jù)處理 -> 高級(jí)提取 -> 提取值類型選擇【節(jié)點(diǎn)屬性】 -> 屬性名填寫(xiě)title。

補(bǔ)充說(shuō)明:>>> Xpath語(yǔ)法使用教程(重點(diǎn)為第4和5節(jié))



若屬性值里除了目標(biāo)網(wǎng)址,還包含多余內(nèi)容,可使用替換刪除或正則截取功能只保留網(wǎng)址。

示例獲取屬性值為 https://www.網(wǎng)址.com/qr/?text=https://www.trae.com.cn/?utm_source=advertising&#038;utm_medium=....

此例建議使用正則截取功能提取網(wǎng)址:在字段數(shù)據(jù)處理【常用截取|提取】,正則捕獲組處填寫(xiě)相應(yīng)的正則表達(dá)式:

text=(.+?)\?

說(shuō)明:此表達(dá)式是截取text=和?字符之間的內(nèi)容,(.+?)為固定語(yǔ)法,問(wèn)號(hào)字符需加反斜杠轉(zhuǎn)義。


完成提取標(biāo)簽屬性中的網(wǎng)址配置后,發(fā)送操作請(qǐng)參見(jiàn)下方【第3章 發(fā)送導(dǎo)航網(wǎng)站】


2)采集跳轉(zhuǎn)頁(yè)面中的網(wǎng)址

如果目標(biāo)網(wǎng)址未直接出現(xiàn)在網(wǎng)頁(yè)源代碼中,需通過(guò)點(diǎn)擊a標(biāo)簽跳轉(zhuǎn)至子頁(yè)面后獲取,可使用內(nèi)容多分頁(yè)功能實(shí)現(xiàn)抓取。操作示例如下:


I)跳轉(zhuǎn)鏈接采集

在簡(jiǎn)數(shù)詳情提取器,點(diǎn)擊對(duì)應(yīng)字段  -> 勾選【該字段內(nèi)容有多分頁(yè)】 -> 點(diǎn)擊分頁(yè)采集開(kāi)關(guān) -> 【分頁(yè)區(qū)域Xpath】欄填寫(xiě)對(duì)應(yīng)詳情頁(yè)跳轉(zhuǎn)鏈接a標(biāo)簽的Xpath值。(例子為//*[@class="site-go-url"]/a[1])

補(bǔ)充說(shuō)明:>>> Xpath語(yǔ)法使用教程(重點(diǎn)為第4和5節(jié))。



II)跳轉(zhuǎn)頁(yè)面采集配置

在瀏覽器打開(kāi)跳轉(zhuǎn)子頁(yè)面,查找目標(biāo)網(wǎng)址。


因跳轉(zhuǎn)頁(yè)面停留時(shí)間過(guò)短,建議通過(guò)查找網(wǎng)頁(yè)源代碼定位目標(biāo)網(wǎng)址,在瀏覽器地址欄直接輸入:

view-source:https://網(wǎng)站.com/go/?url=aHR0c....



在簡(jiǎn)數(shù)詳情提取器,【當(dāng)前字段Xpath】填寫(xiě)對(duì)應(yīng)目標(biāo)網(wǎng)址的Xpath值(例子為//*[@class="loading-btn"]) -> 字段數(shù)據(jù)處理 -> 高級(jí)提取 -> 提取值類型選擇【節(jié)點(diǎn)屬性】 -> 屬性名填寫(xiě)href -> 保存,測(cè)試采集查看結(jié)果。



III)采集結(jié)果


3. 發(fā)送導(dǎo)航網(wǎng)站

簡(jiǎn)數(shù)采集器支持自動(dòng)發(fā)送網(wǎng)址數(shù)據(jù)到導(dǎo)航網(wǎng)站,比如Wordpress的OneNav 主題(一為主題)。

1)安裝發(fā)布插件

下載并安裝 Wordpress采集發(fā)送插件(兼容OneNav主題)。

2)添加并配置發(fā)送目標(biāo)

在【發(fā)送目標(biāo)管理】頁(yè)面,添加相應(yīng)CMS系統(tǒng)的發(fā)送目標(biāo),例如添加發(fā)送目標(biāo)WordPress。



第二步配置映射字段處,"post類型" 選擇sites -> 第三步添加擴(kuò)展參數(shù),參數(shù)名填寫(xiě)_sites_link(網(wǎng)址鏈接)和 _sites_sescribe(簡(jiǎn)介),并映射采集網(wǎng)址的字段。


一為主題其他可選參數(shù):_seo_title(seo標(biāo)題)、_seo_metakey(seo關(guān)鍵詞)、_seo_desc(seo描述)等;


3)發(fā)送數(shù)據(jù)

在簡(jiǎn)數(shù)采集結(jié)果數(shù)據(jù),將網(wǎng)址數(shù)據(jù)批量發(fā)送到導(dǎo)航網(wǎng)站。