首 頁(yè)
手機(jī)版

善肯網(wǎng)頁(yè)TXT采集器 v1.0綠色版

善肯網(wǎng)頁(yè)TXT采集器是一個(gè)專(zhuān)業(yè)的網(wǎng)頁(yè)文本采集工具,,可以幫助用戶(hù)一鍵提取網(wǎng)頁(yè)中的所有文字,總是有很多朋友喜歡在網(wǎng)頁(yè)上看小說(shuō),看到好看的章節(jié)你可以使用善肯網(wǎng)頁(yè)TXT采集器,它可以讓你在抓取小說(shuō)的時(shí)候獲得更加快速的速度,讓你可以在看到喜歡看的小說(shuō)的時(shí)候更加的簡(jiǎn)單!

使用幫助

1、規(guī)則設(shè)置

在規(guī)則設(shè)置窗口,在網(wǎng)站中隨便找一篇文,不寫(xiě)任何規(guī)則,先點(diǎn)擊實(shí)時(shí)預(yù)覽,看看能不能獲取網(wǎng)頁(yè)源代碼,能獲取則再寫(xiě)規(guī)則,不能獲取就沒(méi)必要繼續(xù)了。

規(guī)則設(shè)置使用的是正則表達(dá)式匹配內(nèi)容,有一定基礎(chǔ)最好,沒(méi)基礎(chǔ)也可以參考給的范例,簡(jiǎn)單學(xué)習(xí)下,不需要深入學(xué)習(xí)正則。

規(guī)則設(shè)置的時(shí)候,目錄頁(yè)和內(nèi)容頁(yè)需要分開(kāi)預(yù)覽,也就需要兩個(gè)鏈接,一個(gè)目錄頁(yè)鏈接、一個(gè)內(nèi)容頁(yè)鏈接。

關(guān)于替換,有通用替換和定制替換,這里目前不需要正則,普通替換就好,需要注意的是必須要輸入值,空格也行。刪除:選中整行,再按住delete鍵就行。內(nèi)置\n再作為替換數(shù)據(jù)的時(shí)候代表?yè)Q行。

編碼,目前只設(shè)置有GBK和UFT-8,差不多大多數(shù)網(wǎng)站就是這兩種編碼其中之一。

2、解析與下載

解析請(qǐng)按解析地址2按鈕

支持單章節(jié)下載和全文下載。

支持添加章節(jié)數(shù)【有的小說(shuō)沒(méi)有章節(jié)數(shù)的時(shí)候就可以勾上】

支持在線(xiàn)看,但是需要聯(lián)網(wǎng),此功能只是輔助,并非專(zhuān)業(yè)的看小說(shuō)軟件。

下載進(jìn)度和總需時(shí)間顯示,內(nèi)置多線(xiàn)程。

3、關(guān)于軟件

其實(shí)只要.exe就行,規(guī)則全是自己添加,commonrule.xml里面是通用替換規(guī)則。網(wǎng)站規(guī)則在rule文件夾下。我這邊在里面放了兩個(gè)網(wǎng)站的規(guī)則,主要是測(cè)試的時(shí)候是用的。其他網(wǎng)站規(guī)則,大家可以自己添加,或者支持開(kāi)發(fā)者也行。

軟件沒(méi)加殼,c#開(kāi)發(fā)的,沒(méi)放病毒。不放心請(qǐng)不要用,我不背鍋。

關(guān)于軟件里面有個(gè)www.52pojie.cn跳轉(zhuǎn)到論壇,我個(gè)人測(cè)試跳轉(zhuǎn)的時(shí)候被360提示了,也有可能是因?yàn)樘D(zhuǎn)的是360瀏覽器,不知道你們會(huì)不會(huì)有這個(gè)問(wèn)題。

xml里面的內(nèi)容,如果不清楚的話(huà)還是不要?jiǎng)铀?,免得軟件識(shí)別失敗報(bào)錯(cuò)。

需要.net framework 4.5或者及以上版本框架支持,如果你電腦沒(méi)有的話(huà),需要下載安裝,框架不大的。

軟件特色

【操作簡(jiǎn)單】

完全可視化圖形操作,無(wú)需專(zhuān)業(yè)IT人員,任何會(huì)使用電腦上網(wǎng)的人都可以輕松掌握。

【云采集】

采集任務(wù)自動(dòng)分配到云端多臺(tái)服務(wù)器同時(shí)執(zhí)行,提高采集效率,可以很短的時(shí)間內(nèi) 獲取成千上萬(wàn)條信息。

【拖拽式采集流程】

模擬人的操作思維模式,可以登陸,輸入數(shù)據(jù),點(diǎn)擊鏈接,按鈕等,還能對(duì)不同情況采取不同的采集流程。

【圖文識(shí)別】

內(nèi)置可擴(kuò)展的OCR接口,支持解析圖片中的文字,可將圖片上的文字提取出來(lái)。

【定時(shí)自動(dòng)采集】

采集任務(wù)自動(dòng)運(yùn)行,可以按照指定的周期自動(dòng)采集,并且還支持最快一分鐘一次的實(shí)時(shí)采集。

【2分鐘快速入門(mén)】

內(nèi)置從入門(mén)到精通所需要的視頻教程,2分鐘就能上手使用,另外還有文檔,論壇,qq群等。

收起介紹展開(kāi)介紹
  • 數(shù)據(jù)爬蟲(chóng)采集軟件
更多 (11個(gè)) >>電腦爬蟲(chóng)軟件大全 在互聯(lián)網(wǎng)信息時(shí)代,很多朋友們都會(huì)選擇在網(wǎng)上收集自己需要的信息,想要快速的收集各種信息的話(huà),就需要使用到相關(guān)爬蟲(chóng)工具了,通過(guò)爬蟲(chóng)軟件我們就可以自動(dòng)收集自己想要的數(shù)據(jù)信息,能夠節(jié)約大量的手動(dòng)時(shí)間,但是爬蟲(chóng)軟件有哪些呢?小編今天就在此給大家提供了電腦爬蟲(chóng)軟件大全,包括Python、杰靈采集器、火車(chē)頭采集器等等,這里面的軟件都是操作十分簡(jiǎn)單的,不需要用戶(hù)會(huì)相關(guān)的技術(shù)就能夠直接操作,無(wú)論是老手還是新手都適用,對(duì)此有興趣的小伙伴們可以來(lái)下載體驗(yàn)。
  • 下載地址
善肯網(wǎng)頁(yè)TXT采集器 v1.0綠色版

有問(wèn)題? 點(diǎn)此報(bào)錯(cuò)

發(fā)表評(píng)論

0條評(píng)論

熱門(mén)推薦