善肯網(wǎng)頁(yè)TXT采集器是一個(gè)專(zhuān)業(yè)的網(wǎng)頁(yè)文本采集工具,,可以幫助用戶(hù)一鍵提取網(wǎng)頁(yè)中的所有文字,總是有很多朋友喜歡在網(wǎng)頁(yè)上看小說(shuō),看到好看的章節(jié)你可以使用善肯網(wǎng)頁(yè)TXT采集器,它可以讓你在抓取小說(shuō)的時(shí)候獲得更加快速的速度,讓你可以在看到喜歡看的小說(shuō)的時(shí)候更加的簡(jiǎn)單!
使用幫助
1、規(guī)則設(shè)置
在規(guī)則設(shè)置窗口,在網(wǎng)站中隨便找一篇文,不寫(xiě)任何規(guī)則,先點(diǎn)擊實(shí)時(shí)預(yù)覽,看看能不能獲取網(wǎng)頁(yè)源代碼,能獲取則再寫(xiě)規(guī)則,不能獲取就沒(méi)必要繼續(xù)了。
規(guī)則設(shè)置使用的是正則表達(dá)式匹配內(nèi)容,有一定基礎(chǔ)最好,沒(méi)基礎(chǔ)也可以參考給的范例,簡(jiǎn)單學(xué)習(xí)下,不需要深入學(xué)習(xí)正則。
規(guī)則設(shè)置的時(shí)候,目錄頁(yè)和內(nèi)容頁(yè)需要分開(kāi)預(yù)覽,也就需要兩個(gè)鏈接,一個(gè)目錄頁(yè)鏈接、一個(gè)內(nèi)容頁(yè)鏈接。
關(guān)于替換,有通用替換和定制替換,這里目前不需要正則,普通替換就好,需要注意的是必須要輸入值,空格也行。刪除:選中整行,再按住delete鍵就行。內(nèi)置\n再作為替換數(shù)據(jù)的時(shí)候代表?yè)Q行。
編碼,目前只設(shè)置有GBK和UFT-8,差不多大多數(shù)網(wǎng)站就是這兩種編碼其中之一。
2、解析與下載
解析請(qǐng)按解析地址2按鈕
支持單章節(jié)下載和全文下載。
支持添加章節(jié)數(shù)【有的小說(shuō)沒(méi)有章節(jié)數(shù)的時(shí)候就可以勾上】
支持在線(xiàn)看,但是需要聯(lián)網(wǎng),此功能只是輔助,并非專(zhuān)業(yè)的看小說(shuō)軟件。
下載進(jìn)度和總需時(shí)間顯示,內(nèi)置多線(xiàn)程。
3、關(guān)于軟件
其實(shí)只要.exe就行,規(guī)則全是自己添加,commonrule.xml里面是通用替換規(guī)則。網(wǎng)站規(guī)則在rule文件夾下。我這邊在里面放了兩個(gè)網(wǎng)站的規(guī)則,主要是測(cè)試的時(shí)候是用的。其他網(wǎng)站規(guī)則,大家可以自己添加,或者支持開(kāi)發(fā)者也行。
軟件沒(méi)加殼,c#開(kāi)發(fā)的,沒(méi)放病毒。不放心請(qǐng)不要用,我不背鍋。
關(guān)于軟件里面有個(gè)www.52pojie.cn跳轉(zhuǎn)到論壇,我個(gè)人測(cè)試跳轉(zhuǎn)的時(shí)候被360提示了,也有可能是因?yàn)樘D(zhuǎn)的是360瀏覽器,不知道你們會(huì)不會(huì)有這個(gè)問(wèn)題。
xml里面的內(nèi)容,如果不清楚的話(huà)還是不要?jiǎng)铀?,免得軟件識(shí)別失敗報(bào)錯(cuò)。
需要.net framework 4.5或者及以上版本框架支持,如果你電腦沒(méi)有的話(huà),需要下載安裝,框架不大的。
軟件特色
【操作簡(jiǎn)單】
完全可視化圖形操作,無(wú)需專(zhuān)業(yè)IT人員,任何會(huì)使用電腦上網(wǎng)的人都可以輕松掌握。
【云采集】
采集任務(wù)自動(dòng)分配到云端多臺(tái)服務(wù)器同時(shí)執(zhí)行,提高采集效率,可以很短的時(shí)間內(nèi) 獲取成千上萬(wàn)條信息。
【拖拽式采集流程】
模擬人的操作思維模式,可以登陸,輸入數(shù)據(jù),點(diǎn)擊鏈接,按鈕等,還能對(duì)不同情況采取不同的采集流程。
【圖文識(shí)別】
內(nèi)置可擴(kuò)展的OCR接口,支持解析圖片中的文字,可將圖片上的文字提取出來(lái)。
【定時(shí)自動(dòng)采集】
采集任務(wù)自動(dòng)運(yùn)行,可以按照指定的周期自動(dòng)采集,并且還支持最快一分鐘一次的實(shí)時(shí)采集。
【2分鐘快速入門(mén)】
內(nèi)置從入門(mén)到精通所需要的視頻教程,2分鐘就能上手使用,另外還有文檔,論壇,qq群等。
- 數(shù)據(jù)爬蟲(chóng)采集軟件
-
更多 (11個(gè)) >>電腦爬蟲(chóng)軟件大全 在互聯(lián)網(wǎng)信息時(shí)代,很多朋友們都會(huì)選擇在網(wǎng)上收集自己需要的信息,想要快速的收集各種信息的話(huà),就需要使用到相關(guān)爬蟲(chóng)工具了,通過(guò)爬蟲(chóng)軟件我們就可以自動(dòng)收集自己想要的數(shù)據(jù)信息,能夠節(jié)約大量的手動(dòng)時(shí)間,但是爬蟲(chóng)軟件有哪些呢?小編今天就在此給大家提供了電腦爬蟲(chóng)軟件大全,包括Python、杰靈采集器、火車(chē)頭采集器等等,這里面的軟件都是操作十分簡(jiǎn)單的,不需要用戶(hù)會(huì)相關(guān)的技術(shù)就能夠直接操作,無(wú)論是老手還是新手都適用,對(duì)此有興趣的小伙伴們可以來(lái)下載體驗(yàn)。
-
-
EditorTools(全自動(dòng)無(wú)人值守采集軟件) 19.15M
查看/簡(jiǎn)體中文v3.6.12官方版 -
python最新版本2024 25.2M
查看/簡(jiǎn)體中文v3.12.3官方版 -
善肯網(wǎng)頁(yè)TXT采集器 896K
查看/簡(jiǎn)體中文v1.0綠色版 -
News File Grabber(新聞文件抓取器) 1.42M
查看/簡(jiǎn)體中文v4.6.0.4官方版 -
杰靈采集器 2.76M
查看/簡(jiǎn)體中文v20190708官方版 -
火車(chē)頭采集器 54.03M
查看/簡(jiǎn)體中文v10.24官方版 -
深維全能信息采集軟件 2.25M
查看/簡(jiǎn)體中文v2.5.3.9官方版 -
網(wǎng)頁(yè)信息收集器 1.04M
查看/簡(jiǎn)體中文v1.0綠色版 -
捷豹數(shù)據(jù)采集軟件 3.01M
查看/簡(jiǎn)體中文v1.0.0.1官方版 -
BalanceLink(數(shù)據(jù)采集工具) 10.91M
查看/簡(jiǎn)體中文v4.1.1官方版 -
熊貓智能采集軟件 12.04M
查看/簡(jiǎn)體中文v3.5
-
- 下載地址
- 本地下載通道:
- 浙江電信下載
- 北京聯(lián)通下載
- 江蘇電信下載
- 廣東電信下載
有問(wèn)題? 點(diǎn)此報(bào)錯(cuò)
發(fā)表評(píng)論
0條評(píng)論軟件排行榜
- 1迅雷vip破解版永久會(huì)員2023版 v11.2.2.1716綠色免安裝版
- 2idm綠色破解版 v6.42.20中文版
- 3太極神器電腦版 v2.9.5
- 4qBittorrent中文版 v4.6.7.10綠色版
- 5豆丁當(dāng)當(dāng)(萬(wàn)能文檔下載器) v2.0綠色免費(fèi)版
- 6比特精靈(BitSpirit) v3.6.0.550多國(guó)語(yǔ)言安裝版
- 7冰點(diǎn)文庫(kù)下載器綠色版 v3.2.16電腦版
- 8豆丁下載器破解版 附使用教程
- 9utorrent中文官方版 v3.6.0.47084
- 10大圣文庫(kù)下載器破解激活版 v1.42綠色版
熱門(mén)推薦
- 阿里云盤(pán)電腦版 v6.5.0官方版138.64M / 簡(jiǎn)體中文
- qBittorrent中文版 v4.6.7.10綠色版17.51M / 簡(jiǎn)體中文
- vso downloader中文旗艦注冊(cè)版 v5.0.1.61修改版34.98M / 簡(jiǎn)體中文
- utorrent pro中文版 v3.6.0.470844.74M / 多國(guó)語(yǔ)言[中文]
- 唧唧down最新版 v1.236.0官方版703K / 簡(jiǎn)體中文
- 比特彗星電腦版(bitcomet) v2.051.9M / 簡(jiǎn)體中文
- 迅雷9官方版 V9.1.49.1060電腦版90.41M / 簡(jiǎn)體中文
- Internet Download Manager(IDM) v6.39.8.1中文破解版10.02M / 簡(jiǎn)體中文
- 小葉文庫(kù)下載器 v20.11.11屏蔽更新復(fù)活版27.78M / 簡(jiǎn)體中文
- 騰訊QQ旋風(fēng)電腦版 v4.8.773.4009.3M / 簡(jiǎn)體中文