說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
身為一個(gè)seoer,關(guān)鍵詞排名及網(wǎng)站頁(yè)面收錄查詢(xún)必不可少。
數(shù)量少了還好說(shuō),手工查詢(xún)下OK。如果數(shù)量多了(以千計(jì)),有如下幾種可能了:
1、你有程序的底子或者有個(gè)程序猿的好基友,寫(xiě)個(gè)程序慢慢跑;
2、你不差錢(qián)或者公司不差錢(qián),買(mǎi)個(gè)諸如愛(ài)站工具包神馬的工具去查;
3、你不差時(shí)間或者手下的人不差錢(qián),一條一條慢慢查;
4、你是一個(gè)屌絲,不懂程序無(wú)人無(wú)錢(qián)無(wú)時(shí)間。
額,好吧,第四個(gè)人是我。然后,我想說(shuō)的是,屌絲,自有屌絲的解決方法,你不能哭,得想辦法,站起來(lái),然后……
開(kāi)始吧,不要廢話了。大家都捉急了。
一、查詢(xún)關(guān)鍵詞排名
這里介紹一個(gè)查詢(xún)百度前五十關(guān)鍵詞排名的方法。
1、拼接url
http://www.baidu.com/s?wd=SEO公司&rn=50
拼接的url傳輸協(xié)議為http,不要弄https(百度目前為https),否則查不到結(jié)果;
rn=50的意思是一頁(yè)顯示50個(gè)結(jié)果。
如果你的關(guān)鍵詞很多,可以用excel批量拼接url(拼接方法,自行腦補(bǔ)),然后導(dǎo)入火車(chē)頭的采集網(wǎng)址中。
2、采集內(nèi)容規(guī)則
我采用的是前后截取的方式查詢(xún)的關(guān)鍵詞排名,具體規(guī)則如下:
開(kāi)始字符串:<span class=”g”>不帶http的目標(biāo)站點(diǎn)域名/(*)<div class=”c-tools” id=”tools_(*)_
結(jié)束字符串:” data-tools=
然后,如果你不放心寫(xiě)的對(duì)不對(duì)的話,可以測(cè)試一下。
3、注意設(shè)置時(shí)間間隔
大家都知道,如果時(shí)間間隔過(guò)短,百度會(huì)出驗(yàn)證碼的啦,我這里一般設(shè)置的3s查一次。
在文件保存及部分設(shè)置中設(shè)置。
設(shè)置好了,可以開(kāi)始執(zhí)行任務(wù)了。
二、查詢(xún)頁(yè)面收錄
同樣,我這想的辦法也是用火車(chē)頭去做的,其他人怎么查詢(xún)收錄的邏輯我不大清楚,這里講講我的方法:
1、同樣的都需要先拼接url:
http://www.baidu.com/s?wd=http://www.cnhfjx.cn/
2、在采集內(nèi)容時(shí),需要采集兩個(gè)地方,如下圖所示:
如果相關(guān)結(jié)果數(shù)不是0,且沒(méi)有出現(xiàn)“沒(méi)有找到該Url”,說(shuō)明此頁(yè)面已經(jīng)收錄啦。
至于邏輯具體嚴(yán)不嚴(yán)謹(jǐn),還需要進(jìn)一步驗(yàn)證,只是,可以采用此種方式試驗(yàn)一下。
推薦閱讀
說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732