日(rì)期:2023-03-07 浏覽次數:840次
日(rì)期:2023-02-08 浏覽次數:24次
日(rì)期:2023-02-28 浏覽次數:391次
日(rì)期:2022-12-30 浏覽次數:247次
日(rì)期:2022-03-17 浏覽次數:698次
日(rì)期:2022-03-16 浏覽次數:784次
發布時間:2018-06-01 11:52:05 人(rén)氣: 來(lái)源:admin
VIP大(dà)講堂微信群内有同學問(wèn):我們有一個網頁3000多行中文+英文,快(kuài)照(zhào)顯示不完整,通過站(zhàn)長平台模拟抓取(注:這位同學指的是href="https://ziyuan.baidu.com/crawltools/index" style="cursor: pointer; text-decoration-line: none; color: rgb(63, 130, 252); font-family: tahoma, PingFangSC, "microsoft yahei ui", "microsoft yahei", sans-serif; text-indent: 32px; white-space: normal; background-color: rgb(255, 255, 255);">抓取診斷工(gōng)具),文字也顯示不完整,對網站(zhàn)影(yǐng)響會不會很大(dà)?院長把這個籠統的問(wèn)題拆成了小問(wèn)題,并向工(gōng)程師(shī)進行了确認。
**個問(wèn)題:百度對網頁内容多少大(dà)小有限制嗎(ma)?
答:對内容文字多少沒有限制,但(dàn)源碼大(dà)小上有一定的限制,過長的話(huà),會取前面一部分(fēn),所以,源碼還(hái)是越簡潔越好
第二個問(wèn)題:如(rú)果快(kuài)照(zhào)顯示網頁不完整,是不是說(shuō)明BaiduSpider沒有完整收錄網頁?
答:不是的,快(kuài)照(zhào)的成生(shēng)涉及很多環節,顯示不完整的原因會很多,不能簡單地認爲沒有收錄完整。
第三個問(wèn)題:使用平台抓取斷工(gōng)具也不能完整顯示,是不是就(jiù)可(kě)以認爲沒有收錄完整了?
答:不是的,工(gōng)具隻展示前200K。我們設計(jì)工(gōng)具的時候對網頁做過調研,一般來(lái)說(shuō)展示前100K就(jiù)夠用了。
第四個問(wèn)題:百度是否要求網頁上不能有什麽特殊字符?
答:沒有這個限制。
電話(huà):15002687135(蘭州) 18997181830(西甯)
蘭州地址:蘭州市七裡(lǐ)河區西站(zhàn)十字銀信大(dà)廈1302室
西甯地址:蘭州市七裡(lǐ)河區西站(zhàn)十字銀信大(dà)廈1302室