121.14.89.*,此ip段為新站考察蜘蛛,通常有它光顧的時(shí)候,網(wǎng)站基本上是沒有排名的。
123.125.66.*:代表百度蜘蛛IP拜訪,預(yù)備抓取你工具。
123.125.68.*:這個(gè)蜘蛛每天都來,另外其它的來的少,示意網(wǎng)站大概要進(jìn)入沙盒了,或被者降權(quán)。
123.125.71.*,此ip段為低權(quán)重蜘蛛,可作為收錄判定。
123.125.71.*:抓取內(nèi)頁收錄的,權(quán)重較低,爬過此段的內(nèi)頁文章不會(huì)很快放出來,因不是首創(chuàng)或收羅文章。
?125.90.88.*:廣東茂名市電信也屬于百度蜘蛛IP重要形成身分,是新上線站較多,另有運(yùn)用過站長東西,或SEO綜合檢測形成的。
203.208.60.*:此ip段為異常蜘蛛,通常由于網(wǎng)站服務(wù)器問題或其他違規(guī)行為會(huì)引起它來爬取。。
210.72.225.*,此ip段為日常巡邏蜘蛛,只要網(wǎng)站沒有問題,沒有違規(guī)操作就行。
220.181.68.*:每天這個(gè)IP段只增不減很有大概進(jìn)沙盒或K站。
220.181.7.*:代表百度蜘蛛IP拜訪,預(yù)備抓取你工具。
220.181.108.*,此ip段為權(quán)重蜘蛛,如果此蜘蛛頻繁光顧,那么網(wǎng)站收錄會(huì)有提高。如果頻繁光顧網(wǎng)站卻不收錄,那么要注意是否網(wǎng)站質(zhì)量不高,內(nèi)容是否很差。
220.181.108.95:這個(gè)是百度抓取首頁的公用IP,如是220.181.108段的話,根本來說你的網(wǎng)站會(huì)每天隔夜快照?
220.181.108.92:同上98%抓取首頁,大概還會(huì)抓取其他(不是指內(nèi)頁)220.181段屬于權(quán)重IP段此段爬過的文章或首頁根本24小時(shí)放出來。
220.181.108.91:屬于綜合的,重要抓取首頁和內(nèi)頁或其他,屬于權(quán)重IP段,爬過的文章或首頁根本24小時(shí)放出來。
220.181.108.75:重點(diǎn)抓取更新文章的內(nèi)頁到達(dá)90%,8%抓取首頁,2%其他。權(quán)重IP段,爬過的文章或首頁根本24小時(shí)放出來。
220.181.108.86:公用抓取首頁IP權(quán)重段,普通前往代碼是30400代表未更新。
220.181.108.89:公用抓取首頁IP權(quán)重段,普通前往代碼是30400代表未更新。
220.181.108.94:公用抓取首頁IP權(quán)重段,普通前往代碼是30400代表未更新。
220.181.108.97:公用抓取首頁IP權(quán)重段,普通前往代碼是30400代表未更新。
220.181.108.80:公用抓取首頁IP權(quán)重段,普通前往代碼是30400代表未更新。
220.181.108.77:公用抓首頁IP權(quán)重段,普通前往代碼是30400代表未更新。
220.181.108.83:公用抓取首頁IP權(quán)重段,普通前往代碼是30400代表未更新。
下面的百度蜘蛛IP造訪,準(zhǔn)備抓取你東西,抓取網(wǎng)頁的百度蜘蛛。
60.172.229.61
61.129.45.72
61.135.162.*
百度競價(jià)蜘蛛
61.135.165.134
117.34.74.66
118.122.188.194
119.63.196.9
125.39.78.185
(百度聯(lián)盟爬蟲)百度統(tǒng)計(jì)。
61.135.186.*
?站長工具模仿的百度蜘蛛。
61.147.98.146
61.188.39.16
113.98.254.245
117.21.220.245
117.28.255.42
114站長工具箱(這個(gè)是你的網(wǎng)站不穩(wěn)定時(shí)常來的)
119.147.114.213
121.10.141.*
百度圖片爬蟲
123.15.**.**?
?如想在自己的網(wǎng)站上知道是哪個(gè)IP來過,可以把下面的代碼放到你的網(wǎng)頁中就可以了!
<script type="text/javascript" src="http://ip.t086.com/getip.php"></script>
60.28.22.0-60.28.22.255 天津市 百度蜘蛛 61.135.162.0-61.135.169.255 北京市 百度蜘蛛 61.135.186.0-61.135.190.255 北京市 百度蜘蛛 119.188.14.13-119.188.14.35 山東省濟(jì)南市 百度蜘蛛 123.125.66.0-123.125.71.255 北京市 百度蜘蛛 159.226.50.0-159.226.50.255 北京市 百度蜘蛛 162.105.207.0-162.105.207.255 北京市 百度蜘蛛 180.149.133.0-180.149.133.255 北京市 百度蜘蛛 202.108.249.0-202.108.250.255 北京市 百度蜘蛛 220.181.19.0-220.181.19.255 北京市 百度蜘蛛 220.181.32.0-220.181.38.255 北京市 百度蜘蛛 220.181.108.0-220.181.108.255 北京市 百度蜘蛛
]]>
打開/dede/article_add.php,搜索
ClearMyAddon($arcID, $title);
大約在260行,在它上面添加
else{
$urls[]='http://'.$_SERVER['HTTP_HOST'].$artUrl;
$api = 'http://data.zz.baidu.com/urls?site=你的域名&token=準(zhǔn)入密鑰';
$ch = curl_init();
$options = array(
CURLOPT_URL => $api,
CURLOPT_POST => true,
CURLOPT_RETURNTRANSFER => true,
CURLOPT_POSTFIELDS => implode("\n", $urls),
CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),
);
curl_setopt_array($ch, $options);
$result = curl_exec($ch);
}
注意,紅色代碼,是你在百度站長后臺(tái)獲取的接口調(diào)用地址。
搜索
<a href='catalog_do.php?cid=$typeid&dopost=listArchives'><u>已發(fā)布文章管理</u></a>
在它下面添加:
<a href=''><u>百度提交返回".$result."</u></a>
這個(gè)是添加文章后返回是不是成功提交了。
上圖就是表示1條提交成功,還剩下4999998條可提交。
下圖的這個(gè)站是最新幾天才添加的這個(gè)功能。文章內(nèi)容也是每天更新一到兩篇。一般推送后過一兩天才能看到效果.
1、后臺(tái)-系統(tǒng)-基本參數(shù),添加新變量,
變量名稱:cfg_baidu_push
變量值:里面填寫你從百度獲取的需要推送域名的參數(shù):http://data.zz.baidu.com/urls?site=https://www.441516.com&token=Wgn313aE0GAxfuaI,保存,如果變量值未填寫或者為空將不推送。
參數(shù)說明:百度推送接口
2、打開 /dede/inc/inc_archives_functions.php 在文件最末尾插入下面代碼
/**
* 百度主動(dòng)推送
*/
function baidu_push($id="",$qstr="")
{
global $cfg_multi_site,$cfg_basehost,$cfg_baidu_push;
if(!empty($id) && !empty($cfg_baidu_push))
{
if( !empty($id) && empty($qstr) ) $qstr = $id;
if($qstr=='')
{
exit();
}
$qstrs = explode('`',$qstr);
$cfg_domain = $cfg_multi_site == 'N' ? $cfg_basehost : '';
$urls = array();
$i = 0;
foreach($qstrs as $aid)
{
$i++;
$arcrow = GetOneArchive($aid);
$url = $cfg_domain.$arcrow['arcurl'];
$urls[] = $url;
$artlist .= $url."<br />";
}
if($i>1) $artlist = "";
if(!empty($urls)){
$ch = curl_init();
$options = array(
CURLOPT_URL => trim($cfg_baidu_push),
CURLOPT_POST => true,
CURLOPT_RETURNTRANSFER => true,
CURLOPT_POSTFIELDS => implode("\n", $urls),
CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),
);
curl_setopt_array($ch, $options);
$result = curl_exec($ch);
curl_close($ch);
$result = json_decode($result, true);
if(isset($result['success'])){
$not_same_site = isset($result['not_same_site'][0]) ? " <font style='color:#f00;'>推送鏈接與百度綁定站點(diǎn)不一致</font> " : "";
$not_valid = isset($result['not_valid'][0]) ? " <font style='color:#f00;'>推送鏈接不合法</font> " : "";
return $not_same_site . $not_valid . '百度主動(dòng)推送成功 '.$result['success'].' 條!當(dāng)天剩余 '.$result['remain'].' 條可推送!'.$artlist;
}else{
return '百度主動(dòng)推送失敗,錯(cuò)誤碼:'.$result['error'].'<a target="_blank">詳情</a>';
}
}
return "沒有數(shù)據(jù)被推送!";
}
}
打開后臺(tái)/dede/article_add.php搜索
//返回成功信息
在它上面加入
if(!empty($cfg_baidu_push))
{
$backurl .= "<p> ".baidu_push($arcID)."</p>";
}
繼續(xù)搜索
line-height:36px;height:36px
修改為
line-height:36px;
此教程為文章模模型的推送,如你有軟件,圖集模型或者其他模型,請參照上面內(nèi)容自行修改相應(yīng)模型添加內(nèi)容。
方法二效果
完畢!
還有一個(gè)插件是不光可以推送到百度,還可以推送到神馬,不過是收費(fèi)插件,詳細(xì)介紹查看下面頁面!
織夢批量向百度及神馬搜索引擎自動(dòng)批量推送文章插件
]]>
本網(wǎng)站地圖模板編碼為UTF-8,如果你的位置為GBK或其他請手動(dòng)轉(zhuǎn)碼。點(diǎn)擊下載:織夢網(wǎng)站地圖模板
下載解壓后拷貝 sitemap_html.htm 到當(dāng)前使用的網(wǎng)站模板文件夾內(nèi)。
進(jìn)入織夢的管理后臺(tái)進(jìn)入 核心 > 頻道模型 > 自由列表管理 頁面,增加一個(gè)列表:
在循環(huán)內(nèi)的單行記錄樣式(InnerText)處刪去原有內(nèi)容,填入:
<li><span class="url">[field:textlink/]</span><span class="time">[field:pubdate function="GetDateTimeMK(@me)"/]</span></li>
保存后在 自由列表管理 頁面上“更新”后,訪問您的網(wǎng)站地址 /sitemap.html 即可看到網(wǎng)站地圖頁面。
為了以后更新更方便,我們需要將模板設(shè)置中“不使用目錄默認(rèn)主頁”的勾選永久去掉,不然再次修改它會(huì)重新勾選上。算是一個(gè)BUG,因此我們需要修改源文件。 打開 dede\templets \freelist_add.htm 找到113行,把 value=”1″ 改為 value=”0″ 。再打開 dede\templets \freelist_edit.htm 找到89行,把 value=”1″ 改為value=”0″ 。這樣“不使用目錄默認(rèn)主頁”就永遠(yuǎn)不會(huì)自己勾選啦。
在做完網(wǎng)站地圖后除了在網(wǎng)站首頁內(nèi)添加鏈接外,最重要的是在 robots協(xié)議 內(nèi)添加網(wǎng)站地圖,以便讓搜索引擎直接抓取到。robots協(xié)議即 robots.txt 在網(wǎng)站根目錄下,打開后加入下面語句,將 www.vanhostingweb.com換成你網(wǎng)站的域名。值得注意的是 Sitemap 的首寫字母 S 需要大寫。
Sitemap: http://www.vanhostingweb.com/sitemap.html
PS:由于DEDECMS織夢系統(tǒng)本身的小問題,會(huì)出現(xiàn) “不使用目錄默認(rèn)主頁” 無法永久去掉,所以在robots協(xié)議中我們推薦您直接將網(wǎng)站地圖命名為 sitemap1.html ,網(wǎng)站地圖文件的命名并不會(huì)影響到SEO。
Sitemap: http://www.vanhostingweb.com/sitemap1.html
在這里我們就完成了DedeCMS網(wǎng)站地圖的全部設(shè)置,等待百度蜘蛛的到來吧!
]]>