百度統(tǒng)計訪客標(biāo)識碼詳解
相信很多SEM推廣人員都知道,百度鳳巢系統(tǒng)的工具中心里有一個商盾系統(tǒng)。該系統(tǒng)每天會自動過濾無效點(diǎn)擊,被過濾的無效點(diǎn)擊不收費(fèi)。那么百度判定無效點(diǎn)擊的規(guī)則到底是什么呢?其實(shí)這里就用到了,百度統(tǒng)計里大家經(jīng)常會關(guān)注到的一個東東“訪客標(biāo)識碼”。最近在學(xué)習(xí)PHP的過程中,對這個訪客標(biāo)識碼有了進(jìn)一步的了解。思考了很久,今天就跟大家分享一下我的經(jīng)驗(yàn)心得吧。
百度統(tǒng)計的訪客標(biāo)識碼官方概念
在百度統(tǒng)計后臺并沒有對“訪客標(biāo)識碼”概念的說明,但是百度統(tǒng)計的幫助中心里,倒是有一個簡單的介紹。訪客標(biāo)識碼是標(biāo)記訪客唯一身份的一串符號,類似于訪客身份證。
這個概念說明非常的模糊,說了等于白說。根據(jù)進(jìn)一步的實(shí)驗(yàn),慢慢揭開了這個訪客標(biāo)識碼的真面目。
訪客標(biāo)識碼是基于瀏覽器的
這個實(shí)驗(yàn)做起來很簡單:同一臺電腦,用兩個不同類型的瀏覽器訪問同一個網(wǎng)頁,就會發(fā)現(xiàn)自己的訪客標(biāo)識碼已經(jīng)發(fā)生了變化??蛻敉ㄟ^瀏覽器訪問網(wǎng)頁后,百度統(tǒng)計的JS腳本會通過GET請求獲得瀏覽器的版本信息。稍微有點(diǎn)web開發(fā)知識的人,會發(fā)現(xiàn)這個訪客標(biāo)識碼實(shí)際上跟cookie很像,或者說他就是一個cookie。
更精準(zhǔn)一點(diǎn)的設(shè)置是,將操作系統(tǒng)版本、瀏覽器版本、屏幕分辨率、屏幕顏色等都作為參數(shù)。如果訪客僅僅是用VPN改變了自己的IP地址,但是本地的操作系統(tǒng)等參數(shù)并未改變的話,依然可以確立他的身份。
僅僅根據(jù)瀏覽器的信息來生成訪客標(biāo)識碼的話,服務(wù)器需要生成更多的訪客標(biāo)識碼,會帶來額外的服務(wù)器開銷。好處則是,對訪客的標(biāo)識會更加的靈敏。
根據(jù)百度推廣搜索詞分配訪客識別碼

如圖所示,該訪客一天內(nèi)六次通過搜索高價詞進(jìn)入本站的競價網(wǎng)站。百度統(tǒng)計顯示該訪客的信息:
1,IP地址為同一個IP;
2,瀏覽器均為遨游瀏覽器;
3,屏幕分辨率均為1366*768;
4,屏幕顏色均為32-bit色;
5,操作系統(tǒng)均為win8;
6,惡意點(diǎn)擊時間為同一天;
7,nginx的網(wǎng)站日志里也沒有顯示其使用了代理,IP地址為真實(shí)IP;
但是訪客識別碼并不相同,顯然訪客識別碼還有其他未知參數(shù)。唯一不同的就是客戶的搜索詞,連續(xù)三次搜索了同一個搜索詞,百度統(tǒng)計給與的訪客識別碼是相同的。但是隔了一段時間搜索了其他詞以后,再搜索之前的搜索詞,給出了并不一樣的訪客識別碼。由此可見,百度給予相同IP多次訪問,給予訪客識別碼的幾率非常的高。
大概為了配合百度鳳巢系統(tǒng)的商盾更加精準(zhǔn)的識別惡意點(diǎn)擊。訪客識別碼增加了一個條件判斷語句,如果客戶是通過百度搜索過來的,則根據(jù)搜索詞分配不同的訪客識別碼。不同時間段搜索相同的搜索詞,分配不同的訪客識別碼。
這個cookie信息只在百度統(tǒng)計后臺顯示
找了好多天,在各個版本瀏覽器的header信息里都沒有找到這個cookie??赡苁浅鲇诎踩目紤],訪客標(biāo)識碼只在百度統(tǒng)計的后臺顯示。
參數(shù)不變訪客標(biāo)識碼不變
上文提到訪客標(biāo)識碼是基于瀏覽器版本等參數(shù)的,如果這些電腦信息不發(fā)生變化的話,訪客標(biāo)識碼是長期有效不會發(fā)生變化的。這對于確定用戶的身份,是非常有用的。同一局域網(wǎng)內(nèi),相同IP不同電腦的身份也可以由此確立。
如果積累大量歷史訪問數(shù)據(jù),長周期內(nèi)發(fā)現(xiàn)某訪客經(jīng)常更換IP地址點(diǎn)擊百度推廣廣告,則是惡意點(diǎn)擊無疑。苦逼的是,百度統(tǒng)計只有十天的記錄。
訪客標(biāo)識碼是百度商盾防惡意點(diǎn)擊的核心參數(shù)
百度統(tǒng)計的官方幫助中心明確提示,如果在同一時段,出現(xiàn)了訪客標(biāo)識碼相同,但是IP地址不同,通常是惡意點(diǎn)擊。這類惡意點(diǎn)擊,統(tǒng)計只是將所有到訪的情況作了記錄,但是風(fēng)潮系統(tǒng)的后臺并未計費(fèi)。由此可見,訪客標(biāo)識碼是百度商盾防惡意點(diǎn)擊的最為重要的參數(shù)。
猜測百度商盾防惡意點(diǎn)擊的策略
根據(jù)對百度統(tǒng)計和百度商盾防惡意點(diǎn)擊的實(shí)時監(jiān)控,我個人猜測百度商盾防惡意點(diǎn)擊的策略有如下幾種:
策略一,在特定時間段(比如說1個小時內(nèi)或者半個小時內(nèi)),訪客標(biāo)識碼相同,IP地址不同的點(diǎn)擊全部視為惡意點(diǎn)擊;
策略二,在特定時間段,訪客標(biāo)識碼相同,IP地址相同的部分點(diǎn)擊視為惡意點(diǎn)擊;
百度商盾的后臺,有一級過濾點(diǎn)擊量和二級過濾點(diǎn)擊量兩個過濾級別。目前來看,策略二過濾的惡意點(diǎn)擊,都是歸類到一級過濾中的。
百度商盾防惡意點(diǎn)擊系統(tǒng)的缺陷
第一,該系統(tǒng)是基于瀏覽器也就是訪客標(biāo)識碼的,如果更換瀏覽器并且使用VPN惡意點(diǎn)擊的話,商盾系統(tǒng)無效;
第二,遠(yuǎn)程連接到服務(wù)器,利用服務(wù)器的VPN進(jìn)行惡意點(diǎn)擊的行為,商盾系統(tǒng)無效;
第三,對于分布式的人為惡意點(diǎn)擊,由于IP地址和瀏覽器都不同,商盾系統(tǒng)無效;
第四,對于周期較長的惡意點(diǎn)擊,商盾系統(tǒng)很無力;
第五,百度統(tǒng)計的訪客標(biāo)識碼只保留十天,通過歷史數(shù)據(jù)挖掘惡意點(diǎn)擊很無力;
由此可見,做百度推廣的企業(yè),引進(jìn)更為先進(jìn)的防惡意點(diǎn)擊系統(tǒng)是非常有必要的。企業(yè)可以通過開發(fā)自己的防惡意點(diǎn)擊系統(tǒng),來增加對在線廣告系統(tǒng)的保護(hù)。僅僅依靠百度自身的防惡意點(diǎn)擊系統(tǒng),是絕對不夠的。(來源:文武雙全)
1.本站主要是為了記錄工作、學(xué)習(xí)中遇到的問題,可能由于本人技術(shù)有限,內(nèi)容難免有紕漏,一切內(nèi)容僅供參考。
2.本站部分內(nèi)容來源互聯(lián)網(wǎng),如果有圖片或者內(nèi)容侵犯您的權(quán)益請聯(lián)系我們刪除!
3.本站所有原創(chuàng)作品,包括文字、資料、圖片、網(wǎng)頁格式,轉(zhuǎn)載時請標(biāo)注作者與來源。