百度統(tǒng)計(jì)的訪客標(biāo)識(shí)碼官方概念
在百度統(tǒng)計(jì)后臺(tái)并沒(méi)有對(duì)“訪客標(biāo)識(shí)碼”概念的說(shuō)明,但是百度統(tǒng)計(jì)的幫助中心里,倒是有一個(gè)簡(jiǎn)單的介紹。訪客標(biāo)識(shí)碼是標(biāo)記訪客唯一身份的一串符號(hào),類似于訪客身份證。
這個(gè)概念說(shuō)明非常的模糊,說(shuō)了等于白說(shuō)。根據(jù)進(jìn)一步的實(shí)驗(yàn),慢慢揭開(kāi)了這個(gè)訪客標(biāo)識(shí)碼的真面目。
訪客標(biāo)識(shí)碼是基于瀏覽器的
這個(gè)實(shí)驗(yàn)做起來(lái)很簡(jiǎn)單:同一臺(tái)電腦,用兩個(gè)不同類型的瀏覽器訪問(wèn)同一個(gè)網(wǎng)頁(yè),就會(huì)發(fā)現(xiàn)自己的訪客標(biāo)識(shí)碼已經(jīng)發(fā)生了變化??蛻敉ㄟ^(guò)瀏覽器訪問(wèn)網(wǎng)頁(yè)后,百度統(tǒng)計(jì)的JS腳本會(huì)通過(guò)GET請(qǐng)求獲得瀏覽器的版本信息。稍微有點(diǎn)web開(kāi)發(fā)知識(shí)的人,會(huì)發(fā)現(xiàn)這個(gè)訪客標(biāo)識(shí)碼實(shí)際上跟cookie很像,或者說(shuō)他就是一個(gè)cookie。
更精準(zhǔn)一點(diǎn)的設(shè)置是,將操作系統(tǒng)版本、瀏覽器版本、屏幕分辨率、屏幕顏色等都作為參數(shù)。如果訪客僅僅是用VPN改變了自己的IP地址,但是本地的操作系統(tǒng)等參數(shù)并未改變的話,依然可以確立他的身份。
僅僅根據(jù)瀏覽器的信息來(lái)生成訪客標(biāo)識(shí)碼的話,服務(wù)器需要生成更多的訪客標(biāo)識(shí)碼,會(huì)帶來(lái)額外的服務(wù)器開(kāi)銷。好處則是,對(duì)訪客的標(biāo)識(shí)會(huì)更加的靈敏。
根據(jù)百度推廣搜索詞分配訪客識(shí)別碼
如圖所示,該訪客一天內(nèi)六次通過(guò)搜索高價(jià)詞進(jìn)入本站的競(jìng)價(jià)網(wǎng)站。百度統(tǒng)計(jì)顯示該訪客的信息:
1,IP地址為同一個(gè)IP;
2,瀏覽器均為遨游瀏覽器;
3,屏幕分辨率均為1366*768;
4,屏幕顏色均為32-bit色;
5,操作系統(tǒng)均為win8;
6,惡意點(diǎn)擊時(shí)間為同一天;
7,nginx的網(wǎng)站日志里也沒(méi)有顯示其使用了代理,IP地址為真實(shí)IP;
但是訪客識(shí)別碼并不相同,顯然訪客識(shí)別碼還有其他未知參數(shù)。唯一不同的就是客戶的搜索詞,連續(xù)三次搜索了同一個(gè)搜索詞,百度統(tǒng)計(jì)給與的訪客識(shí)別碼是相同的。但是隔了一段時(shí)間搜索了其他詞以后,再搜索之前的搜索詞,給出了并不一樣的訪客識(shí)別碼。由此可見(jiàn),百度給予相同IP多次訪問(wèn),給予訪客識(shí)別碼的幾率非常的高。
大概為了配合百度鳳巢系統(tǒng)的商盾更加精準(zhǔn)的識(shí)別惡意點(diǎn)擊。訪客識(shí)別碼增加了一個(gè)條件判斷語(yǔ)句,如果客戶是通過(guò)百度搜索過(guò)來(lái)的,則根據(jù)搜索詞分配不同的訪客識(shí)別碼。不同時(shí)間段搜索相同的搜索詞,分配不同的訪客識(shí)別碼。
這個(gè)cookie信息只在百度統(tǒng)計(jì)后臺(tái)顯示
找了好多天,在各個(gè)版本瀏覽器的header信息里都沒(méi)有找到這個(gè)cookie??赡苁浅鲇诎踩目紤],訪客標(biāo)識(shí)碼只在百度統(tǒng)計(jì)的后臺(tái)顯示。
參數(shù)不變?cè)L客標(biāo)識(shí)碼不變
上文提到訪客標(biāo)識(shí)碼是基于瀏覽器版本等參數(shù)的,如果這些電腦信息不發(fā)生變化的話,訪客標(biāo)識(shí)碼是長(zhǎng)期有效不會(huì)發(fā)生變化的。這對(duì)于確定用戶的身份,是非常有用的。同一局域網(wǎng)內(nèi),相同IP不同電腦的身份也可以由此確立。
如果積累大量歷史訪問(wèn)數(shù)據(jù),長(zhǎng)周期內(nèi)發(fā)現(xiàn)某訪客經(jīng)常更換IP地址點(diǎn)擊百度推廣廣告,則是惡意點(diǎn)擊無(wú)疑??啾频氖?,百度統(tǒng)計(jì)只有十天的記錄。
訪客標(biāo)識(shí)碼是百度商盾防惡意點(diǎn)擊的核心參數(shù)
百度統(tǒng)計(jì)的官方幫助中心明確提示,如果在同一時(shí)段,出現(xiàn)了訪客標(biāo)識(shí)碼相同,但是IP地址不同,通常是惡意點(diǎn)擊。這類惡意點(diǎn)擊,統(tǒng)計(jì)只是將所有到訪的情況作了記錄,但是風(fēng)潮系統(tǒng)的后臺(tái)并未計(jì)費(fèi)。由此可見(jiàn),訪客標(biāo)識(shí)碼是百度商盾防惡意點(diǎn)擊的最為重要的參數(shù)。
猜測(cè)百度商盾防惡意點(diǎn)擊的策略
根據(jù)對(duì)百度統(tǒng)計(jì)和百度商盾防惡意點(diǎn)擊的實(shí)時(shí)監(jiān)控,我個(gè)人猜測(cè)百度商盾防惡意點(diǎn)擊的策略有如下幾種:
策略一,在特定時(shí)間段(比如說(shuō)1個(gè)小時(shí)內(nèi)或者半個(gè)小時(shí)內(nèi)),訪客標(biāo)識(shí)碼相同,IP地址不同的點(diǎn)擊全部視為惡意點(diǎn)擊;
策略二,在特定時(shí)間段,訪客標(biāo)識(shí)碼相同,IP地址相同的部分點(diǎn)擊視為惡意點(diǎn)擊;
百度商盾的后臺(tái),有一級(jí)過(guò)濾點(diǎn)擊量和二級(jí)過(guò)濾點(diǎn)擊量?jī)蓚€(gè)過(guò)濾級(jí)別。目前來(lái)看,策略二過(guò)濾的惡意點(diǎn)擊,都是歸類到一級(jí)過(guò)濾中的。
百度商盾防惡意點(diǎn)擊系統(tǒng)的缺陷
第一,該系統(tǒng)是基于瀏覽器也就是訪客標(biāo)識(shí)碼的,如果更換瀏覽器并且使用VPN惡意點(diǎn)擊的話,商盾系統(tǒng)無(wú)效;
第二,遠(yuǎn)程連接到服務(wù)器,利用服務(wù)器的VPN進(jìn)行惡意點(diǎn)擊的行為,商盾系統(tǒng)無(wú)效;
第三,對(duì)于分布式的人為惡意點(diǎn)擊,由于IP地址和瀏覽器都不同,商盾系統(tǒng)無(wú)效;
第四,對(duì)于周期較長(zhǎng)的惡意點(diǎn)擊,商盾系統(tǒng)很無(wú)力;
第五,百度統(tǒng)計(jì)的訪客標(biāo)識(shí)碼只保留十天,通過(guò)歷史數(shù)據(jù)挖掘惡意點(diǎn)擊很無(wú)力;
由此可見(jiàn),做百度推廣的企業(yè),引進(jìn)更為先進(jìn)的防惡意點(diǎn)擊系統(tǒng)是非常有必要的。企業(yè)可以通過(guò)開(kāi)發(fā)自己的防惡意點(diǎn)擊系統(tǒng),來(lái)增加對(duì)在線廣告系統(tǒng)的保護(hù)。僅僅依靠百度自身的防惡意點(diǎn)擊系統(tǒng),是絕對(duì)不夠的。(來(lái)源:文武雙全)
]]>