第一點:蜘蛛的爬行和抓取
就是搜索引擎派出一個“人”以用戶的身份去訪問你的網(wǎng)站,這個“人”我們通常叫它為蜘蛛,或者叫它機器人。在搜索引擎出現(xiàn)的前期,蜘蛛最開始是從人為選取的網(wǎng)站做為出發(fā)點開始爬去的,這些人為選取的網(wǎng)站都是值得信賴的,然后在從這人為選取的網(wǎng)站里面提取新出現(xiàn)的域名地址開是爬取,這個過程叫做爬行,從此蜘蛛對新網(wǎng)站的抓取就開始呈幾何式增長,可以這么說,反向鏈接已經(jīng)成為搜索引擎優(yōu)化的基本因素之一,要是沒有方向鏈接的話,搜索引擎很難發(fā)現(xiàn)新出現(xiàn)的頁面,那時候就不用談優(yōu)化了,連頁面都沒有怎么去優(yōu)化,還怎么去排名?既然是以用戶的身份訪問,那么蜘蛛就會對頁面內(nèi)容產(chǎn)生印象,它就會把頁面內(nèi)容帶走也就是抓取保存到自己的數(shù)據(jù)庫中。
第二點:頁面索引
無論是谷歌還是百度只要是搜索引擎它們都有自己的一套索引模式,它們會把儲存在自己數(shù)據(jù)庫中的網(wǎng)頁文件分解開來,按照自己的索引模式進行分析,拋開無法識別或者認為不重要的內(nèi)容后,用海量的表格形式出入數(shù)據(jù)庫,在索引數(shù)據(jù)庫中被記錄下來的基本有頁面內(nèi)容、關(guān)鍵詞出現(xiàn)的位置和頻率、字體大小、字體顏色等。
第三點:關(guān)鍵詞處理
當(dāng)你輸入一個關(guān)鍵詞搜索后,搜索引擎就會對你說輸入的詞語進行處理和分析,比如百度特有的中文分詞技術(shù)(百度可是申請專利了的),不知道谷歌有沒有,我想應(yīng)該會有的,估計叫中文詞干技術(shù),上面純屬YY,繼續(xù)說,扯到什么地方了?我看看先,哦,從分詞技術(shù)開始,好像涉及到分詞技術(shù)去了?打住,只淺談,哈哈。最后在YY一句,搜索引擎對關(guān)鍵詞的處理要非常的迅速,無論處理步驟有多復(fù)雜都要以最快的速度處理完。
第四點:搜索排名
把第三點拿下來再說,當(dāng)搜索引擎對關(guān)鍵詞進行自家技術(shù)處理后,就開始正式排序了,它會沖索引列表中找出所有包含用戶搜索的關(guān)鍵詞的網(wǎng)頁,并再根據(jù)自己家的算法進行排序,就是把誰排在前面誰排在后面,這個復(fù)雜程度我是一般人無法想象的,世界上做搜索的也就那么幾家要是很簡單估計也沒什么人去研究了。