【搜索引擎】搜索引擎的優(yōu)化原理和介紹

閱讀 ?·? 發(fā)布日期 2021-08-08 14:37 ?·? admin
搜索引擎優(yōu)化Search Engine Optimization
 
     定義:是一種利用搜索引擎的搜索規(guī)則來提高目的網(wǎng)站在有關(guān)搜索引擎內(nèi)的排名的方式。主要工作原則是,通過了解各類搜索引擎抓取互聯(lián)網(wǎng)頁面、進行索引以及確定其對特定關(guān)鍵詞搜索結(jié)果排名等技術(shù),來對網(wǎng)頁進行相關(guān)的優(yōu)化。
 
     “注:請不要針對搜索引擎而采用作弊行為,否則會容易受到處罰。僅僅是模仿甚至抄襲別人的內(nèi)容,這樣對用戶來說沒有價值的。請牢記:為用戶,而不是為搜索引擎提供內(nèi)容。您網(wǎng)站的設(shè)計首先要考慮用戶的需求,并同時確保能便于搜索引擎抓取和索引。”


                                      
 
一、站點地圖Sitemap
 
定義:sitemap可方便網(wǎng)站管理員通知搜索引擎他們網(wǎng)站上有哪些可供抓取的網(wǎng)頁。
 
常見的sitemap文件,就是txt、xml、xml一級索引這三種格式文件,在其中列出網(wǎng)站中的網(wǎng)址以及關(guān)于每個網(wǎng)址的其他元數(shù)據(jù)(上次更新的時間、更改的頻率以及相對于網(wǎng)站上其他網(wǎng)址的重要程度為何等),以便搜索引擎可以更加智能地抓取網(wǎng)站。

 
二、Robots協(xié)議
 
定義:Robots協(xié)議(也稱為爬蟲協(xié)議、爬蟲規(guī)則、機器人協(xié)議等)也就是robots.txt,網(wǎng)站通過robots協(xié)議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。
 
Robots協(xié)議是網(wǎng)站國際互聯(lián)網(wǎng)界通行的道德規(guī)范,其目的是保護網(wǎng)站數(shù)據(jù)和敏感信息、確保用戶個人信息和隱私不被侵犯。因其不是命令,故需要搜索引擎自覺遵守。
 
您可以使用robots.txt禁止spider抓取您不想向用戶展現(xiàn)的形式,這也有助于節(jié)省您的寬帶。

 
三、元標簽
 
定義:是使用在網(wǎng)頁的head標簽之間的一種HTML標簽,主要包括關(guān)鍵詞標簽和描述標簽,現(xiàn)在最常用的也是這兩類。
 
與其它的HTML標簽不同,元標簽不會在頁面的任何地方顯示出來,所以絕大多數(shù)的訪問者并不會看到它的存在,而且對網(wǎng)站的權(quán)威度沒有影響,不過仍然是有好處的,特別是在與搜索引擎的spider交流的時候。
 
不同的元標簽起著不同的作用——但均用來提供關(guān)于頁面的附加信息。

 
四、網(wǎng)頁標題Title
 
定義:是對一個網(wǎng)頁的高度概括,一般來說,網(wǎng)站首頁的標題就是網(wǎng)站的正式名稱,而網(wǎng)站中文章內(nèi)容頁面的標題就是文章的題目,欄目首頁的標題通常是欄目名稱。
 
您網(wǎng)站首頁的標題可以列出網(wǎng)站或者公司名稱和其他一些重要的信息,諸如您公司的實際地址,一些主要關(guān)注的領(lǐng)域或者提供的服務(wù)。
 
助君網(wǎng)絡(luò)建議站長不要利用網(wǎng)頁標題進行惡意作弊,類似于一些網(wǎng)站正文內(nèi)容與標題不符,或者標題過長、關(guān)鍵詞堆砌的網(wǎng)站,搜索引擎不會保證收錄,甚至可能處罰。

 
五、面包屑導(dǎo)航
 
定義:是指在網(wǎng)頁頂端或者底部放置的一排內(nèi)部鏈接,它使用戶可以方便地回到上一層結(jié)構(gòu)中的網(wǎng)頁或者主頁。大多數(shù)面包屑導(dǎo)航通常會從最具概括性的頁面開始(通常是主頁),越往右指向的頁面內(nèi)容越具體。

 
六、圖片alt屬性
 
定義:是一個用于網(wǎng)頁語言HTML和XHTML、為輸出純文字的參數(shù)屬性。它的作用是當HTML元素本身的物件無法被渲染時,就顯示alt(替換)文字作為一種補救措施。當圖片因為一些原因不能夠顯示的時候,alt 屬性使您可以指定供替換顯示的文字。
 
為什么使用這個屬性呢?如果一個用戶在瀏覽您的網(wǎng)站的時候使用的瀏覽器不支持圖片,或者用戶在使用一些類似于屏幕閱讀器的設(shè)備時,alt 屬性的內(nèi)容就可以提供關(guān)于圖片的信息。
 
除此之外,使用alt屬性還有另一個原因。如果您把一張圖片作為一個鏈接,此時這個圖片的alt屬性就能起到與文本鏈接的錨文本相同的作用。

 
七、錨文本Anchor Text
 
定義:就是鏈接文本,是鏈接的一種形式,即是鏈接上可以被點擊的文字。錨文本可以做為錨文本所在頁面內(nèi)容的評估。正常來講,頁面中增加的鏈接都會和頁面本身的內(nèi)容有一定的關(guān)系。

 
八、Heading標簽
 
定義:Heading標簽也叫做H標簽,HTML語言里一共有六種大小的heading 標簽,從最重要的到,網(wǎng)頁權(quán)重依次降低。是網(wǎng)頁html中對文本標題所進行的著重強調(diào)的一種標簽。

 
九、Http狀態(tài)碼
 
301:(永久移動)請求的網(wǎng)頁已永久移動到新位置。服務(wù)器返回此響應(yīng)(對 GET 或 HEAD 請求的響應(yīng))時,會自動將請求者轉(zhuǎn)到新位置。
 
302:代表暫時性轉(zhuǎn)移(Temporarily Moved)。
 
403:資源不可用。服務(wù)器理解客戶的請求,但拒絕處理它。通常由于服務(wù)器上文件或目錄的權(quán)限設(shè)置導(dǎo)致,比如IIS或者apache設(shè)置了訪問權(quán)限不當。
 
404:請求失敗,請求所希望得到的資源未被在服務(wù)器上發(fā)現(xiàn)。404這個狀態(tài)碼被廣泛應(yīng)用于當服務(wù)器不想揭示到底為何請求被拒絕或者沒有其他適合的響應(yīng)可用的情況下。出現(xiàn)這個錯誤的最有可能的原因是服務(wù)器端沒有這個頁面。