|
2#

樓主 |
發(fā)表于 2021-2-7 00:29:41
|
只看該作者
Google 搜索的工作方式
Google 的工作方式是什么?下文將依次提供簡要版和詳盡版的回答。 Google 會從很多不同的來源獲取信息,包括: - 網(wǎng)頁;
- 用戶提交的內(nèi)容,例如“Google 我的商家”和地圖用戶提交的內(nèi)容;
- 圖書掃描;
- 互聯(lián)網(wǎng)上的公共數(shù)據(jù)庫;
- 以及許多其他來源。
但是,此頁面內(nèi)容將重點介紹 Google 如何通過網(wǎng)頁獲取信息。 簡要版Google 按照以下三個基本步驟來生成基于網(wǎng)頁的結(jié)果: 抓取第一步是找出網(wǎng)絡(luò)上存在哪些網(wǎng)頁。不存在包含所有網(wǎng)頁的中央注冊表,因此 Google 必須不斷搜索新網(wǎng)頁并將其添加到已知網(wǎng)頁列表中。由于 Google 之前已經(jīng)訪問過某些網(wǎng)頁,因此這些網(wǎng)頁是 Google 已知的網(wǎng)頁。當跟蹤已知網(wǎng)頁上指向新網(wǎng)頁的鏈接時,Google 會發(fā)現(xiàn)其他網(wǎng)頁。當網(wǎng)站所有者以列表形式([color=var(--devsite-link-color,#1a73e8)] 站點地圖)提交一系列網(wǎng)頁供 Google 抓取時,Google 也會發(fā)現(xiàn)其他網(wǎng)頁。如果您使用受管的網(wǎng)站托管服務(wù),如 Wix 或 Blogger,這些服務(wù)可能會讓 Google 抓取您更新后的網(wǎng)頁或添加的新網(wǎng)頁。 Google 發(fā)現(xiàn)網(wǎng)頁網(wǎng)址后,會訪問或抓取該網(wǎng)頁以了解其中的內(nèi)容。Google 會呈現(xiàn)該網(wǎng)頁,并分析文字和非文字內(nèi)容以及整體視覺布局,確定該網(wǎng)頁應(yīng)顯示在搜索結(jié)果中的什么位置。Google 越了解您的網(wǎng)站,就越能準確地將您的網(wǎng)站與正在查找您內(nèi)容的用戶相匹配。 如何改善網(wǎng)站抓取效果: - 驗證 Google 能否訪問您網(wǎng)站上的網(wǎng)頁,以及這些網(wǎng)頁看起來是否正確。確保 Google 能以匿名用戶(沒有密碼和信息的用戶)的身份訪問網(wǎng)頁。Google 還應(yīng)該能夠查看該網(wǎng)頁的所有圖片和其他元素,以便能夠正確了解該網(wǎng)頁。您可以在[color=var(--devsite-link-color,#1a73e8)]移動設(shè)備適合性測試工具
中輸入網(wǎng)頁網(wǎng)址快速檢查網(wǎng)頁。如果您創(chuàng)建或更新了單個網(wǎng)頁,您可以[color=var(--devsite-link-color,#1a73e8)]向 Google 提交具體網(wǎng)址。如需讓 Google 同時了解多個新網(wǎng)頁或更新后的網(wǎng)頁,您可以使用[color=var(--devsite-link-color,#1a73e8)]站點地圖。如果您想讓 Google 只抓取 1 個網(wǎng)頁,請將該網(wǎng)頁設(shè)為首頁。在 Google 看來,您的首頁就是您網(wǎng)站上最重要的網(wǎng)頁。為促成完整網(wǎng)站抓取,請確保您的首頁(以及所有網(wǎng)頁)包含一個良好的網(wǎng)站導(dǎo)航系統(tǒng),能鏈接到您網(wǎng)站上的所有重要版塊和網(wǎng)頁。這會有助于用戶(和 Google)在您的網(wǎng)站上找到所需內(nèi)容。對于小型網(wǎng)站(少于 1000 個網(wǎng)頁),只需讓 Google 知道您的首頁即可,前提是 Google 可以通過從首頁開始的鏈接路徑訪問所有其他網(wǎng)頁。將您的網(wǎng)頁鏈接到 Google 已知的其他網(wǎng)頁。但是,請務(wù)必注意,Google 不會跟蹤廣告中的鏈接、其他網(wǎng)站中由您付費的鏈接、評論中的鏈接或其他未遵循 [color=var(--devsite-link-color,#1a73e8)]Google 網(wǎng)站站長指南的鏈接。
您無法通過向 Google 付費來提高網(wǎng)站抓取頻率或網(wǎng)站排名。任何關(guān)于 Google 會在收取費用后提高網(wǎng)站抓取頻率的消息均是子虛烏有。
編入索引發(fā)現(xiàn)網(wǎng)頁后,Google 會嘗試了解該網(wǎng)頁的內(nèi)容。此過程稱為“編入索引”。Google 會分析該網(wǎng)頁的內(nèi)容、為網(wǎng)頁上嵌入的圖片和視頻文件編制目錄,并通過其他方式嘗試了解網(wǎng)頁。這些信息存儲在 Google 索引中,而 Google 索引是一個存儲在很多很多計算機中的巨大數(shù)據(jù)庫。 如何改善網(wǎng)頁索引編制效果: - 制作簡短且有意義的網(wǎng)頁標題。
- 使用傳達網(wǎng)頁主題的網(wǎng)頁標題。
- 使用文字(而非圖片)傳達內(nèi)容。(盡管 Google 能夠理解一些圖片和視頻,但相比圖片和視頻,文字更易于理解。請至少使用替代文本和其他屬性為[color=var(--devsite-link-color,#1a73e8)]視頻和[color=var(--devsite-link-color,#1a73e8)]圖片添加適當?shù)淖⑨尅#?br />
呈現(xiàn)(和排名)當用戶輸入查詢時,Google 會根據(jù)許多因素嘗試從其索引中找到最相關(guān)的答案。Google 會努力確定最優(yōu)質(zhì)的答案,并會考慮其他因素(例如,考慮用戶所在位置、使用的語言及設(shè)備(桌面設(shè)備或手機)等因素),以便提供最佳用戶體驗和最恰當?shù)拇鸢浮@纾谟脩羲阉鳌白孕熊嚲S修店”后,Google 向巴黎用戶顯示的答案與向香港用戶顯示的答案有所不同。Google 不會通過收取費用來提高網(wǎng)頁排名,網(wǎng)頁排名是以編程方式完成的。 要改善您的網(wǎng)頁呈現(xiàn)和排名效果,請注意以下事項: 詳盡版想要了解更多信息?下文是: [url=]詳盡版[/url]抓取抓取是指 [color=var(--devsite-link-color,#1a73e8)] Googlebot 訪問要添加到 Google 索引中的新網(wǎng)頁和更新后的網(wǎng)頁的過程。 我們使用大量計算機提取(或“抓取”)網(wǎng)絡(luò)上的數(shù)十億個網(wǎng)頁。執(zhí)行抓取任務(wù)的程序叫做 Googlebot(也稱為漫游器或“蜘蛛”程序)。Googlebot 使用算法流程確定要抓取的網(wǎng)站、抓取頻率以及要從每個網(wǎng)站抓取的網(wǎng)頁數(shù)量。 Google 首先會根據(jù)一份網(wǎng)頁網(wǎng)址列表開始其抓取過程,該列表是在之前進行的抓取過程中生成的,且隨著網(wǎng)站所有者所提供的站點地圖數(shù)據(jù)的增多而不斷擴大。Googlebot 在訪問某個網(wǎng)頁時,會查找該網(wǎng)頁上的鏈接,并將這些鏈接添加到它要抓取的網(wǎng)頁的列表中。它會記錄新建立的網(wǎng)站、對現(xiàn)有網(wǎng)站進行的更改以及無效鏈接,并據(jù)此更新 Google 索引。 在抓取過程中,Google 會使用 Chrome 的最新版本呈現(xiàn)網(wǎng)頁。在呈現(xiàn)過程中,它會運行找到的所有網(wǎng)頁腳本。如果您的網(wǎng)站使用動態(tài)生成的內(nèi)容,請務(wù)必[color=var(--devsite-link-color,#1a73e8)] 遵循 JavaScript SEO 基礎(chǔ)知識頁面上的要求。 主要抓取/輔助抓取
Google 使用兩種不同的抓取工具抓取網(wǎng)站:移動版抓取工具和桌面版抓取工具。每種抓取工具類型都會使用該類型的設(shè)備模擬訪問您網(wǎng)頁的用戶。 Google 使用 1 種抓取工具類型(移動版或桌面版)作為網(wǎng)站的主要抓取工具。網(wǎng)站上被 Google 抓取的所有網(wǎng)頁都是使用主要抓取工具抓取的。對所有新網(wǎng)站使用的主要抓取工具都是移動版抓取工具。 此外,Google 還會使用其他類型的抓取工具(移動版或桌面版)重新抓取網(wǎng)站上的一些網(wǎng)頁。這稱為輔助抓取,目的在于了解其他設(shè)備類型對您網(wǎng)站的適用情況。
Google 如何得知哪些網(wǎng)頁無法抓取?- robots.txt 中屏蔽的網(wǎng)頁無法抓取,但如果這些網(wǎng)頁鏈接到其他網(wǎng)頁,系統(tǒng)仍可能會將其編入索引。(Google 可以通過指向相應(yīng)網(wǎng)頁的鏈接來推斷頁面內(nèi)容,并且在不解析其內(nèi)容的情況下將相應(yīng)網(wǎng)頁編入索引。)
- Google 無法抓取任何匿名用戶無法訪問的網(wǎng)頁。因此,任何登錄或其他授權(quán)防護措施都將阻止 Google 抓取網(wǎng)頁。
- Google 不會頻繁地抓取先前已被抓取且被視為[color=var(--devsite-link-color,#1a73e8)]與其他網(wǎng)頁重復(fù)的網(wǎng)頁。
改善抓取質(zhì)量利用以下這些技術(shù)幫助 Google 發(fā)現(xiàn)您網(wǎng)站上正確的網(wǎng)頁: - [color=var(--devsite-link-color,#1a73e8)]提交站點地圖。
- [color=var(--devsite-link-color,#1a73e8)]提交單個網(wǎng)頁的抓取請求。
- 針對網(wǎng)頁使用[color=var(--devsite-link-color,#1a73e8)]簡單易懂的邏輯網(wǎng)址路徑,并在網(wǎng)站中提供清晰直接的內(nèi)部鏈接。
- 如果您在網(wǎng)站上使用網(wǎng)址參數(shù)進行導(dǎo)航,例如,如果您在全球購物網(wǎng)站上指明用戶所在的國家/地區(qū),請[color=var(--devsite-link-color,#1a73e8)]使用網(wǎng)址參數(shù)工具告知 Google 關(guān)于重要參數(shù)的信息。
- 謹慎使用 robots.txt:使用 robots.txt 指明您希望 Google 優(yōu)先了解或抓取哪些網(wǎng)頁,從而降低服務(wù)器負載,請勿將其作為阻止材料出現(xiàn)在 Google 索引中的方法。
- 使用 [color=var(--devsite-link-color,#1a73e8)]hreflang 指向其他語言版本的網(wǎng)頁。
- 明確指出[color=var(--devsite-link-color,#1a73e8)]規(guī)范網(wǎng)頁和備用網(wǎng)頁。
- 通過[color=var(--devsite-link-color,#1a73e8)]“索引涵蓋范圍”報告查看您的抓取和索引涵蓋范圍。
- 確保 Google 可以訪問主要網(wǎng)頁以及正確呈現(xiàn)網(wǎng)頁所需的重要資源(圖片、CSS 文件、腳本)。
- 用[color=var(--devsite-link-color,#1a73e8)]網(wǎng)址檢查工具檢查實際網(wǎng)頁,確認 Google 可以正常訪問并呈現(xiàn)您的網(wǎng)頁。
編入索引Googlebot 會處理它抓取的每個網(wǎng)頁,以便了解每個網(wǎng)頁的內(nèi)容。這包括處理文字內(nèi)容、關(guān)鍵內(nèi)容標記和屬性,例如 <title> 標記和 Alt 屬性、圖片、視頻等。Googlebot 可處理多種類型的內(nèi)容,但并不是所有類型的內(nèi)容都能處理。例如,我們無法處理某些富媒體文件的內(nèi)容。 在抓取和編入索引的間隙,Google 會確定網(wǎng)頁是否是另一網(wǎng)頁的[color=var(--devsite-link-color,#1a73e8)] 重復(fù)網(wǎng)頁或規(guī)范網(wǎng)頁。如果該網(wǎng)頁被視為重復(fù)網(wǎng)頁,Google 便不會頻繁地抓取它。類似網(wǎng)頁會歸入一個文檔中,其中列出了一個或多個網(wǎng)頁,包括規(guī)范網(wǎng)頁(這組網(wǎng)頁中最具代表性的網(wǎng)頁)和找到的所有重復(fù)網(wǎng)頁(可能只是訪問同一網(wǎng)頁的備用網(wǎng)址,或者可能是同一網(wǎng)頁的備用移動版或桌面版)。 請注意,Google 不會將包含 [color=var(--devsite-link-color,#1a73e8)] noindex 指令(標頭或標記)的網(wǎng)頁編入索引。但前提是 Google 必須能夠看到該指令;如果網(wǎng)頁被 [color=var(--devsite-link-color,#1a73e8)] robots.txt 文件、登錄頁或其他設(shè)備屏蔽了,那么即使 Google 并未訪問該網(wǎng)頁,也可能會將其編入索引! 改善編入索引的效果您可以通過多種技巧使 Google 更加了解您的網(wǎng)頁內(nèi)容: - 使用 [color=var(--devsite-link-color,#1a73e8)]noindex 阻止 Google 抓取或找到您要隱藏的網(wǎng)頁。請勿對 robots.txt 屏蔽的網(wǎng)頁添加“noindex”;如果您這樣做,Google 將看不見“noindex”指令并且仍會將該網(wǎng)頁編入索引。
- [color=var(--devsite-link-color,#1a73e8)]使用結(jié)構(gòu)化數(shù)據(jù)。
- 遵循 [color=var(--devsite-link-color,#1a73e8)]Google 網(wǎng)站站長指南。
- 查看 [color=var(--devsite-link-color,#1a73e8)]SEO 新手指南和[color=var(--devsite-link-color,#1a73e8)]高級用戶指南,了解更多提示。
什么是“文檔”? Google 在內(nèi)部將網(wǎng)頁表示為大量文檔。每個文檔都表示一個或多個網(wǎng)頁。這些網(wǎng)頁完全相同或非常相似但本質(zhì)上內(nèi)容相同,可以通過不同網(wǎng)址訪問。文檔中的不同網(wǎng)址可能會指向完全相同的網(wǎng)頁(例如,example.com/dresses/summer/1234 和 example.com?product=1234 可能會顯示同一網(wǎng)頁),或同一網(wǎng)頁對使用不同設(shè)備的用戶來說具有細微差別(例如,example.com/mypage 適合桌面設(shè)備用戶,m.example.com/mypage 適合移動設(shè)備用戶)。 Google 會從文檔中選擇 1 個網(wǎng)址,并將其定義為該文檔的 規(guī)范網(wǎng)址。文檔的規(guī)范網(wǎng)址是 Google 最常抓取和編入索引的網(wǎng)址;其他網(wǎng)址會被視為重復(fù)網(wǎng)址或備用網(wǎng)址,并且 可能會偶爾被抓取,或根據(jù)用戶請求將其作為結(jié)果呈現(xiàn):例如,如果文檔的規(guī)范網(wǎng)址是移動網(wǎng)址,Google 仍可能會為用桌面設(shè)備搜索的用戶提供桌面(備用)網(wǎng)址。 Search Console 中的大多數(shù)報告都會將數(shù)據(jù)歸到文檔的規(guī)范網(wǎng)址名下。某些工具(例如網(wǎng)址檢查工具)支持測試備用網(wǎng)址,但檢查規(guī)范網(wǎng)址也應(yīng)提供有關(guān)備用網(wǎng)址的信息。 下面簡要說明了這些術(shù)語,以及這些術(shù)語在 Search Console 中的用法: - 文檔:一個類似網(wǎng)頁的集合。包含規(guī)范網(wǎng)址,如果您的網(wǎng)站有重復(fù)網(wǎng)頁,還包含備用網(wǎng)址。文檔中的網(wǎng)址可能來自相同或不同的組織(根域名,例如 www.google.com 中的“google”)。Google 會根據(jù)平臺(移動設(shè)備/桌面設(shè)備)、用戶語言‡或地理位置以及多個其他變量,選擇要顯示在搜索結(jié)果中的最佳網(wǎng)址。Google 會通過自然抓取或網(wǎng)站實現(xiàn)的功能發(fā)現(xiàn)網(wǎng)站上的相關(guān)網(wǎng)頁,這些功能包括重定向或 <link rel=alternate/canonical> 標記。其他組織的相關(guān)網(wǎng)頁只有在您網(wǎng)站通過重定向或鏈接標記明確編碼的情況下才會被標記為備用網(wǎng)頁。
- 網(wǎng)址:用于訪問網(wǎng)站上指定內(nèi)容的網(wǎng)址。網(wǎng)站可能會將不同網(wǎng)址解析為指向同一網(wǎng)頁。
- 網(wǎng)頁:通過一個或多個網(wǎng)址訪問的指定網(wǎng)頁。網(wǎng)頁可能有不同的版本,具體取決于用戶的平臺(移動設(shè)備、桌面設(shè)備、平板電腦等)。
- 版本:網(wǎng)頁的一個變體,通常分為“移動版”、“桌面版”和“AMP”(但 AMP 網(wǎng)頁本身可以有移動版和桌面版)。每個版本都可以有不同網(wǎng)址(example.com 與 m.example.com)或相同網(wǎng)址(如果您的網(wǎng)站動態(tài)提供內(nèi)容或使用自適應(yīng)設(shè)計,那么同一網(wǎng)址可以顯示同一網(wǎng)頁的不同版本),具體取決于您的網(wǎng)站配置。語言變體不會被視為不同版本,而是被視為不同的文檔。
- 規(guī)范網(wǎng)頁或網(wǎng)址:Google 認為最能代表文檔的網(wǎng)址。Google 始終會抓取此網(wǎng)址,偶爾也會抓取文檔中的重復(fù)網(wǎng)址。
- 備用/重復(fù)網(wǎng)頁或網(wǎng)址:Google 可能會偶爾抓取的文檔網(wǎng)址。如果這些網(wǎng)址適合用戶和請求,Google 也會呈現(xiàn)這些網(wǎng)址(例如,會為在桌面設(shè)備上提出請求的桌面設(shè)備用戶提供備用網(wǎng)址,而不是規(guī)范移動網(wǎng)址)。
- 網(wǎng)站 (Site):通常用作網(wǎng)站 (website)(概念相關(guān)的一組網(wǎng)頁)的同義詞,但有時也可用作 Search Console 資源的同義詞,而實際上可以將資源定義為網(wǎng)站的一部分。網(wǎng)站可以跨子網(wǎng)域(甚至跨網(wǎng)域,如果具有正確關(guān)聯(lián)的 AMP 網(wǎng)頁的話)。
‡采用不同語言但具有相同內(nèi)容的網(wǎng)頁會存儲在不同文檔中,這些文檔使用 hreflang 標記相互引用;這就是為什么務(wù)必要用 hreflang 標記翻譯內(nèi)容的原因。
呈現(xiàn)結(jié)果用戶輸入查詢時,我們的機器會在索引中搜索匹配網(wǎng)頁,并返回我們認為與用戶搜索最相關(guān)的結(jié)果。相關(guān)性是由數(shù)百個因素決定的,我們一直在努力改進算法。Google 在選擇結(jié)果和對其進行排名時會考慮用戶體驗,因此請務(wù)必確保您的網(wǎng)頁能[color=var(--devsite-link-color,#1a73e8)] 快速加載且[color=var(--devsite-link-color,#1a73e8)] 適合移動設(shè)備。 改善結(jié)果呈現(xiàn)- 如果您的結(jié)果針對的是特定地點或使用特定語言的用戶,可以[color=var(--devsite-link-color,#1a73e8)]告知 Google 您的偏好。
- 確保您的網(wǎng)頁能[color=var(--devsite-link-color,#1a73e8)]快速加載且[color=var(--devsite-link-color,#1a73e8)]適合移動設(shè)備。
- 遵循[color=var(--devsite-link-color,#1a73e8)]網(wǎng)站站長指南,避免常見的潛在問題并提高網(wǎng)站排名。
- 考慮為您的網(wǎng)站[color=var(--devsite-link-color,#1a73e8)]實施搜索結(jié)果功能,例如食譜卡片或文章卡片。
- [color=var(--devsite-link-color,#1a73e8)]實施 AMP,以加快網(wǎng)頁在移動設(shè)備上的加載速度。某些 AMP 網(wǎng)頁也可以使用其他搜索功能,例如“焦點新聞”輪換展示。
- Google 的算法一直在不斷改進,您應(yīng)遵循我們的指南,努力創(chuàng)建符合用戶需求的精彩內(nèi)容,而不應(yīng)嘗試去猜測算法并根據(jù)算法來設(shè)計網(wǎng)頁。
|
|