中文搜索引擎指南網(wǎng)

 找回密碼
 禁止注冊

QQ登錄

只需一步,快速開始

搜索
查看: 16084|回復(fù): 2
打印 上一主題 下一主題

Google 搜索的工作方式(面向新手)

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
1#
發(fā)表于 2021-2-7 00:28:32 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
將網(wǎng)站納入到 Google 搜索結(jié)果中是完全免費的,且操作簡單;您甚至不需要向 Google 提交網(wǎng)站。

Google 是一個全自動搜索引擎,它會使用名為“網(wǎng)頁抓取工具”的軟件定期探索網(wǎng)絡(luò),以查找可向 Google 索引中添加的網(wǎng)站。實際上,Google 搜索結(jié)果中收錄的大多數(shù)網(wǎng)站都不是手動提交的,而是我們的網(wǎng)頁抓取工具在探索網(wǎng)絡(luò)時找到并自動添加的。

您可能無法從當前所在的區(qū)域訪問此資源。

Google 搜索的工作流程主要分為三個階段:

抓取:Google 會使用名為“抓取工具”的自動程序搜索網(wǎng)絡(luò),以查找新網(wǎng)頁或更新后的網(wǎng)頁。Google 會將這些網(wǎng)頁地址(或網(wǎng)頁網(wǎng)址)存儲在一個大列表中,以便日后查看。我們會通過許多不同的方法查找網(wǎng)頁,但主要方法是跟蹤我們已知的網(wǎng)頁中的鏈接。

編入索引:Google 會訪問它通過抓取得知的網(wǎng)頁,并會嘗試分析每個網(wǎng)頁的主題。Google 會分析網(wǎng)頁中的內(nèi)容、圖片和視頻文件,嘗試了解網(wǎng)頁的主題。這些信息存儲在 Google 索引中,而 Google 索引是一個存儲在很多很多計算機中的巨大數(shù)據(jù)庫。

呈現(xiàn)搜索結(jié)果:當用戶執(zhí)行 Google 搜索時,Google 會嘗試確定最優(yōu)質(zhì)的搜索結(jié)果。“最佳”結(jié)果取決于許多因素,包括用戶的位置、語言、設(shè)備(桌面設(shè)備或手機)以及先前用過的查詢。例如,在用戶搜索“自行車維修店”后,Google 向巴黎用戶顯示的答案與向香港用戶顯示的答案有所不同。Google 不會通過收取費用來提高網(wǎng)頁排名,網(wǎng)頁排名是完全依靠算法完成的。

如果您有興趣,不妨深入了解一下搜索的工作方式。
分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏
2#
 樓主| 發(fā)表于 2021-2-7 00:29:41 | 只看該作者
Google 搜索的工作方式

Google 的工作方式是什么?下文將依次提供簡要版和詳盡版的回答。
Google 會從很多不同的來源獲取信息,包括:
  • 網(wǎng)頁;
  • 用戶提交的內(nèi)容,例如“Google 我的商家”和地圖用戶提交的內(nèi)容;
  • 圖書掃描;
  • 互聯(lián)網(wǎng)上的公共數(shù)據(jù)庫;
  • 以及許多其他來源。
但是,此頁面內(nèi)容將重點介紹 Google 如何通過網(wǎng)頁獲取信息。
簡要版
Google 按照以下三個基本步驟來生成基于網(wǎng)頁的結(jié)果:
抓取
第一步是找出網(wǎng)絡(luò)上存在哪些網(wǎng)頁。不存在包含所有網(wǎng)頁的中央注冊表,因此 Google 必須不斷搜索新網(wǎng)頁并將其添加到已知網(wǎng)頁列表中。由于 Google 之前已經(jīng)訪問過某些網(wǎng)頁,因此這些網(wǎng)頁是 Google 已知的網(wǎng)頁。當跟蹤已知網(wǎng)頁上指向新網(wǎng)頁的鏈接時,Google 會發(fā)現(xiàn)其他網(wǎng)頁。當網(wǎng)站所有者以列表形式([color=var(--devsite-link-color,#1a73e8)]站點地圖)提交一系列網(wǎng)頁供 Google 抓取時,Google 也會發(fā)現(xiàn)其他網(wǎng)頁。如果您使用受管的網(wǎng)站托管服務(wù),如 Wix 或 Blogger,這些服務(wù)可能會讓 Google 抓取您更新后的網(wǎng)頁或添加的新網(wǎng)頁。
Google 發(fā)現(xiàn)網(wǎng)頁網(wǎng)址后,會訪問或抓取該網(wǎng)頁以了解其中的內(nèi)容。Google 會呈現(xiàn)該網(wǎng)頁,并分析文字和非文字內(nèi)容以及整體視覺布局,確定該網(wǎng)頁應(yīng)顯示在搜索結(jié)果中的什么位置。Google 越了解您的網(wǎng)站,就越能準確地將您的網(wǎng)站與正在查找您內(nèi)容的用戶相匹配。
如何改善網(wǎng)站抓取效果:
  • 驗證 Google 能否訪問您網(wǎng)站上的網(wǎng)頁,以及這些網(wǎng)頁看起來是否正確。確保 Google 能以匿名用戶(沒有密碼和信息的用戶)的身份訪問網(wǎng)頁。Google 還應(yīng)該能夠查看該網(wǎng)頁的所有圖片和其他元素,以便能夠正確了解該網(wǎng)頁。您可以在[color=var(--devsite-link-color,#1a73e8)]移動設(shè)備適合性測試工具中輸入網(wǎng)頁網(wǎng)址快速檢查網(wǎng)頁。
  • 如果您創(chuàng)建或更新了單個網(wǎng)頁,您可以[color=var(--devsite-link-color,#1a73e8)]向 Google 提交具體網(wǎng)址。如需讓 Google 同時了解多個新網(wǎng)頁或更新后的網(wǎng)頁,您可以使用[color=var(--devsite-link-color,#1a73e8)]站點地圖
  • 如果您想讓 Google 只抓取 1 個網(wǎng)頁,請將該網(wǎng)頁設(shè)為首頁。在 Google 看來,您的首頁就是您網(wǎng)站上最重要的網(wǎng)頁。為促成完整網(wǎng)站抓取,請確保您的首頁(以及所有網(wǎng)頁)包含一個良好的網(wǎng)站導(dǎo)航系統(tǒng),能鏈接到您網(wǎng)站上的所有重要版塊和網(wǎng)頁。這會有助于用戶(和 Google)在您的網(wǎng)站上找到所需內(nèi)容。對于小型網(wǎng)站(少于 1000 個網(wǎng)頁),只需讓 Google 知道您的首頁即可,前提是 Google 可以通過從首頁開始的鏈接路徑訪問所有其他網(wǎng)頁。
  • 將您的網(wǎng)頁鏈接到 Google 已知的其他網(wǎng)頁。但是,請務(wù)必注意,Google 不會跟蹤廣告中的鏈接、其他網(wǎng)站中由您付費的鏈接、評論中的鏈接或其他未遵循 [color=var(--devsite-link-color,#1a73e8)]Google 網(wǎng)站站長指南的鏈接。
您無法通過向 Google 付費來提高網(wǎng)站抓取頻率或網(wǎng)站排名。任何關(guān)于 Google 會在收取費用后提高網(wǎng)站抓取頻率的消息均是子虛烏有。

編入索引
發(fā)現(xiàn)網(wǎng)頁后,Google 會嘗試了解該網(wǎng)頁的內(nèi)容。此過程稱為“編入索引”。Google 會分析該網(wǎng)頁的內(nèi)容、為網(wǎng)頁上嵌入的圖片和視頻文件編制目錄,并通過其他方式嘗試了解網(wǎng)頁。這些信息存儲在 Google 索引中,而 Google 索引是一個存儲在很多很多計算機中的巨大數(shù)據(jù)庫。
如何改善網(wǎng)頁索引編制效果:
  • 制作簡短且有意義的網(wǎng)頁標題。
  • 使用傳達網(wǎng)頁主題的網(wǎng)頁標題。
  • 使用文字(而非圖片)傳達內(nèi)容。(盡管 Google 能夠理解一些圖片和視頻,但相比圖片和視頻,文字更易于理解。請至少使用替代文本和其他屬性為[color=var(--devsite-link-color,#1a73e8)]視頻和[color=var(--devsite-link-color,#1a73e8)]圖片添加適當?shù)淖⑨尅#?br />
呈現(xiàn)(和排名)
當用戶輸入查詢時,Google 會根據(jù)許多因素嘗試從其索引中找到最相關(guān)的答案。Google 會努力確定最優(yōu)質(zhì)的答案,并會考慮其他因素(例如,考慮用戶所在位置、使用的語言及設(shè)備(桌面設(shè)備或手機)等因素),以便提供最佳用戶體驗和最恰當?shù)拇鸢浮@纾谟脩羲阉鳌白孕熊嚲S修店”后,Google 向巴黎用戶顯示的答案與向香港用戶顯示的答案有所不同。Google 不會通過收取費用來提高網(wǎng)頁排名,網(wǎng)頁排名是以編程方式完成的。
要改善您的網(wǎng)頁呈現(xiàn)和排名效果,請注意以下事項:
詳盡版
想要了解更多信息?下文是:
[url=]詳盡版[/url]抓取
抓取是指 [color=var(--devsite-link-color,#1a73e8)]Googlebot 訪問要添加到 Google 索引中的新網(wǎng)頁和更新后的網(wǎng)頁的過程。
我們使用大量計算機提取(或“抓取”)網(wǎng)絡(luò)上的數(shù)十億個網(wǎng)頁。執(zhí)行抓取任務(wù)的程序叫做 Googlebot(也稱為漫游器或“蜘蛛”程序)。Googlebot 使用算法流程確定要抓取的網(wǎng)站、抓取頻率以及要從每個網(wǎng)站抓取的網(wǎng)頁數(shù)量。
Google 首先會根據(jù)一份網(wǎng)頁網(wǎng)址列表開始其抓取過程,該列表是在之前進行的抓取過程中生成的,且隨著網(wǎng)站所有者所提供的站點地圖數(shù)據(jù)的增多而不斷擴大。Googlebot 在訪問某個網(wǎng)頁時,會查找該網(wǎng)頁上的鏈接,并將這些鏈接添加到它要抓取的網(wǎng)頁的列表中。它會記錄新建立的網(wǎng)站、對現(xiàn)有網(wǎng)站進行的更改以及無效鏈接,并據(jù)此更新 Google 索引。
在抓取過程中,Google 會使用 Chrome 的最新版本呈現(xiàn)網(wǎng)頁。在呈現(xiàn)過程中,它會運行找到的所有網(wǎng)頁腳本。如果您的網(wǎng)站使用動態(tài)生成的內(nèi)容,請務(wù)必[color=var(--devsite-link-color,#1a73e8)]遵循 JavaScript SEO 基礎(chǔ)知識頁面上的要求
主要抓取/輔助抓取
Google 使用兩種不同的抓取工具抓取網(wǎng)站:移動版抓取工具和桌面版抓取工具。每種抓取工具類型都會使用該類型的設(shè)備模擬訪問您網(wǎng)頁的用戶。
Google 使用 1 種抓取工具類型(移動版或桌面版)作為網(wǎng)站的主要抓取工具。網(wǎng)站上被 Google 抓取的所有網(wǎng)頁都是使用主要抓取工具抓取的。對所有新網(wǎng)站使用的主要抓取工具都是移動版抓取工具。
此外,Google 還會使用其他類型的抓取工具(移動版或桌面版)重新抓取網(wǎng)站上的一些網(wǎng)頁。這稱為輔助抓取,目的在于了解其他設(shè)備類型對您網(wǎng)站的適用情況。

Google 如何得知哪些網(wǎng)頁無法抓取?
  • robots.txt 中屏蔽的網(wǎng)頁無法抓取,但如果這些網(wǎng)頁鏈接到其他網(wǎng)頁,系統(tǒng)仍可能會將其編入索引。(Google 可以通過指向相應(yīng)網(wǎng)頁的鏈接來推斷頁面內(nèi)容,并且在不解析其內(nèi)容的情況下將相應(yīng)網(wǎng)頁編入索引。)
  • Google 無法抓取任何匿名用戶無法訪問的網(wǎng)頁。因此,任何登錄或其他授權(quán)防護措施都將阻止 Google 抓取網(wǎng)頁。
  • Google 不會頻繁地抓取先前已被抓取且被視為[color=var(--devsite-link-color,#1a73e8)]與其他網(wǎng)頁重復(fù)的網(wǎng)頁。
改善抓取質(zhì)量
利用以下這些技術(shù)幫助 Google 發(fā)現(xiàn)您網(wǎng)站上正確的網(wǎng)頁:
編入索引
Googlebot 會處理它抓取的每個網(wǎng)頁,以便了解每個網(wǎng)頁的內(nèi)容。這包括處理文字內(nèi)容、關(guān)鍵內(nèi)容標記和屬性,例如 <title> 標記和 Alt 屬性、圖片、視頻等。Googlebot 可處理多種類型的內(nèi)容,但并不是所有類型的內(nèi)容都能處理。例如,我們無法處理某些富媒體文件的內(nèi)容。
在抓取和編入索引的間隙,Google 會確定網(wǎng)頁是否是另一網(wǎng)頁的[color=var(--devsite-link-color,#1a73e8)]重復(fù)網(wǎng)頁或規(guī)范網(wǎng)頁。如果該網(wǎng)頁被視為重復(fù)網(wǎng)頁,Google 便不會頻繁地抓取它。類似網(wǎng)頁會歸入一個文檔中,其中列出了一個或多個網(wǎng)頁,包括規(guī)范網(wǎng)頁(這組網(wǎng)頁中最具代表性的網(wǎng)頁)和找到的所有重復(fù)網(wǎng)頁(可能只是訪問同一網(wǎng)頁的備用網(wǎng)址,或者可能是同一網(wǎng)頁的備用移動版或桌面版)。
請注意,Google 不會將包含 [color=var(--devsite-link-color,#1a73e8)]noindex 指令(標頭或標記)的網(wǎng)頁編入索引。但前提是 Google 必須能夠看到該指令;如果網(wǎng)頁被 [color=var(--devsite-link-color,#1a73e8)]robots.txt 文件、登錄頁或其他設(shè)備屏蔽了,那么即使 Google 并未訪問該網(wǎng)頁,也可能會將其編入索引!
改善編入索引的效果
您可以通過多種技巧使 Google 更加了解您的網(wǎng)頁內(nèi)容:
  • 使用 [color=var(--devsite-link-color,#1a73e8)]noindex 阻止 Google 抓取或找到您要隱藏的網(wǎng)頁。請勿對 robots.txt 屏蔽的網(wǎng)頁添加“noindex”;如果您這樣做,Google 將看不見“noindex”指令并且仍會將該網(wǎng)頁編入索引。
  • [color=var(--devsite-link-color,#1a73e8)]使用結(jié)構(gòu)化數(shù)據(jù)
  • 遵循 [color=var(--devsite-link-color,#1a73e8)]Google 網(wǎng)站站長指南
  • 查看 [color=var(--devsite-link-color,#1a73e8)]SEO 新手指南和[color=var(--devsite-link-color,#1a73e8)]高級用戶指南,了解更多提示。
什么是“文檔”?
Google 在內(nèi)部將網(wǎng)頁表示為大量文檔。每個文檔都表示一個或多個網(wǎng)頁。這些網(wǎng)頁完全相同或非常相似但本質(zhì)上內(nèi)容相同,可以通過不同網(wǎng)址訪問。文檔中的不同網(wǎng)址可能會指向完全相同的網(wǎng)頁(例如,example.com/dresses/summer/1234 和 example.com?product=1234 可能會顯示同一網(wǎng)頁),或同一網(wǎng)頁對使用不同設(shè)備的用戶來說具有細微差別(例如,example.com/mypage 適合桌面設(shè)備用戶,m.example.com/mypage 適合移動設(shè)備用戶)。
Google 會從文檔中選擇 1 個網(wǎng)址,并將其定義為該文檔的規(guī)范網(wǎng)址。文檔的規(guī)范網(wǎng)址是 Google 最常抓取和編入索引的網(wǎng)址;其他網(wǎng)址會被視為重復(fù)網(wǎng)址或備用網(wǎng)址,并且可能會偶爾被抓取,或根據(jù)用戶請求將其作為結(jié)果呈現(xiàn):例如,如果文檔的規(guī)范網(wǎng)址是移動網(wǎng)址,Google 仍可能會為用桌面設(shè)備搜索的用戶提供桌面(備用)網(wǎng)址。
Search Console 中的大多數(shù)報告都會將數(shù)據(jù)歸到文檔的規(guī)范網(wǎng)址名下。某些工具(例如網(wǎng)址檢查工具)支持測試備用網(wǎng)址,但檢查規(guī)范網(wǎng)址也應(yīng)提供有關(guān)備用網(wǎng)址的信息。
您可以告知 Google 您希望哪個網(wǎng)址是規(guī)范網(wǎng)址,但 Google 仍可能會因各種原因而選擇其他網(wǎng)址作為規(guī)范網(wǎng)址。
下面簡要說明了這些術(shù)語,以及這些術(shù)語在 Search Console 中的用法:
  • 文檔:一個類似網(wǎng)頁的集合。包含規(guī)范網(wǎng)址,如果您的網(wǎng)站有重復(fù)網(wǎng)頁,還包含備用網(wǎng)址。文檔中的網(wǎng)址可能來自相同或不同的組織(根域名,例如 www.google.com 中的“google”)。Google 會根據(jù)平臺(移動設(shè)備/桌面設(shè)備)、用戶語言‡或地理位置以及多個其他變量,選擇要顯示在搜索結(jié)果中的最佳網(wǎng)址。Google 會通過自然抓取或網(wǎng)站實現(xiàn)的功能發(fā)現(xiàn)網(wǎng)站上的相關(guān)網(wǎng)頁,這些功能包括重定向或 <link rel=alternate/canonical> 標記。其他組織的相關(guān)網(wǎng)頁只有在您網(wǎng)站通過重定向或鏈接標記明確編碼的情況下才會被標記為備用網(wǎng)頁。
  • 網(wǎng)址:用于訪問網(wǎng)站上指定內(nèi)容的網(wǎng)址。網(wǎng)站可能會將不同網(wǎng)址解析為指向同一網(wǎng)頁。
  • 網(wǎng)頁:通過一個或多個網(wǎng)址訪問的指定網(wǎng)頁。網(wǎng)頁可能有不同的版本,具體取決于用戶的平臺(移動設(shè)備、桌面設(shè)備、平板電腦等)。
  • 版本:網(wǎng)頁的一個變體,通常分為“移動版”、“桌面版”和“AMP”(但 AMP 網(wǎng)頁本身可以有移動版和桌面版)。每個版本都可以有不同網(wǎng)址(example.com 與 m.example.com)或相同網(wǎng)址(如果您的網(wǎng)站動態(tài)提供內(nèi)容或使用自適應(yīng)設(shè)計,那么同一網(wǎng)址可以顯示同一網(wǎng)頁的不同版本),具體取決于您的網(wǎng)站配置。語言變體不會被視為不同版本,而是被視為不同的文檔。
  • 規(guī)范網(wǎng)頁或網(wǎng)址:Google 認為最能代表文檔的網(wǎng)址。Google 始終會抓取此網(wǎng)址,偶爾也會抓取文檔中的重復(fù)網(wǎng)址。
  • 備用/重復(fù)網(wǎng)頁或網(wǎng)址:Google 可能會偶爾抓取的文檔網(wǎng)址。如果這些網(wǎng)址適合用戶和請求,Google 也會呈現(xiàn)這些網(wǎng)址(例如,會為在桌面設(shè)備上提出請求的桌面設(shè)備用戶提供備用網(wǎng)址,而不是規(guī)范移動網(wǎng)址)。
  • 網(wǎng)站 (Site):通常用作網(wǎng)站 (website)(概念相關(guān)的一組網(wǎng)頁)的同義詞,但有時也可用作 Search Console 資源的同義詞,而實際上可以將資源定義為網(wǎng)站的一部分。網(wǎng)站可以跨子網(wǎng)域(甚至跨網(wǎng)域,如果具有正確關(guān)聯(lián)的 AMP 網(wǎng)頁的話)。
‡采用不同語言但具有相同內(nèi)容的網(wǎng)頁會存儲在不同文檔中,這些文檔使用 hreflang 標記相互引用;這就是為什么務(wù)必要用 hreflang 標記翻譯內(nèi)容的原因。

呈現(xiàn)結(jié)果
用戶輸入查詢時,我們的機器會在索引中搜索匹配網(wǎng)頁,并返回我們認為與用戶搜索最相關(guān)的結(jié)果。相關(guān)性是由數(shù)百個因素決定的,我們一直在努力改進算法。Google 在選擇結(jié)果和對其進行排名時會考慮用戶體驗,因此請務(wù)必確保您的網(wǎng)頁能[color=var(--devsite-link-color,#1a73e8)]快速加載且[color=var(--devsite-link-color,#1a73e8)]適合移動設(shè)備
改善結(jié)果呈現(xiàn)
  • 如果您的結(jié)果針對的是特定地點或使用特定語言的用戶,可以[color=var(--devsite-link-color,#1a73e8)]告知 Google 您的偏好
  • 確保您的網(wǎng)頁能[color=var(--devsite-link-color,#1a73e8)]快速加載且[color=var(--devsite-link-color,#1a73e8)]適合移動設(shè)備
  • 遵循[color=var(--devsite-link-color,#1a73e8)]網(wǎng)站站長指南,避免常見的潛在問題并提高網(wǎng)站排名。
  • 考慮為您的網(wǎng)站[color=var(--devsite-link-color,#1a73e8)]實施搜索結(jié)果功能,例如食譜卡片或文章卡片。
  • [color=var(--devsite-link-color,#1a73e8)]實施 AMP,以加快網(wǎng)頁在移動設(shè)備上的加載速度。某些 AMP 網(wǎng)頁也可以使用其他搜索功能,例如“焦點新聞”輪換展示。
  • Google 的算法一直在不斷改進,您應(yīng)遵循我們的指南,努力創(chuàng)建符合用戶需求的精彩內(nèi)容,而不應(yīng)嘗試去猜測算法并根據(jù)算法來設(shè)計網(wǎng)頁。







回復(fù)

使用道具 舉報

3#
 樓主| 發(fā)表于 2021-2-7 00:31:07 | 只看該作者
Google 搜索的運作方式
https://www.google.com/search/howsearchworks/

您每次進行搜索時,都會在搜索結(jié)果中看到成千上萬個含有實用信息的網(wǎng)頁,有時甚至是數(shù)百萬個。早在您輸入搜索內(nèi)容之前,Google 就已開始算計要顯示哪些結(jié)果,并秉持向您提供最佳信息的承諾。


整合網(wǎng)上內(nèi)容
早在您開始搜索之前,Google 便已將有關(guān)網(wǎng)頁的信息整合在 Google 搜索索引中。該索引就像是一個圖書館,只不過它包含的信息比全世界所有圖書館加起來的信息還要多。


瞬間即可提供與您的搜索查詢相符的結(jié)果
Google 的搜索算法會對 Google 搜索索引中數(shù)以千億的網(wǎng)頁進行整理,以便根據(jù)您查詢的內(nèi)容為您提供最相關(guān)、最實用的結(jié)果,而且整個過程瞬間即可完成。

以實用方式顯示搜索結(jié)果
為了協(xié)助您快速找到所需內(nèi)容,Google 會以多種實用格式提供搜索結(jié)果,其中包括圖片、視頻、故事、包含路線的地圖等格式。與此同時,我們?nèi)栽诓粩喔倪M搜索服務(wù),以便推出更多新方式來提供相關(guān)信息。

我們只銷售廣告,不銷售搜索結(jié)果
雖然廣告主可以通過付費使廣告顯示在頁面中的醒目位置,但任何人都無法通過付費在搜索結(jié)果中獲得更高的排名。

不斷改善您的搜索體驗
我們知道 Google 搜索始終有可以改進的空間。因此,Google 工程師每天都會對其進行測試,每年都會進行數(shù)十萬次實驗,并做出數(shù)千項改進。


回復(fù)

使用道具 舉報

Archiver|手機版|小黑屋|教你搜 ( 魯ICP備16006309號

GMT+8, 2025-7-28 23:45 , Processed in 0.218439 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復(fù) 返回頂部 返回列表