中文搜索引擎指南網(wǎng)

 找回密碼
 禁止注冊

QQ登錄

只需一步,快速開始

搜索
查看: 14270|回復(fù): 5
打印 上一主題 下一主題

Google 搜索算法的工作方式

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
1#
發(fā)表于 2021-2-19 00:28:32 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
網(wǎng)絡(luò)上的信息繁多龐雜,如果不借助一些服務(wù)對信息進行整理和排序,要找到您需要的內(nèi)容會如同大海撈針。

Google 排名系統(tǒng)旨在實現(xiàn)這一目標:它們會對 Google 搜索索引中的數(shù)千億個網(wǎng)頁進行整理和排序,以便瞬間找出最相關(guān)、最實用的結(jié)果,并將這些結(jié)果以一種有助于您查找所需內(nèi)容的方式呈現(xiàn)出來。

這些排名系統(tǒng)由一系列算法組成,而不是一個算法。為了向您提供最實用的信息,Google 搜索算法會考慮很多因素,包括您查詢的字詞、網(wǎng)頁的相關(guān)性和可用性、來源的專業(yè)度,以及您所在的位置和您采用的設(shè)置。系統(tǒng)為每個因素賦予的權(quán)重因查詢的性質(zhì)而異,例如,與字典定義的查詢結(jié)果相比,對于時事新聞主題的查詢結(jié)果,內(nèi)容的新鮮度更加重要。

為了協(xié)助確保 Google 搜索算法符合嚴苛的相關(guān)性和質(zhì)量標準,Google制定了嚴格的流程,不僅展開現(xiàn)場測試,更有數(shù)千位來自世界各地訓(xùn)練有素的外部 Google 搜索質(zhì)量評分者參與評估。這些質(zhì)量評分者會遵循嚴格的指南,該指南明確指出了 Google 搜索算法的目標,可供所有人查看。
分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏
2#
 樓主| 發(fā)表于 2021-2-19 00:29:20 | 只看該作者
分析您的字詞

理解搜索字詞的含義對于返回優(yōu)質(zhì)結(jié)果至關(guān)重要。因此,為了找到包含相關(guān)信息的頁面,Google 的第一步就是分析您的搜索查詢中的字詞的含義。我們創(chuàng)建了語言模型,試圖了解應(yīng)該使用關(guān)鍵詞的哪些部分在索引中進行查詢。

這會涉及到看起來如同解析拼寫錯誤一樣簡單的步驟,并會擴展到通過將自然語言理解方面的部分最新研究成果付諸應(yīng)用來嘗試理解您輸入的查詢的類型。例如,即便一個字詞有多種定義,Google 的同義詞系統(tǒng)也能幫助 Google 搜索理解您的意思。該系統(tǒng)的開發(fā)過程歷時超 5 年,大幅改善了超過 30% 的搜索的結(jié)果(涵蓋各種語言)。

Google還會嘗試理解您要尋找的信息所屬的類別。是非常具體的搜索還是寬泛的查詢?是否存在“審核”、“照片”或“營業(yè)時間”等能夠表明搜索所蘊含的具體信息需求的字詞?您是否在搜索暗示您想查找當天所發(fā)布內(nèi)容的熱門關(guān)鍵字?或者,您是否在搜索附近的商家并需要獲得相關(guān)的本地信息?

對于這種查詢分類,一個非常重要的方面在于,Google會分析您的查詢,以確定您是不是想要獲取新鮮內(nèi)容。如果您搜索熱門關(guān)鍵字,我們的新鮮度算法會將其解讀為這樣一種信號:最新信息可能比日期較早的網(wǎng)頁更有用。也就是說,當您搜索最新的“中國男子籃球職業(yè)聯(lián)賽比分”、《星光大道》比賽結(jié)果或“中石油收益”時,您將會看到最新信息。
回復(fù)

使用道具 舉報

3#
 樓主| 發(fā)表于 2021-2-19 00:31:14 | 只看該作者
與您的搜索內(nèi)容相符


接下來,Google會尋找包含與相應(yīng)查詢匹配的信息的網(wǎng)頁。當您搜索時,在最基本的層面上,我們的算法會在索引中查詢您的搜索關(guān)鍵詞以找到適當?shù)木W(wǎng)頁。這些算法會分析相關(guān)關(guān)鍵字在某個網(wǎng)頁上(不論是在標題中還是在正文中)的出現(xiàn)頻率和顯示位置。

當某個網(wǎng)頁中包含與您的搜索查詢內(nèi)容相同的關(guān)鍵字時,這是表示搜索到的信息可能與您要查找的內(nèi)容相關(guān)的最基本信號。如果網(wǎng)頁或者文本的標題或正文中出現(xiàn)這些關(guān)鍵字,則表示該信息與您要查找的內(nèi)容相關(guān)的可能性更大了。除了簡單的關(guān)鍵字匹配之外,Google還使用經(jīng)過匯總和匿名化處理的互動數(shù)據(jù)來評估搜索結(jié)果是否與查詢內(nèi)容相關(guān)。Google會將這些數(shù)據(jù)轉(zhuǎn)換為信號,以協(xié)助我們的機器學(xué)習(xí)系統(tǒng)更好地評估相關(guān)性。


除了匹配關(guān)鍵字,Google的算法還會尋找線索來衡量潛在搜索結(jié)果能從多大程度上滿足用戶的搜索需求。當您搜索“狗”時,您想看到的應(yīng)該不是含有數(shù)百個“狗”字的網(wǎng)頁。Google會盡力確定網(wǎng)頁是否包含與您的查詢對應(yīng)的答案(而非只是重復(fù)您的查詢)。因此,Google 搜索算法會分析網(wǎng)頁是否包含相關(guān)內(nèi)容,例如狗的圖片、視頻,甚至是品種列表。最后,Google會檢查網(wǎng)頁所用的語言是否與您的查詢所用的語言相同,以便優(yōu)先顯示采用您的首選語言的網(wǎng)頁。

需要說明的是,盡管Google的系統(tǒng)確實會通過尋找這類可量化的信號來評估相關(guān)性,但并不會因此用于分析主觀觀念,例如分析網(wǎng)頁內(nèi)容的觀點或政治傾向。

回復(fù)

使用道具 舉報

4#
 樓主| 發(fā)表于 2021-2-19 00:32:03 | 只看該作者
為實用網(wǎng)頁排名

對于一項典型的查詢,含有可能相關(guān)的信息的網(wǎng)頁會多達數(shù)千個甚至數(shù)百萬個。因此,為了幫助將最符合需求的網(wǎng)頁排在靠前的位置,Google還編寫了算法來評估這些網(wǎng)頁的實用性。

這些算法會分析數(shù)百種不同的因素 - 從內(nèi)容的新鮮度,到您的搜索關(guān)鍵詞的出現(xiàn)次數(shù)以及網(wǎng)頁能否提供出色的用戶體驗 - 以盡力呈現(xiàn)網(wǎng)絡(luò)所能提供的最有用的信息。為了評估內(nèi)容在相關(guān)主題方面的可信度和權(quán)威性,我們會尋找那些看起來在類似查詢中受到大量用戶青睞的網(wǎng)站。如果與該主題相關(guān)的其他知名網(wǎng)站鏈接到了相應(yīng)頁面,則可充分說明此頁面上的信息具有較高的品質(zhì)。

網(wǎng)絡(luò)中有很多垃圾網(wǎng)站會試圖通過再三重復(fù)關(guān)鍵字或購買可提升 PageRank 的鏈接等各種不當手段,蒙混到搜索結(jié)果中靠前的位置。這些網(wǎng)站提供的用戶體驗非常糟糕,甚至可能會傷害或誤導(dǎo) Google 用戶。因此,我們編寫了算法來識別網(wǎng)絡(luò)垃圾并將那些違反 Google 網(wǎng)站站長指南的網(wǎng)站從結(jié)果中移除。

網(wǎng)絡(luò)和更廣闊信息生態(tài)系統(tǒng)中的內(nèi)容在不斷變化,因此Google不會停止衡量和評估自身系統(tǒng)的質(zhì)量,確保在信息相關(guān)性和權(quán)威性之間實現(xiàn)適當?shù)钠胶猓層脩羰冀K信任看到的搜索結(jié)果。
回復(fù)

使用道具 舉報

5#
 樓主| 發(fā)表于 2021-2-19 00:32:46 | 只看該作者
返回最佳結(jié)果

在為您提供結(jié)果之前,Google 會評估所有相關(guān)信息的綜合效果:這些搜索結(jié)果是只有一個主題,還是有很多主題?是否有過多的頁面在著重探討一條狹義的詮釋?Google 會努力根據(jù)您的搜索類型以最有用的格式提供一系列多樣的信息。此外,隨著網(wǎng)絡(luò)不斷發(fā)展,我們會不斷優(yōu)化排名系統(tǒng),以便為更多查詢提供更優(yōu)質(zhì)的結(jié)果。

這些算法會通過分析相關(guān)信號來評估是否所有用戶都能查看搜索結(jié)果。例如:網(wǎng)站是否能在不同的瀏覽器中正常顯示;網(wǎng)站是否適合各種類型和尺寸的設(shè)備(包括桌面設(shè)備、平板電腦和智能手機);以及網(wǎng)頁加載時間對于互聯(lián)網(wǎng)連接速度較慢的用戶而言是否合適。

鑒于網(wǎng)站所有者可以提高其網(wǎng)站的易用性,Google 會在對 Google 搜索算法做出重大更改時盡量提前通知網(wǎng)站所有者以便其可以做出應(yīng)對。例如,在 2018 年 1 月,Google 宣布 Google 搜索算法將開始把網(wǎng)站的“網(wǎng)頁速度”納入考量范圍,這一通知比更改的正式實施時間提早了 6 個月。為協(xié)助網(wǎng)站所有者,我們提供了詳細的指導(dǎo)以及 PageSpeed Insights 和 Webpagetest.org等工具,這樣網(wǎng)站所有者就可以了解他們需要調(diào)整哪些方面(如果有)來使其網(wǎng)站更適合移動設(shè)備。

您可以在此處詳細了解 Google 為網(wǎng)站所有者提供的工具和提示。
回復(fù)

使用道具 舉報

6#
 樓主| 發(fā)表于 2021-2-19 00:33:39 | 只看該作者
考慮具體環(huán)境

您的位置、過往搜索記錄和搜索設(shè)置等信息可幫助我們即時地為您量身顯示最實用且最相關(guān)的結(jié)果。

Google使用您的國家/地區(qū)和位置信息來提供與您所在區(qū)域相關(guān)的內(nèi)容。例如,如果您身處芝加哥并搜索“橄欖球”,Google 便極有可能會先為您顯示有關(guān)美國橄欖球和芝加哥熊隊的結(jié)果。但如果您是在倫敦搜索“足球”,Google 則會在比較靠前的位置顯示有關(guān)英式足球和英超聯(lián)賽的結(jié)果。搜索設(shè)置也是一項重要的指標,可表明哪些結(jié)果可能會對您有用。例如,如果您設(shè)置了首選語言或已選擇啟用安全搜索(一種有助于濾除露骨結(jié)果的工具)。

在某些情況下,Google可能還會使用您的近期搜索活動的相關(guān)信息為您提供個性化的結(jié)果。例如,如果您搜索“巴塞羅那”,而且您最近搜索過“巴塞羅那 vs 阿森納”,系統(tǒng)便可能會將您的這條搜索記錄視為一個重要線索,從而推斷出您十有八九是想查找與足球俱樂部(而非城市)相關(guān)的信息。您可通過訪問 myaccount.google.com 來控制系統(tǒng)可使用哪些搜索活動來提升您的搜索體驗,包括調(diào)整哪些數(shù)據(jù)會保存到您的 Google 帳號。

Google 搜索還有其他一些功能也有助于根據(jù)您 Google 帳號中的搜索活動記錄為您顯示個性化的搜索結(jié)果。例如,如果您搜索“附近的活動”,Google 可能會專門向您推薦我們認為您可能感興趣的那些類活動。這些系統(tǒng)旨在協(xié)助 Google 搜索提供與您的興趣相符的信息,而不會推斷敏感性特征,例如您的種族、宗教或黨派。

您可以在myaccount.google.com上控制系統(tǒng)為提升您的搜索體驗可使用的搜索活動信息,包括設(shè)置系統(tǒng)可將哪些數(shù)據(jù)保存到您的 Google 帳號中。要停用 Google 搜索根據(jù)您帳號中的活動記錄提供個性化結(jié)果的功能,請關(guān)閉“網(wǎng)絡(luò)與應(yīng)用活動記錄”。
回復(fù)

使用道具 舉報

Archiver|手機版|小黑屋|教你搜 ( 魯ICP備16006309號

GMT+8, 2025-8-13 05:12 , Processed in 0.275998 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復(fù) 返回頂部 返回列表