未來人工智能在搜索引擎的應用,領略ZAC對SEO趨勢分析

站長新聞 尹華峰 瀏覽 評論來源:www.5290057.live

  AlphaGo戰勝柯潔,證明了人工智能的長足發展即將從量變到質變,阿爾法狗打敗柯潔其實是在預料之中的事,人工智能可以在海量數據中找出規律。近年來,人工智能在人臉識別、機器翻譯等領域被廣泛應用。我們都知道谷歌是一家搜索科技為主的公司,人工智能的發展勢必應用于搜索引擎。SEO技術隨時都會變革,在這里我們先領略下SEO前輩是怎么看待人工智能未來對搜索引擎的影響。

  這位前輩就是昝輝,也許你更多的是關注他的《SEO每日一貼》,下面是ZAC大神的筆記,非常具有前瞻性。

  關于未來兩三年的SEO趨勢,我談以下幾點:

  1、未來兩三年,人工智能可能全面影響SEO領域:

  只有互聯網公司才能實現的勝利

  深度學習的意義在于實現“無人監督的學習”

  深度學習系統應用于搜索會怎么樣?

  未來,系統將自己去思想,自已去琢磨哪些因素最終決定網站的質量

  2、關鍵詞相關性計算相對于傳統的改變:

  語義分析是一種相關性判斷的新思路

  它對未來的影響包括:寫作方式,文章長度、內容深度

  3、人工智能下的SEO,將促使網站不求大,而求內容強

  4、在深度學習的邏輯下,未來體現用戶體驗的每一個環節,都可能被納入SEO的判斷因素。

  “點石互動”成立到現在已經第十個年頭了。十年前我們四個人成立點石的時候,他們幾個才20幾歲,也就我30多歲。在那之前我們互相連面都沒見過,只是在MSN聊天特別投緣,熱情一來就聯合開SEO博客。那年秋天,我們在北京組織了第一次SEO分享會,一轉眼就是十年。

  關于SEO,通常我們在網上,或者看書的時候,內容主要涉及的是基本SEO概念和技巧。但我希望做SEO的人,有時候停下來,看看世界,看看未來怎么走,大方向怎么走。

  比如做網站的,假如在今天你有一批15年的老域名,那你現在可能做得很輕松,因為那時候有多少人想得到現在的情景,而且即使當時你擁有這些域名,還要一直維護著它。那么現在,我們是不是仍有機會看到未來10年需要怎么做?我想應該還有的。

  關于未來兩三年的SEO趨勢,我今天談以下四點:

  第一,人工智能可能全面影響SEO

  1、只有互聯網公司才能實現的勝利。

  上個月李世石和AlphaGo的圍棋大戰,李世石以1:4不敵人工智能的機器人。賽前預測時,多數言論認為機器勝算不大,包括棋圣聶衛平在賽前也認為電腦存在不可逾越的技術障礙,電腦完全無法戰勝人腦。但當時我就在博客上寫了有戰勝的可能勝,因為谷歌所用的人工智能下棋原理跟我們通常所想象的下棋方法完全不一樣。

  當年IBM的電腦深藍打敗卡斯帕羅夫時,那時的算法和現在是不一樣的。國際象棋可以用窮舉的暴力算法來計算每一步的后續可能性。而圍棋的困難在于不可能進行窮舉,對美一種可能性進行計算的話,其可能性超過全宇宙的原子數量。

  另外,象棋每個子有相對容易賦值的子力,車馬炮都各自有規定的走法和優勢。但圍棋不一樣,棋手落的每一個字可能是廢子,可能被提掉,但也可能隨著棋局變化變成手筋,因此沒法對它的每一個子賦值。

  那么,它是怎么完勝了人類的?為什么是Google,而不是傳統的科技公司?因為當今最高端、最復雜的計算系統是在百度、Google,基本上只有互聯網公司才有這個能力完成這種計算。

  AlphaGo的算法分為兩部分:

  一是Policy network,即落子部分,刪選出有利但有限的地方來落子;

  另一種則是Value network,對局勢進行判斷的系統。判斷當前的棋局形勢如何,它不是按既定的圍棋規則,也不是按人類棋手的技術去的,而是將歷史上過往巨量棋局輸入服務器,系統知道每盤棋的所有過程和最終誰勝利,因而人工智能系統在實戰時計算的是大數據支撐下某種局勢下勝率是多少。局勢判斷系統才是AlphaGo決勝的關鍵。

  這就是深度學習帶來的。

  2、深度學習的很大意義在于實現“無人監督的學習”。

  有監督的學習,是事先人為設定決定因素。比如我要建立一個廈門房價計算系統,我可以會輸入面積、價格、朝向、區域等我們認為相關的因素,然后系統會根據這些計算出規律。未來,當我給出相應的條件,系統就能預測出房價。

  無人監督的深度學習下,你只需告訴系統大量數據,不需要告訴系統結果由什么因素決定,讓系統自己去學習。系統學習的過程對人來講是個黑箱,它可能會加入一些平常我們想象不到的因素。還是房價系統的例子,如果我們只是輸入所有交易相關的數據,讓系統自己去學習,它可能會加入我們想不到的因素,比如天氣對成交的影響,也許是年齡、性別對成交的影響。

  而且人工智能系統能進行自我訓練,也就是自己跟自己對局。

  3、深度學習系統應用于搜索會怎么樣?

  當前搜索引擎辨別高質量網站靠的是數據+人工。數據搜索引擎都會有網站的所有數據,還包括關鍵詞布局,點擊方式、訪問方式這些判斷因素,這些數據,他們都有,但哪些是真正高質量網站,系統不一定知道。

  Google就有一批人工監測員來評估網站質量。他們3月份剛剛發布一份質量指南,告訴這些監測員,你應該怎么去判斷這個網站,通過人工打分,把網站分成五級。或列舉搜索的10個結果,讓人工去看,這樣的判斷跟用戶的判斷高度吻合,因為檢測員就是普通用戶。將這兩方面數據結合,Google就有辦法通過深度學習準確地評測網站的質量。

  4、未來,系統將自己去思想,自已去琢磨哪些因素最終決定網站的質量。

  a.規則為基礎的算法會被人工智能的黑箱取代;

  b.系統工程師也不知道排名因素和權重——我們只知道輸入,結果,但過程中系統所采用的因素到底是什么可能誰也沒想到;

  c.鉆空子會變得非常困難。因為你是在跟一位13段棋手在對戰,只要有輸入,就會有輸出,這種算法可能運用在任何領域,它具有全世界第一的判斷力,比人的水平還高;

  d.Panda,penguin算法很可能已經用到了人工智能。雖然google沒有官方確認。目前應該還沒有大規模的使用在搜索引擎中,但未來必然會大規模應用。

  (備注:google推出Google Panda,即熊貓算法,旨在反垃圾,保護原創。2012年4月24號周二,谷歌推出新的算法更新方案,代號“Penguin Update”。Penguin,直譯為企鵝,是谷歌繼2011年2月24號發布的“熊貓”之后再次推出的新算法調整。)

  e.百度也有人工智能。百度和google比基本上是落后兩三年,研究google基本上等于研究未來兩到三年的百度。

  第二,關鍵詞相關性計算相對于傳統的改變

  傳統的關鍵詞排名算法基本邏輯是這樣的:

  如果關鍵詞在所有文件中都出現,意味著關鍵詞對文件的額區別能力非常小,基本為零,比如助詞“的地得”。

  如果有些詞,只在比較少的一部分文件中出現,被人為對相關性計算的意義較大。

  1、語義分析是一種相關性判斷的新思路。

  某些相關文件傾向于使用語義相關的詞,比如談減肥的文章中經常出現卡路里,有氧運動,跳繩等,有時會出現羽毛球。林丹離羽毛球近點,離運動、有氧有一定距離,離減肥就更遠。

  這樣的計算邏輯下,如果一篇談減肥的文章沒有提到有氧運到,系統可能會認為它跟減肥的相關性實際上低一些,雖然減肥這個詞大量出現。按這種判斷邏輯, 如果你減肥寫兩篇貼子,分別在一篇談飲食,另一篇談有氧,系統就會認為第一篇文章跟減肥相關性低一些,或者認為不是真正的減肥專家寫出的東西。

  2、它對未來的影響包括:寫作方式,文章長度、內容深度,關鍵詞分配方式,網站結構等。

  未來的內容可能必須要寫得長,內容必須要寫得更有深度,要不然你可能提不到語義相關關鍵詞。

  百度百科、知乎的自然流量排名都非常高。知乎類文章都是專家寫的,都是有深度的文章。

  關鍵詞的分配方式變了,做網站的思路也變了,以前網站可能想做大點,頁面要多,每個關鍵詞都配上文章。

  以后,則需要更強、更緊湊。不要想每個關鍵詞都配文章,而是怎么把文章寫得更有深度,覆蓋更多詞。

  第三,頁面數據與用戶體驗數據結合

  我們通常認為用戶訪問數據的噪聲較大,因為這上面比較容易做弊,比如早些年就出現過針對百度的頁面點擊工具來騙取更高的搜索排名。雖然谷歌和百度都沒有明確承認 ,但當前在搜索引擎的算法中頁面點擊率應該是個因素。

  在有了人工智能系統的情況下,這種情況將會改觀。用戶訪問數據會更有用,因為系統會綜合看很多條件,包括用戶是誰,在什么條件下點擊,輸入什么關鍵詞,于是噪聲問題就有可能被消除了。

  第四,頁面數據與用戶體驗數據結合

  在人工智能普及下,用戶體驗也是SEO。

  在深度學習的邏輯下,未來體現用戶體驗的每一個環節,都可能被納入SEO的判斷因素,包括:

  網站打開速度。這已經是排名算法的一部分;

  搜索結果點擊率。

  頁面停留時間、訪問頁面數(有深度學習系統的話,有可能這些數據都能呈現出來。)

  頁面跳出率。

  廣告、彈窗數據、位置。

  增加頁面互動。讓用戶在你頁面上做些東西,而不只是看和讀

  轉化率。

  圖片、視頻 。內容的制造成本越高、質量就越高。

  上面所說的觀點純屬個人預測,但很有可能是未來兩三年必須要做的東西。

  謝謝大家!
 

  來源:ZAC

    鑫科材料股票行情