新造船巨头出现?招商局接管中航威海船厂
图片源自:SERoundTable
大家好,我是John。
据说Google有200个排名因素,或许还不止,尽管英文SEO行业有很多大V和爱好者想把这些因素全部挖出来,比如:Brian Dean在他的Backlinko博客上著有 《Google's 200 Ranking Factors: The Complete List (2019)》一文,但坦率地讲,这篇文章的营销意图高于内容本身,而且我大胆的说,90%的读者不会有耐心看完每一条,更不会去深入研究和实践,毕竟也很难。
Bill Slawski,是我们非常尊敬的一位SEO人,过去十多年,他非常喜欢研究Google的专利和论文,并总能从中找到一些蛛丝马迹,然后与我们SEO人分享,很纯碎的那种干货,商业意图非常淡,不得不让人敬佩。当我看到他去年撰写的《Five Years of Google Ranking Signals》一文后,就心生翻译的念头,这不,我和Luke专门兑现了那个念头。
原文篇幅较长,除了过去5年的自然搜索(Organic Search),Bill还研究总结了本地化搜索(Local SEO)和语音搜索(Voice Search)等;我们只翻译了自然搜索部分,希望对大家有用。
原文:http://www.seobythesea.com/2018/06/google-ranking-signals/
作者:Bill Slawski
翻译:Luke
审校:John
以下的内容并非给大家透露Google如今正在使用什么排名算法,而是一些用批判性的思维来探讨Google在给网站排名时会考虑的那些因素,我从2005年起就开始写博客分析关于Google,Yahoo,Microsoft和Apple的专利,并研究其中哪些专利可能会用来作为搜索引擎排名因素。
Google的发言人曾讲过这么一句话——“我们确实拥有一些专利,但是这并不代表我们正在使用这些专利。”我第一次听到这样的言论是在GoDaddy开始推广最高可以注册10年的域名,因为Google有过一个专利 (Information Retrieval Based on Historical Data),该专利表示Google可能给网站排名时会考虑网站的域名注册期限长短,因为“垃圾骚扰类网站往往都只注册一年的域名期限。”(但实际上,很多人都只会注册期限为一年的域名,然后在域名快要到期时,自动续费延长使用期限,因此仅仅有域名使用期限为一年这个特征并不足以说明某个网站是垃圾骚扰类网站。)
接下来,我给大家展示的Google排名因素有一部分可能历史比较久远,但大部分都是最近五年以内出现的,这些排名因素我以前也曾写文章分析过,并且也附上了相关专利文件信息。而这篇文章算是我过去历年来研究分析Google排名因素的一个合集,为了这篇文章,我花了难以计数的时间研究调查专利文件,阅读了许多SEO和搜索领域的博客文章以及我过去分析或者没分析过的相关专利。如果你有任何关于排名因素的问题,可以在下方留言提问。
有一些我曾写文章分析过的排名因素,目前Google并没有开始实施使用,但这些因素在未来却很有可能会得以应用。类似于Google这样的公司,会通过申请专利来保护那些他们的工程师付出了努力和测试而得到的知识产权。因此,这就非常值得我们去研究、分析和理解这些专利背后的东西,因为这些专利是一个窗口,通过这个窗口你可以了解到Google在研究排名时发现了什么,并且Google的这些发现也许能够给你一些答案来帮助你更好的运作你自己的网站。专利都是公开透明的,以此来促使人们努力创新,了解最新的发明和想法。
完成这篇文章之后,我又发现了一个对于搜索引擎排名很重要但是我没有写的因素,因此我在修改的时候又添加了一个关于排名因素的附加部分。在未来如果有可能的话,我会续写这篇文章,但是只会决定在我认为有意义的时候再做这件事情。
域名年龄以及链接质量
Google有一个基于页面年龄评估页面质量的专利,该专利表明Google会将第一次收录网站某页面或者第一次发现有相关网站链接至该网站的时间点作为网站年龄的起点。除此之外,专利还表明Google会评估指向网站的链接质量,链接的质量高低也会作为评估该网站权重高低的方法之一。
建议:创建高质量的文章并且吸引别人不断地链接至你的网站,这样Google一定会发现你的网站的价值。
专利:Document scoring based on document inception date
关键词的使用
Matt Cutts写过一篇关于Google是如何将文章中出现的关键词与用户搜索的词相匹配的,下面是Matt文章的链接:
https://www.analistaseo.es/wp-content/uploads/2014/09/How-Google-Index-Rank.pdf
建议:你应该优化你的网站中每个页面的关键词分布,关于关键词使用比例是没有标准的,但是一定要确保用户可能输入的或者希望看见的关键词都出现在你的内容之中。
相关词组
Google有专利表明,一个在内容中拥有更多相关词组的页面会拥有更高的排名。
相关词组指的是,用户搜索某个词,如“president of America”, 然后出现的排名较高的页面往往都会包含“White house”, “Press conference”等词汇,那么这些就是president of America的相关短语。
建议:搜索你想要获得排名的关键词,然后看看排名较高的网站都有什么共同的,经常出现的相关短语,可以考虑将这些相关短语添加至你的页面之中。
专利:Phrase-based searching in an information retrieval system
关键词出现在标题中
Google判定一篇文章的内容方法和我们人类的阅读习惯是截然不同的。Google“阅读”一篇文章是先从标题开始,然后将所有<h2>标签都视作文章的下一部分,因此,如上图所示,尽管days这个单词出现在第一行,distance这个单词出现在最后一行,但是Google会认为这篇文章的内容应该是更多关于“Saturn distance”而不是“Saturn days”。
建议:确保文章的标题,主标题和小标题描述了他们所包含的内容,并包括了与自身内容相符的关键字和相关短语。
专利: Document ranking based on semantic distance between terms in a document
访问速度
Google一再地重复说自己将页面的访问速度作为排名的衡量标准,如:Using site speed in web search ranking。
建议:各位站长还是行动起来吧,使用比如Page Speed for Insights或 GTMetrix等工具来检查自己网站的访问速度吧。大家可以从缩减图片大小,减少死链接,优化CSS或者Javascript等方式来提升自己网站的速度。
专利: Using resource load times in ranking search results
页面的停留时长
Google有一个专利解释如果某个页面的停留时长更久的话,那么Google有可能会给这个页面更高的排名,如果页面包含图片或者视频等内容的话,用户浏览时长必然会有所增加,下图是一个专利里包含的例子图示:
建议:各位站长要关注自己页面上视频等内容质量,想办法让用户看完整个视频而不是看到一半就停止观看并退出。
专利: Watch time based ranking
能够解释页面内容的短语
这个专利向我们解释了Google可能会有一个基于关键词的巨大语库,比如你的页面的关键词是Jaguars,那么这个页面到底是关于捷豹汽车、猫科动物猎豹亦或是苹果电脑的操作系统?Google会根据分布在文章内容中的相关短语来知晓这个页面到底是关于什么的。
建议:尽可能清楚地解释你的网页是关于什么的,不要使文章变得模糊,以至于Google不知道你在讨论的是什么主题。
专利:User-context-based search engine
N-gram模型判断文章内容质量
Google有使用N-gram模型来判断页面内容是否合理。N-gram模型是自然语言处理领域的一种算法,理念是将人类的语言拆分成无数片段,即N个字节片段,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,而整句的概率就是各个词出现概率的乘积。因此,Google可以通过这样的算法,至少能够知道文章语句是否可读。
建议:优质的文章质量是排在第一位的,建议使用语法软件,如Grammarly或者Hemingway, 加强文章语法,获得较高的N-gram得分,从而取得较好的排名。
专利: Predicting site quality
垃圾内容识别
这个算法应该算是8号,也就是上一个算法的衍生运用。Google会使用N-gram模型来识别垃圾内容,然后降低该页面的排名。
建议:Google已经通过大量的文章识别训练得出了比较成熟N-gram语言模型,因此充斥着垃圾内容的页面会被识别出来从而降低其排名。能够给用户带来高质量的内容仍然是重中之重。
专利: Identifying gibberish content in resources
网站的权威性
Google越来越重视在搜索结果中所展示网站的权威性,如果用户输入的关键词所返回的结果之中没有拥有较高权威性的网站的话,Google会倾向于提炼关键词的含义从而给出一个来自有较高权威性网站的结果。关于网站的权威性,大家可以从Google的质量评分指南(Quality Raters Guidelines)一探究竟。
建议:各位站长们可以根据质量评分指南逐一优化自身网站的Expertise,Authoritativeness和Trustworthiness,即俗称的EAT。相信大家跟着官方的指导,一定会有所收获。
专利: Obtaining authoritative search results
网站数据库自动回复内容的准确性
很多大型的网站有自动回复的功能,比如招聘、旅游等行业的网站。如果用户在这些网站上输入特定的关键词,那么网站就会自动回复一些内容。Google可能会根据网站回复内容的准确性,给予准确性高的页面较高的排名。
建议:目前这个专利看起来还尚未实施,但是在未来是有可能执行的。大家可以保持关注。
专利:Resource identification from organic and structured content
人为操纵排名的嫌疑
Google终究还是需要为用户提供高质量的内容,因此他们会降低有操纵排名嫌疑的网站排名。
建议:研究下Google站长指南(Google Webmaster Guidelines),避免做那些会被认为有人工操纵嫌疑(manipulative)的事情。
专利: Ranking documents
热门事件得分
Google是有可能将关于热门流行事件的网页给予高排名的。下图是该专利讲述热门事件是如何影响搜索结果排名的。
建议:上面图片所展示影响事件得分的6大因素,如:唯一性、权威性等,这些因素值得站长去关注,因为如果你在相关因素得分越高,排名应该会有所提升。
专利: Ranking events
链接的权重传递基于用户点击该链接的概率
网页权重或PageRank的传递可能基于该链接被点击的概率。越多的人通过某个网站的链接进入到的另一个网站的某个页面,那么后者就会获得越大的权重。
建议:在正文中,正确的使用锚文本可以有效地吸引读者点击该链接并且传递更大的权重至被连接的网页。反之,在网页顶部或者底部设置的链接则不容易吸引读者点击。
专利:Ranking documents based on user behavior and/or feature data
通过用户面部识别判断网页质量
这是一个我怀疑Google是否会广泛应用的专利。根据这项专利,Google可以在用户输入关键词之后,打开手机或者电脑的前置摄像头,通过面部识别观察用户是否对显示的结果满意。如果用户对搜索结果中的某个结果感到不满意的话,那么Google就会降低该页面的权重。
建议:即使这项专利算法没有得到应用,但是你仍然应该将让用户对你的网站内容感到满意作为使命之一。优化自己的网页的标题以及富文本信息,增加用户的满意度永远都不会错。
专利:Ranking Query Results Using Biometric Parameters
点击率
尽管Google多次表示不会使用点击率作为衡量网页质量的标准,但是仍然有很多事实证明点击率确实会对搜索结果产生影响。Rand Fishkin就亲自使用自己的网站做了一个试验,并且也证实点击率的提高有助于网站排名。
建议:有以下几种方法可以潜在地提高网页的点击率:
让标题和富文本信息显得更有说服力
确保网页URL显示在搜索结果之中
展示知识图谱(knowledge panel)
建立具有识别度的网站品牌
专利:Modifying search result ranking based on a temporal element of user feedback
网站质量得分
如果你搜索“seobythesea named entities”,表示你想查找在seobythesea网站中关于entities的信息。同理,你搜索“site:http://www.seobythesea.com named entities”代表了相同的意思。这种搜索形式可以被称为具有指向性的搜索。因此,指向特定网站的搜索越多的话,那么该网站也会获得较高的排名。
建议:人们输入这种指向特定网站的搜索代表着他们有信心在这个网站上找到自己想要寻找的答案,因此多去想想你这个领域的用户想知道什么,尽可能多的回答他们想要知道的信息,这样你的网站质量得分应该会得到很大的提升。
专利: Site quality score
人名的唯一性
和前面那个关于内容相关短语的专利有点类似,Google希望看到关于人物命名的准确性和唯一性,有模糊概念或者歧义的内容往往无法获得良好的排名。
建议:如果你要描写一个人的话,先去看看Wikipedia之类的百科网站是怎么描述这个人的,使用相关的描述性短语,消除文章内容的歧义,这样能让你的读者和Google都能清楚的明白你的内容是什么。
专利:Name disambiguation using context terms
已使用过的网站或者软件的历史
如果你在Google上搜索一首歌曲名字,然后你的手机上又恰好有一款音乐软件,那么Google就会倾向于向你展示这款软件的搜索结果,方便你点击之后可以直接打开软件。社交领域的关联性也对搜索结果有影响,如果你搜索某个人,而这个人又恰好在某个社交网站之中,那么搜索结果之中也很有可能展示该社交网站关于这个人的信息。
建议:在Twitter或者Google+等社交媒体建立你个人的品牌价值,然后通过在社交媒体链接至你的网站,在未来的一段时间仍然会有持续的价值。
专利:Ranking search results
引用
Google有一个专利可以用来识别引用符号里面的内容,并且会通过引用的内容,给页面一个评分。
建议:使用Schema去识别引用的内容应该是个不错的选择。
专利:Systems and methods for searching quotes of entities using a database
网站分类页面的访问时长
网站的综合访问时长是基于其各个分类页面的访问时长统计出来的,Google不止一次的表示这种用户数据过于“嘈杂”所以不会使用类似的用户数据作为排名因素,但是他们仍然有专利是研究如何消除多余的噪音,从而正确地衡量网页的质量价值。
建议:找到具有相关性的图片、视频和音频可以有效地让用户在你的网站中停留更长的时间。Google自身也有“People also ask”这个版块用来留住用户,因此效仿Google,用更多有价值的内容留住用户应该是个不错的选择。
专利:Website duration performance based on category durations
重复访问和停留时长
我相信Google发言人所说的不会使用类似的用户行为数据作为排名标准,但我仍然会保持对于这方面专利的关注。
建议:你是否有能够让用户重复点击并且能够停留较长时间的内容?多产出这些高质量的内容也许Google就会判定你的网站拥有较高的质量。
专利:Ranking search results
环境信息
这项专利是关于如何利用手机或者电脑的传感器,收集附近的信息,让Google有能力回答类似“我现在看的这部电影的主角叫什么名字?”这种问题。
建议:我在Google里搜索了三次看看它是否知道我现在正在放什么音乐,然而我并有得到正确结果,我会持续地关注未来Google是否有能力做到这一点。
专利:Answering questions using environmental context
链接来带的流量
Google可能会衡量反链所带给你网站的流量,如果某条反链几乎没有给你的网站带来任何流量,那么Google就会倾向于降低该反链的权重价值。
建议:去追求创造高质量的、能够给你的网站带来流量的反链,争取和相关媒体或者愿意在文章中创建链接的网站取得联系,这样有助于获得较高的流量。最理想的外链确实就是那些能够给自己网站带来流量的链接了。
专利:Determining a quality measure for a resource
时效性
Google可能会根据用户输入的关键词判断用户是否想要获得最新的内容,如果是的话,Google将会给予更具时效性的网页更高的排名。如何判断用户输入的关键词是否想要最新的内容呢?Google会根据以下几个特征去辨识:
近期,关键词的查询量突然增多。
近期,关键词突然出现在各类网站之上,如博客、新闻和社交媒体等网站。
近期,更多的用户使用google news筛选搜索结果。
更多的用户选择点击新闻类的搜索结果而非普通的网页内容。
建议:这让我想起了John Kleinberg是如何定义突发性(burstiness),而且微软在过去也有一个类似的专利,如果你是SEO人,那么了解突发性(burstiness)是很有必要的。
专利:Freshness based ranking
用户历史数据
如果用户曾经在电脑上做过某些特定的事,比如看过一些特定的视频或者听过一些特别的歌,那么当用户在搜索相关的关键词时,Google所显示的结果可能会因此受影响。
建议:这又是一个应该尚未实施的专利,但是想想Google在专利中介绍使用该专利所能够得到更好的用户体验之后,这个专利在未来就很有可能实施了。
专利:Query response using media consumption history
地理坐标
该专利表明了也许在网站Schema中加入经纬度等地理坐标信息可能是个不错的建议。Google会在类似Wikipedia, IMDB和Yahoo Finance这类知识信息类网站中根据用户地理信息,推荐出更适合用户的内容。虽然在普通的网站中Google不大有可能使用这项专利,但是在不影响网站的同时,在自己的网站中添加一些地理位置信息也不妨是一个能让Google更了解你网站的好方式。
建议:如果有可能的话,在Schema地理位置中添加经纬度等地理位置信息。
专利: Determining geographic locations for place names in a fact repository
低质量的网站
Google的该项专利告诉了我们:
Google会给网站的反链资源评分,评分是依据给出链接的网站的资源得分而来。
Google会将反链资源评分低于阈值的网站视作低质量网站。
低质量网站将不会获得较高的搜索排名,相反高质量网站将会获得较高的搜索排名。
建议:站长应该全面检查自己网站的反链资源,那些在网页页眉页脚的,或者看起来很多余的反链没有太多的价值甚至没有任何价值。
专利:Classifying sites as low quality sites
当地的电视节目
Google可能会调查用户所在地方的电视播放节目,然后查看用户搜索的关键词是否与当地的电视节目有关。
建议:Google可能会越来越关注你所在地方的电视节目的播放情况,这会影响你搜索与电视节目相关的关键词的结果。这也许值得我们关注并且测试。
专利:System and method for enhancing user search results by determining a television program currently being displayed in proximity to an electronic device
人工质量评分
我们知道Google会使用人工审查来给网站的质量打分,并且这些评分会影响到网站在搜索结果中的排名。在我过去的一篇文章里 How Google May Rank Web Sites Based on Quality Ratings ,我介绍了一些人工审核过程中审核员可能会用到的评测标准,如:
内容信息的原创性
网站布局
语法与拼写是否正确
建议:建议各位站长阅读Google质量评分指南(Google Quality Raters guidelines),这是官方给出的指南以及建议,阅读之后你会更好了解到Google是如何判断网站质量高或低的。
专利: Website quality signal generation