从搜寻引擎看 “过度优化” 就可能是“垃圾内容”。搜寻引擎计算排名所考虑主要因素包括:
- 相关性Relevance。搜寻用户输入(一般看成关键子) 和内容的相关性。随着Rankbrain 的应用,相关性的判断再不单纯是依赖关键字出现的次数,更多是分析语义得出来的结果。
- 内容质量Quality。一般反影在登陆后页面退回率,停留时间和浏览页数等等。质量判断并不单纯牵涉单一页面,更牵涉其他为涉及该主题的页面和整个网站的内容。
- 权威性Authority。网站甚或作者就该搜寻关键字所指向的主题内容,过去所发布的相关内容有多少受搜寻用户偏好。
- 内容的新鲜度Freshness。新鲜度并不单纯是指发布时间。更多是该网页内容是否仍然有效,例如能够持续吸引反向链接、点击访问、被提及等等。也涉及整个网站的内容是否不断更新。
- 内容的可靠性Trustworthy。特别是对一些内容涉及金钱健康(所谓YMYL 内容) 等等, Google 搜寻引擎对这类内容的搜寻排名更为谨慎。详见Google Search Quality Raters' Guidelines.
优化最常操控的就是相关性。
关键字出现频率和距离
将目标关键字插入标题和中断描述就是一个相关性讯号。当关键字出现多一次,从正面可以看是加强了该相关性讯号。当关键字出现2 次,也许更加强化了该相关性讯号。问题是:当出现3 次又如何?4 次又如何?出现太多显然是不正常时,那和相关性未必挂钩,搜寻引擎更可能认为是店主的操控排名行为。这种技巧通常被称为关键词填充Keywords Stuffing.
当关键字出现在标题meta title、中继描述meta description、内容(特别是第一段)、副标题等等的地方太多,也可能被搜寻引擎认为是人为操控,就可能引起惩罚,导致该页面搜寻排名下降,网站的质量评分也下降。原来为有利排名的操作,由于过度采用,引致惩罚情排名下降,所以被称为过度优化Over Optimization。
何为出现次数过多?事实上没有准则。亦可能和两个关键字出现所相隔的文字距离semantic distance有关。并且每个搜寻引擎(如Google Vs百度 )处理不一样。甚至同一搜寻引掣中不同的更新(Panda 2, Panda 3, Panda 4)亦会令处理结果不一样。有理由相信搜寻引擎对过度优化的处理,很可能只是针对搜寻量高的关键字,不竟这是关乎如何有效利用资源的问题。
Meta keywords
需然主要的搜寻引擎都说不参考描述中的关键词Meta keywords. 理由是过去
描述中的关键词 被滥用。何为滥用?原来
Meta keywords 的设计用意是:那个年头(约略十到二十年前) 搜寻引擎对内容分析力还不够好,干脆依赖网页管理员以中继关键字形式告诉搜寻引擎该内容和哪些关键字有关。被滥用时不相关的关键字(如关键字根本在内容从未被提及) 也被放在中继关键字中,这是垃圾内容。不仅仅是过度优化,太多时实际上是造假。
你可能认为
Meta keywords 已经不被搜寻引擎用于排名。但未必就等于不用于判断人为操控排名造假行为。今天不考虑亦未必等于永远不考虑。至少它标志着一种质量问题。
关键字出现在标题(H1, H2 …) 会加强内容和关键字的相关性。太多出现的标题亦可能有反效果。标题应该跟随着文字内容为标题作较详细解说。如果太多关键字太短的标题解说文字,亦可能令搜寻引擎判断为人为操控排名的手段。
标签Tag 常见于内容管理系统和网站系统。同一个罗辑推理,如果使用标签(如标签根本在内容从未被提及) 太滥,对搜寻排名不利。
链接links 过度优化
第二个相关性讯号是链接,这里我们只讨论内部链接Internal Links 和反向链接Backlinks。反向链接是来自其他网站的链接。
反向链接Backlinks
反向链接的来源网站可能由第三方拥有或所由指向网站的同一网站管理员拥有。如果是由第三方拥有而加入反向链接,锚文本Anchor text自然会显现更多样性 Diversity。如果反向链接的网站是由指向网站的同一网主控制。网主可能更多使用完全匹配exact match关键字,更少使用部分匹配partial match关键字用作锚文本,理由是完全匹配一般被搜寻引擎认为有更多相关性。太多相同的锚文本(锚文本多样性较小)对搜寻引擎来说可能是人为操控的结果。何为多何为少又是说不准的问题,视乎不同搜寻引擎。
反向链结如果是由独立第三方加入。链结增加的速度(链结速度Link Velocity) 自然不会太快。反过来是由利益相关的第三方加入,很可能在短时间内大量曾加。理由是利益相关的第三方,往往利用程式自动化这个步骤。只关心量,不关心来源网站和客户网站是否主题一致。当搜寻引擎发现太多反向链结加入太快,来源网站质量太低自然容易被看作人为操控。
这里看这一个例子。我们的一个网店客户售卖情趣用品。找来一家公司帮忙做搜寻引擎优化。你可以以简单工具Linkminer观察反向链结的状况。你可以看到那家SEO公司基本上是在自已建立的网志(所谓Private Blog Network )中撰写发表一些间短和略有相关性但又欠缺深度的文章,在文章中随便加入两条反向链结针以目标关键字为锚文字,如安全套、润滑液、男士玩具、女士玩具等。
如果以这些关键字搜寻一下,会发现排名基本上是无法进入前四五十名。所以今天采用PBN 植入的反向链结去欺骗Google 是非常困难,一不小心可能引来惩罚。我会认为这些反向链结是冇好过有。
内部链接Internal links
内部链接因为是由网站管理员添加的,可能更有可能使用相同的锚文本。内部链接之间的文字距离亦有关。距离太密亦可能是人为操控。内部链结和内容的比例太高亦很可能有问题。问题是如何找出链接锚文本的统计信息?
你可以利用Screaming frog, 扫描整个网站,找出用于指向页面的锚文本。
内部链接应该出现在文字段落中,有上文下理,用作方便浏览者更深入了解提及的名目。缺乏上文下理的孤伶伶链接会令搜寻引擎起戒心,出现太多孤伶伶链接亦可能令搜寻引擎认为是人为操控。
所以页脚Footer 出现太多孤伶伶(并且关键字丰富) 的链接是非常冒险的做法。
内容更新频率
内容更新太频繁结所改变的内容太少时,它可能是一个过度优化的信号,搜寻引擎可能会跳过不索引该版本。