谷歌资讯

衡量流行的关键词研究工具的质量

衡量流行的关键词研究工具的质量
撰稿人JR Oakes通过Google搜索结果中的数据来衡量流行的关键字研究工具的质量,并从Google Search Console执行页面数据。

您是否想知道某些流行的关键字研究工具的结果如何与Google Search Console提供的信息叠加?本文着眼于比较谷歌搜索控制台(GSC)搜索分析的数据与着名的关键字研究工具以及您可以从谷歌提取的内容。

作为奖励,您可以 使用本文末尾的代码获取相关搜索,并且人们还可以从Google搜索结果中搜索数据结果。

本文并不是要进行科学分析,因为它只包含七个网站的数据。
可以肯定的是,我们正在收集一些综合数据:我们选择了来自美国和英国的网站以及不同的垂直网站。

程序

1.开始通过定义各个行业的垂直网站

我们使用SimilarWeb的顶级类别  来定义分组并选择以下类别:

艺术和娱乐。

汽车和车辆。

商业和工业。

家和花园。

娱乐和业余爱好。

购物。

参考。

我们从我们的网站样本中提取匿名数据,并能够从优化专家(优化)Aaron Dicks和Daniel Dzhenev获得未见数据  。
由于这个初步的探索性分析涉及到定量和定性的组成部分,我们希望花时间了解过程和细微差别,而不是放大分析所需的让步。
我们确实认为这种分析可以为内部营销组织提供一个粗略的方法,以便更明智地决定哪种工具可以更好地适应各自的垂直方向。

2.从各个利基网站获取GSC数据

数据是通过编程和使用Jupyter笔记本从Google Search Console获取的。

Jupyter笔记本是一款开放源代码的Web应用程序,允许您创建和共享包含实时代码,公式,可视化和叙述文本的文档,以便每天从Search Analytics API中提取网站级别的数据,从而提供比当前可用的更大的粒度Google的网络界面。

3.为每个网站收集单个内部页面的排名关键字

由于主页倾向于收集许多可能或可能不会与页面的实际内容相关的关键字,因此我们选择了一个已建立且正在执行的内部页面,以便排名更可能与页面内容相关。
这也更加现实,因为用户倾向于在特定内容观点的背景下进行关键词研究。

上面的图片是与业务相关的各种查询的主页排名示例,但与页面的内容和意图没有直接关系。

我们删除了品牌字词,并将Google Search Console查询限制为首页结果。

最后,我们为每个页面选择一个词首。
短语“首字词”通常用于表示具有高搜索量的热门关键词。
我们选择搜索量相对较高的词汇,但不是绝对最高的搜索量。
在展示次数最多的查询中,我们选择了最能代表该网页的查询。

4.在各种关键词工具中进行了关键词研究,并查找了关键词

然后,我们使用上一步中选择的词项来执行三个主要工具的关键词研究:Ahrefs,Moz和SEMrush。

使用“搜索建议”或“相关搜索”选项,并且保留所有返回的查询,而不管该工具是否指定了建议与首字之间的相关程度。

下面我们列出了每个工具的结果数量。
此外,我们从Google搜索中为每个首字词(各个国家/地区)提取了“人们还搜索”和“相关搜索”,并添加了结果数量以给出Google免费赠送的基准。

这个结果返回了超过5000个结果!它被截断为1,001,这是最大可行的,并按降序排列。

我们编译了每个工具返回的关键字的平均数量:

5.处理数据

然后,我们通过使用一些语言处理技术将单词转换为它们的根形式(例如,“运行”到“运行”),去除了诸如“a”,“the”和“和“扩大收缩,然后排序的话。

例如,这个过程会将“Raleigh中的优化代理机构”转变为“代理机构Raleigh优化”。
这通常会保留重要的单词并将它们排列整齐,以便我们可以比较和删除类似的查询。

然后,我们通过将唯一字词的数量除以工具返回的字词总数创建一个百分比。
这应该告诉我们这些工具有多少冗余。

不幸的是,它没有考虑拼写错误,这在关键词研究工具中也可能存在问题,因为它们会在结果中添加额外的粗俗(不必要的,不想要的查询)。
多年前,有可能针对网站页面上的术语拼写错误。
今天,即使拼写错误,搜索引擎也能很好地理解您输入的内容。

在下表中,SEMrush的搜索建议中唯一查询的比例最高。

这很重要,因为如果1,000个关键字只有70%是唯一的,这意味着300个关键字对于您正在执行的任务基本上没有唯一的值。

接下来,我们想看看各种工具如何发现用于查找这些执行页面的查询。
我们采用了以前独特的标准化查询短语,并查看了工具在其结果中查询的GSC查询的百分比。

在下面的图表中,请注意每个工具的平均GSC覆盖率,Moz在这里较高,很可能是因为它为大多数头条件返回了1,000个结果。
所有工具的执行效果都比Google抓取的相关查询要好(使用文章最后的代码也可以做到这一点)。

进入矢量空间

在执行之前的分析之后,我们决定将标准化的查询短语转换为矢量空间,以便直观地探索各种工具的变化。

分配给矢量空间使用称为预先训练的单词向量的东西,使用称为t分布式随机邻居嵌入(TSNE)的Python库在维度(x和y坐标)中减少。
如果您对此不熟悉,请不要担心; 通常,单词向量是将单词转换为数字,以便数字表示关键字的固有语义。

将单词转换为数字有助于我们处理,分析和绘制单词。
当语义值绘制在坐标平面上时,我们清楚地了解各个关键字之间的关系。
分组在一起的点将在语义上更相关,而距离彼此较远的点将更不相关。

购物

这是Moz返回1,000条结果的一个例子,但搜索量和搜索者关键词的变化非常低。
这可能是由Moz在语义上匹配特定单词而不是试图与短语的含义匹配得更多造成的。
我们要求Moz的Russ Jones更好地理解Moz如何找到相关的短语:

“Moz使用许多不同的方法来查找相关术语。
我们使用一种算法来查找具有相似页面的关键词,并使用另一种ML算法将该短语分解为构成词并找出相关词的组合,从而生成相关短语等。
这些算法中的每一个都可以用于不同的目的,具体取决于在你是否想要非常接近或切向主题。
您是否希望提高关键字的排名或找到足够明确的关键字来撰写关于该关键字的相关信息?Moz Explorer返回的结果是我们试图达到这种平衡。

Moz确实包含了一个很好的相关性度量,以及一个用于微调关键字匹配的过滤器。
对于这种分析,我们只使用了默认设置:

在下面的图片中,查询图显示了每个关键字供应商将坐标平面转换成的返回值。
位置和分组可以让您对关键字的相关性有所了解。

在这个例子中,Moz(橙色)产生了大量的各种关键字,而其他工具选择的却少得多(绿色的Ahrefs),但与最初的主题更相关:

汽车和车辆

这是一个有趣的。
你可以看到Moz和Ahrefs对这个高额期限的报道很好。
Moz通过匹配Google Search Console实际条款的34%获胜。
Moz的结果数量(几乎默认)是Ahrefs的两倍。

SEMrush在这里落后于35个针对具有广泛有用品种的主题的查询。

较大的灰点代表来自Google Search Console的更多“ 基本事实 ”查询。
其他颜色是使用的各种工具。
没有重叠颜色的灰色点是各种工具不匹配的查询。

互联网和电信

这个图很有意思,因为SEMrush从其他结果中的50-200个范围跳到近5000个结果。
您还可以看到(底部)有许多术语,而这些术语超出了本页的排名或对于理解新页面的用户查询所需的内容是多余的:

大多数工具分组有点接近头项,虽然您可以看到SEMrush(用紫色粉红色)产生了大量可能更不相关的点,尽管在某些分组中发现了Google People Also Search。

百货   

以下是关键字工具的一个示例,用于查找该页面当前未排名的术语(由黑色圆圈表示的分组)。
在审查数据时,我们发现右侧的分组对于此页面有意义:

这两个黑色圆圈有助于形象化以这种方式绘制文本时查找相关查询分组的能力。

分析

具有关键词研究经验的优化专家知道,没有一种工具可以统治所有关键词。
根据您需要的数据,您可能需要咨询一些工具才能获取您的信息。

以下是对每种工具进行定性评估后的一般印象:

查询数据和我们分析结果唯一性的数字。

找到真实用户用于查找执行页面的条款的可能性。

莫兹     

在原始结果方面,Moz似乎有令人印象深刻的数字,但我们发现在几个案例中缺乏结果的总体质量和相关性。

即使在玩相关性分数时,它也会很快发生切线,提供的查询与我的总词没有任何关系(请参阅上图中的Moz对“Nacho Libre”的建议)。

有了这些说明,由于其全面的覆盖面,Moz尤其适用于小型或新型垂直领域的优化。
在很多情况下,为更新的趋势主题找到关键字非常困难,所以更多关键字在这里肯定更好。

GSC的真实用户数据覆盖64%的覆盖率,这对于选定的域名来说是非常令人印象深刻的。
这也告诉你,尽管Moz的结果可能会降低兔子洞,但它们往往也有很大的改进。
他们已经失去了保真度的全面性。

Ahrefs

Ahrefs在质量方面是我最喜欢的,因为他们的完美结果与最少量的明显无关的查询结合在一起。

它是每个供应商报告的平均关键字结果的最低数量,但这实际上是误导性的,因为来自SEMrush的大量异常值。
在各种搜索中,它倾向于返回一组不错的词汇,以避免杂乱无章。

对我来说最令人印象深刻的是一种特定类型的利基烧烤,与一个受欢迎的地点共享一个名称。
Ahrefs的结果一直保持在正确的位置,而SEMrush没有任何回报,而Moz则采用了与流行位置相关的许多关键字的切线。

 SEMrush   

SEMrush总体上提供了很好的质量,其中90%的关键字是独一无二的。
在匹配来自GSC的查询时,它也与Ahrefs相提并论。

然而,就返回的结果数而言,这是最不一致的。
它产生了1000多个关键字(实际上是5000),用于互联网和电信>电信,但只覆盖了GSC中22%的查询。
另一个结果是,它是唯一不返回相关关键字的人。
这是一个非常小的数据集,所以很明显有一个说法是这些是异常情况。

Google:人们还搜索/相关搜索 

这些结果非常有趣,因为它们倾向于更贴近地匹配用户在特定购买状态下进行的搜索类型,而不是那些与特定短语具体相关的搜索类型。
 

例如,查看“[术语]浴帘”返回了“[term]马桶座圈”。

这些从语义的角度来看并不相关,但它们对于重做浴室的人来说都是相关的,这表明相似之处是基于用户意图,而不一定是关键字本身。

另外,由于“人们也搜索”的数据与Google搜索引擎结果页面(SERP)中的各个结果相关联,因此很难说这些词语是与搜索查询相关还是更像是站点链接与个人页面相关。

使用的代码

当您在Google搜索结果页上输入Google Chrome浏览器的Javascript控制台时,以下内容将在页面中输出“人员还搜索”和“相关搜索”数据(如果存在)。

此外,还有一个名为“ 关键字无处不在”的Chrome附加组件,它将在搜索结果中公开这些字词,正如本文中的几个SERP截屏所示。

结论

尤其对于内部营销人员来说,了解哪些工具倾向于使数据与垂直方向最为一致非常重要。
在这个分析中,我们展示了少量主题工具中的一些常用工具的一些优点和缺点。
我们希望提供一种方法,可以构成您自己的分析或进一步改进的基础,并为优化提供更实用的选择研究工具的方法。

关键字研究工具不断发展并通过使用点击流数据和其他数据源添加新发现的查询。
这些工具的实用性正是基于它们帮助我们更简洁地理解如何更好地定位我们的内容以适合真实用户兴趣而不是返回关键字的原始数量的能力。
不要只使用一直使用的东西。
测试各种工具并评估它们对自己的用处。