Semrush 和 Similarweb 是如何知道每个网站的流量数据的?
大家好,我是哥飞。
经常有朋友问,Semrush 和 Similarweb 是如何知道每个网站的流量数据的?
今天哥飞就跟大家聊聊这个问题,说的都是哥飞个人的理解,不一定全对哈。
首先这两家肯定都会有海量的爬虫,去收集整个互联网上的每一个网站的信息。
通过分析爬取到的 html 源码,就能够知道各个网站之间的链接关系。
然后也会去爬各个搜索引擎如谷歌的各个关键词的搜索结果,知道每一个关键词的每一个搜索结果是哪些网站的哪些网页。
再去跟一些网站或者数据方合作,得到一些真实的数据。
最后把这些所有的数据整合起来,建立一个流量模型,就够知道每一个网站的流量了。
原理是什么呢?
在已知每个关键词的搜索总量和每个搜索结果位置能够拿到的流量占比的情况下,就能知道这些网站从每一个关键词拿到的流量。
再把每个网站的所有关键词拿到的流量加起来,就知道了每个网站的能拿到的总搜索流量。
那么怎么知道每个关键词的搜索总量呢?
可以有多种办法,假设知道了A关键词的排名第一的网站的从A关键词拿到的准确流量,是不是就可以反推A关键词的搜索总量。
反过来,当已经知道B关键词的搜索总量情况下,也知道排名第一的网站从B关键词拿到的准确流量,是不是就可以算出排名第一能够拿到的流量占比。
从各种途径去获取各种数据,最后建立一个模型,把已知的数据填进去,就能够推算未知的数据,而且已知的数据之间还可以互相印证,找出有问题的数据。
不管是 Semrush 还是 Similarweb ,他们的方式都差不多,建立一个大模型,模拟每天各个网站之间的流量流动情况,再与真实数据印证,调整模型参数和各种因子,最终得到每个网站的流量数据。
我们拿个例子看看就知道了。
最近 iPhone 15 上市了,我们就拿这个词来说。
我们先在谷歌上搜索“iPhone 15”,可以看到结果如下,排第1的肯定得是苹果的官方网页。
再在 Semrush 搜索一下,可以看到美国的搜索量是673K。
拉到下面的“SERP”模块,可以看到排名第一的也是苹果的这个官方页面。
我们点击哥飞红色框出的位置,打开 Semrush 的新页面。
可以看到,“iPhone 15”这个关键词,在第1位置,能够拿到的点击流量是80%。
记住这个数字,也就是说,一个词只要排到了第一名,大多数情况下,都是能够吃到搜索总量的80%的流量的。
为什么说是大多数情况下呢?
我们拿“ChatGPT”这个词来看看就知道了,谷歌搜索结果如下。
再看 Semrush 的结果,前两个结果跟谷歌搜索结果是一样的。
分别点击两个红框,打开看数据,你看,排名第1的拿到了55%的点击,而排名第2的拿到了35.5%点击。
至于为什么排名到了第1,也只拿到55%的点击,哥飞也不知道真实原因,今天这篇文章,我们暂不深究这个问题。
总结一下,Semrush 和 Similarweb 的流量数据都是用模型运算推测出来的。这个特别复杂的模型还结合了真实数据来校验修正算法。
白丁学者 » Semrush 和 Similarweb 是如何知道每个网站的流量数据的?