
经常有人让我帮忙简单说说SEO相关(related)的数据分析怎么做,甚至期望能几小时速成。
佛山网站优化可以从狭义或者广义两个方面来说明,网站优化是对网站进行程序、域名注册查询、内容、版块、布局等多方面的优化调整,也就是网站设计时适合搜索引擎检索,满足搜索引擎排名的指标,从而在搜索引擎检索中获得流量排名靠前,增强搜索引擎营销的效果使网站的产品相关的关键词能有好的排位。佛山SEO目的理解是:为网站提供生态式的自我营销解决方案,让网站在行业内占据领先地位,从而获得品牌收益;SEO包含站外SEO和站内SEO两方面;SEO是指为了从搜索引擎中获得更多的免费流量,从网站结构、内容建设方案、用户互动传播、页面等角度进行合理规划,使网站更适合搜索引擎的索引原则的行为;使网站更适合搜索引擎的索引原则又被称为对搜索引擎优化,对搜索引擎优化不仅能够提高SEO的效果,还会使搜索引擎中显示的网站相关信息对用户来说更具有吸引力。但这方面涵盖的太多,不可能三言两语就说尽,也不知可从哪里简单概括。
SEO是一个非常不成熟的行业,能参考的资料极有限,大多数东西都要通过(tōng guò)数据(data)来摸索,而摸索的过程中,往往能揭露凭过往的直觉没有意识到的真相。所以数据化有时对于SEO是非常残酷的,往往一份简单的数据就可以否定掉一群人数年的努力工作。
就拿最常见的例子来说,seo(搜索引擎优化)流量(单位:立方米每秒)是怎么组成的大多数人觉得那是靠热门关键词撑起来的,或者认为是大量的热门关键词撑起来的,于是认为热门词的排名上去流量肯定会涨,却不然。对于大多数稍大的网站,绝大多数SEO流量都是由百度指数都没法看到的极其长尾的词带来的。因此哪怕用再大的力气去做热门词的排名,它们贡献的流量依旧很有限。
或许有人会认为这不可思议,因为从来没看到过这样的数据。但这数据是只有通过(tōng guò)分析网站的原始日志才能得出的结论,而Google Analytics此类采样率极低的统计系统(system)无法看到这样的数据。更不提哪怕会熟练用GA的SEO也甚少,因此SEO流量的真相几乎是从不被人看到的。
所以,有时听人说,而我常常说,一点也不夸大。
如何开始学习数据分析
seo(搜索引擎优化)(搜索引擎优化)的最终目的是给网站产生收益(shōu yì),因此核心指标有两个:转化、流量。
比如流量再可以细分:流量 = 收录 * 排名 * 点击率 * 搜索量
收录可以再细分:收录 = 抓取量 * 页面质量
而比如抓取量,它的瓶颈依情况,可能是抓取时间封顶、可能是抓取总量封顶、可能是页面总量封顶。各种情况都有不同的处理(chǔ lǐ)方式,需加入不同的数据指标。
通过类似这样的分法,从最终数据(data)指标(target aim)可以逐步细分出几十几百个数据指标,这些数据指标都是有用的,因为它们的数值变动以后,最终也会影响(influence)到转化或流量。
当一个主要数据指标产生波动的时候,就需要通过细分数据来分析具体的原因,后面有两个举例提及大致思路与步骤。
之间涉及到的面则非常广
首先要了解搜索引擎的基础原理,这才能知道在什么情况下什么数据指标是有关的;
之后需要对多种技术的入门级知识,因为各类数据的获取方式都不同,有些需要采集、有些需从日志提取、有些从数据仓库导出、有些从API获取等等,需要学习的方向不尽相同;
单单的数据只是数字,还需要分析数据才能让它产生价值。临时性的分析一般用到Excel,监控类的分析则需要自己做个能输出图表的报表系统。
这些至少要花个半年功夫才能学会,但并不算难,没有什么可畏惧的。就如学习1+1时都会觉得9*9是难的,但学会后再往回看,那就没什么了。
一个基础的假想案例分析
假设个较接近于实际应用的例子:
一个游戏类论坛,A板块为网盘游戏下载,非常多页面上有到X网盘的导出链接;B板块为BT下载,页面上有一个站内的种子下载链接,无站外导出链接。
开始分析:
统计页面的抓取数量与即时收录数量,并计算之后,发现A板块的页面质量明显低于B。
那么此时猜测,是否是A板块论坛帖子页面上,X网盘的导出链接导致了它的页面质量低?
为了验证猜测,再将A板块的论坛帖子页面分为两组,其中aa组有X网盘的导出链接、bb组没有X网盘的导出链接。分别计算其页面质量。如果aa组帖子的页面质量明显低于bb组,那么可以得出初步结论:
X网盘的导出链接,使得自身帖子页面质量降低,影响(influence)到收录量,并最终导致SEO流量受损。所以需将该类导出链接做特殊处理(chǔ lǐ),比如由自己站内URL,301跳转到X网盘等。
当然这个结论未必是正确的。比如,aa组帖子具备的特征,除了具有X网盘的导出链接外,也可能具备的特征如帖子比较多,可能是后者真正导致了其页面质量的低下。
尽管更严谨的数据分析更可能得出准确的结论,但这般严谨下去就没个头了,SEO(搜索引擎优化)毕竟不是火箭科学,在某步的数据获取很有难度时,借助经验(experience)来猜测下可能更划得来。
所以可以先实施项目,然后再监控整个A板块相对B板块的页面质量是否有拉近,从而以最终效果来证实之前的猜测正确与否。
尽管这个例子完全为假设,我并不确定实际情况中,帖子到网盘的导出链接是否会影响到页面质量。但类似的例子平日能遇到非常多,且此类分析(Analyse)的时候所需的数据收集起来方便,因此这是日常SEO数据分析最容易碰到的一类情况。
一个进阶的实际案例分析
内页的流量在某一时间段大幅度下降,需分析其下降原因。
一个常用且管用的思路是,取25%的热词,看它们带来的流量、与另外75%词分别的变化。如果得出的数据是热词的流量下降多,即多半为热词的排名有下降;如果下降程度相当,则为整体的影响。
首先,计算得出25%的热门关键(解释:比喻事物的重要组成部分)词(KEY),它们的流量下滑幅度为35%;而75%的非热词,它们的流量下滑幅度为30%。
但虽然数据差了5%,但差距还不是特别明显,需要进一步分析才能确定。
因为关键(解释:比喻事物的重要组成部分)词往往是可以被进一步分词的,如可进一步分为两个检索词、而且检索词才是搜索引擎真正在处理的。佛山网络优化是指通过各种硬件或软件技术使网络性能达到我们需要的最佳平衡点。 硬件方面指在合理分析系统需要后在性能和价格方面作出最优解! 软件方面指通过对软件参数的设置以期取得在软件承受范围内达到最高性能负载! 网络优化也是SEO。所以进一步的分析就去分析25%的热门检索词流量的变化。
最终得出的数据是,包含25%热门检索词的关键词流量下降了40%,不包含热门检索词的词流量仅下降10%。
那么结论就很清晰了,热门检索词相关(related)的流量产生了变化。之后对比网站近期的项目(xiàng mù)上线列表,没有涉及到这部分的修改,所以这是百度的算法调整所导致的。
知道了流量的变动原因后,自然也就可以有一些相应的改进方案了。尽管方案能执行与否尚取决于网站对SEO(搜索引擎优化)的重视程度,但至少不用借口于:之类。