注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

xue-junming 的博客

珍爱 珍惜 助人 助己

 
 
 

日志

 
 

【转载】淘宝搜索的基础优化研究  

2013-12-20 23:41:06|  分类: 淘宝购物 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 人眼可以轻松看出很糟糕的标题,但对符合seo基本原则的标题,很难进行准确辨别。因为没有“更好”的判断标准,因此标题优化往往到达“好”的程度就不得不止步了。如果我们能知道某个标题比另外一个标题好,也就意味着能优化出更好的标题。

  很多人认为淘宝seo的老三篇(标题优化丶下架时间优化丶属性优化),研究已经到底了,基本原则丶基本技巧该掌握的都掌握了。我恰恰相反,一直认为淘宝搜索的基础优化,还远远没有研究到位,有巨大的潜力空间未挖掘出来。

  例如,在标题优化中,以下问题很少被完整地考虑:

1.当前权重下,应该竞争什么关键词?权重变化后,应该怎么调整标题?

2.标题保留哪个分词确定效益最大?

3.过去获得流量的关键词哪些要保护?哪些分词效率低要放弃?

4.分词顺序怎样排列,才能获得数量最多总价值最大的紧密连接?什么情况下分词重复比不重复更划算?

5.流量大和高精准之间怎么平衡?

  上述5个方面有些是相互竞争的,如何找出综合利益最大化的方案?现有优化技术是无法解决的。如果取得突破,爆发的能量会是惊人的。

  (二)我们用了很多时间研究下面这个命题:怎么评估这个标题比另一个标题更好?

  我们认为:在当前权重下,获得实际利益更大的标题,就是更好的标题。因此问题转化为:怎么考核标题的实际利益?

  标题实际获得的流量和转化是可以监测的。如果能排除下架时间丶销量变化和对手变化带来的条件干扰,某个标题是否比另一个标题更好,是可以确定知道的。然而,通过实际流量效果监测来对比标题,需要的时间太多,代价太大,变数太大,是不现实的。

  但它可以给我们很好的提示:

  如果我们能把实测效果折射成可以获得的参数,在一定的置信度下,我们就可以模拟计算标题的总效果,并通过实际效果来校验调节。

  也许,就能对各种标题组合进行模拟计算,通过计算来快速选出较佳的标题。

  我们按这个方向做了大量尝试。激动地发现,好像找到了一片全新的空间:海量计算。

  (三) 我们用一个叫“总权重”的参数,代表每个标题可能得到的总利益。这个总利益包括多个角度的指标,例如:

   一. 历史和未来的平衡



 淘宝搜索的基础优化研究 - 易水寒 - 易水寒 “总权重”的第一个重要成分来自量子数据:过去7天,本宝贝每个获得过流量的关键词,实际获得的入店数。

  量子数据反映的是标题的历史。提供的是“要保护哪些已经获得好流量的关键词”,以及“哪些关键词点击率高丶转化好”的信息。如果关键词没有进入过标题,或者没有以正确的方式进入标题(分词顺序),就没有流量信息可以参考。

  对等的,我们设计了一个“权重评估”参数来反映标题的未来。也就是宝贝当前权重下可能取得排名的关键词。这些关键词有些过去取得过流量,有些还没有获得过流量。已经获得过流量的关键词的权重评估,跟实际获得的流量对照,可以为还没有获得过流量的关键词提供参数校正。(关于这个算法可以写一个长篇。目前我们在模型中采用了一个取巧的临时办法,实际上这个角度可以有很深入的挖掘)。

  面向历史和面向未来,这两个角度都同等重要。他们在一个公式里互相制约,在探索新流量机会和保护已有流量之间建立平衡。

  这两个指标还有一个很大的用处,就是修改标题后7天,可以根据流量反馈结果,重新演算标题,通过迭代优化,不断自动改善标题效果,实际效果非常好。

  2. 关键词的相关度

  包含高转化分词的关键词,在标题构造时给予更高的权重。

  例如对于一款大码文胸,大码丶大胸是转化敏感度高的,而文胸丶内衣是转化敏感度中的。淘宝搜索的基础优化研究 - 易水寒 - 易水寒量子虽然可以告诉我们某些关键词带来了转化,但有许多偶然转化的原因是复杂的,不一定是宝贝相关的(有些转化词甚至是完全无关的),而许多未有转化数据或者未有流量的关键词,却是有高转化潜力的。因此转化敏感度不能通过量子数据判断,必须人工评估。

  通过人工判断得到的相关度权重比较准确,可以极大提高标题的品质。

 (四)3. 紧密连接词的利用

   关键词有两种:紧密排名关键词,疏松排名关键词。
   紧密排名关键词就是,当你搜索AB 的时候,搜索结果前列都是AB,而A B,ACB,BA,BCA,B A都拿不到排名。
   疏松排名关键词就是,当你搜索AB 的时候,AB,A B,ACB,BA,BCA,B A都有机会拿到排名。

 紧密连接的合理利用,非常有价值。例如宝贝权重不高的情况下,如果某个词是紧密连接词,而很少人在标题中使用这个紧密连接,你就可以轻松得到一个小蓝海。

 对于高权重的宝贝,紧密连接词的意义更大,许多时候简单调整一下标题顺序,就可以让标题获得的流量取得惊人的增长或者下滑——获得或者失去了某个紧密连接词的流量。

 一些优化公司喜欢做“优化10分钟,关键词立即进入首页”的表演(我自己也干过),通过调整标题顺序形成紧密连接词是最常用的三种手法之一。

 紧密连接词如此重要,它在标题总利益的考核中占有极其重要的位置:

 1) 分词重复的计算

 传统优化思路里,分词重复是很少的,有些优化软件甚至将分词重复作为扣分项目。但实践可以证明,合理重复价值是非常大的。一个高价值的紧密连接词,胜过许多的长尾词。

  标题的长度是有限的。你要是放进了“无钢圈文胸”这个紧密连接,那么“全罩杯文胸”要不要?如果“无钢圈文胸” “全罩杯文胸”都分别以紧密连接方式保留,重复了一个“文胸”分词,必然挤占了另一个分词的名额,跟这个分词相关的所有关键词都放弃了。这样是值得的吗?

  不要将分词重复当作“关键词堆砌”。对于关键词堆砌的定义,很多人有误解,把百度的要求套到淘宝上。在淘宝的定义中,分词的必要重复并不是堆砌,与宝贝不相干的关键词(特别是品牌名)才是堆砌。

  我们找到了一个算法,计算每一个紧密连接词带来的好处(紧密关键词获得流量的几率),跟放弃分词带来的损失(跟该分词有关的大量关键词组合可以获得的总流量几率)进行对比,通过对比决定最终是否要保留某个紧密连接词。

 2)标题顺序的计算

 标题组合顺序稍微变化,所能获得的紧密连接词就发生巨大变化。怎么找出包含最多最重要(搜索量大且与宝贝当前权重匹配)紧密连接词的标题组合?我们建立了一个算法来评估不同标题顺序的潜在利益。

 现在软件已经可以演算出:怎样的排列顺序是最佳的,某个标题顺序比另一个标题顺序好多少。

 (五) 我们在开发直通车自动优化系统的时候,发现类目丶店铺和宝贝的差别极大,没有办法让所有宝贝用同一个流程。最后采用了“执行程序+优化模板”的模式,不用的类目丶店铺丶宝贝套用不同的优化模板丶或者修改模板参数来控制优化流程。在标题优化中,存在类似的情况。

  不同类目丶不同宝贝丶宝贝不同阶段, 计算标题总利益的时候,有不同的个性需求。在算法模型中,关键环节引入了人脑的参与。

  以下人脑参与的环节极大影响标题效果:

  1) 要分析的关键词是否全面

  如果挖词有重要遗漏,应该优化的词却没有添加入分析名单,得到的标题就会有重大损失。优化人员需要参与关键词的挖掘添加,避免重要关键词的遗漏。

  2) 参加分析的关键词,是否与宝贝相关

  如果人工确认工作不细致,不恰当关键词的数据就会干扰最终的权重计算。

  3) 分词的转化敏感性设置是否准确

  由于分词的转化敏感度设置对标题的影响权重很大,如果优化人员对于宝贝特征的理解不到位,标题就可能会走形。

  4)调节参数是否体现优化意图

  以下3个是最常用的调节参数淘宝搜索的基础优化研究 - 易水寒 - 易水寒   人脑的参与是双刃剑。一方面可以更好地体现优化人员的意图,另外一方面带来优化效果的不确定性。

   后者在试用户处也得到验证。我们曾经将这套软件的部分功能放在官网上,发展了一批试用户,观察使用情况。发现如果没有通过培训充分引导和强调,极容易因为不认真丶对要求误解丶对宝贝特征不了解而产生低品质设置,从而影响标题计算结果。


(六)

  搜索优化的水很深很深,但又清澈可见。一方面虽然公开的信息很少,有无数的假说和谣传,但做测试的代价很低,并且流量反馈数据非常精确,研究起来比较直接;另一方面虽然他不断变化,但这个变化是有迹可循的,那就是淘宝的现实目标和潜在的考核指标, 

  淘宝搜索优化有两条明显的主线要关注:顾客体验,分流。分流是目前最重要的变化热点,各种名目的分流,既增加了搜索优化的难度,也增加了搜索优化的机会。这里只讨论分流的最传统项目:下架时间。

 下架时间的选择有类似标题优化的相同问题:两个熟手卖家各选一个下架时间,哪个是更好的?

 下架时间如果仅仅在宝贝级别去研究,是没有办法研究透彻的。我们认为,只有具体到关键词级别,研究主要关键词受下架时间的影响,并以总利益的推算作为取舍依据,才能实现下架时间的最优化。

 目前算法初步解决了三个问题:

 1. 下架时间对单一关键词利益的影响

 主要是考虑与竞争对手的下架时间冲突。如果避开“有竞争力”对手的下架时间,有利于在下架时间获得某个关键词排名的难易影响。

 2.下架时间对多个关键词利益的影响

 分析多个词的对手分布,并结合每个关键词的搜索量丶“有竞争力”对手数量,计算每个时间段的竞争“性能价格比”。

 3.行业一周流量曲线,对于选择下架时间的影响

 仅仅错峰竞争是不够的。虽然凌晨没有竞争,但也没有流量。要选择行业流量尽量大,“有竞争力”对手又尽量不在的区间。

 上述算法虽然比目前大部分店铺的做法精细很多,还其实还很粗糙,有很大改进余地。但起码可以说明:

 下架时间也是可以计算出来的。

 我们已经发现了新的计算参数。以后有进展再向大家介绍。

(七)上面粗略介绍了,通过软件进行海量计算,可以有依据地推算:标题应该用什么分词,标题应该按什么顺序排列,下架时间怎么选择。软件自动推算不是重点,重点是怎么推算。随着算法的不断成熟,我们相信会有很大的空间逐渐被挖掘出来。

 这个跟传统的优化思路,有很大的区别。可能暗示了淘宝搜索优化技术的新方向。

 有卖家会问:搞得这么精细,有必要么?

 对于低权重宝贝,是没有必要的。而对于花费巨量时间和金钱打造的重点宝贝,深挖标题利益是很有必要的。

 对于重点宝贝,哪怕10%的搜索增长都能带来巨大的价值,而10%增长通过搜索潜力挖掘是很容易获得的,未经释放的优化潜力绝不只10%。——证明这一点很简单,根据量子的搜索流量数据,将标题改一改,你可以轻而易举将搜索流量减少50%。

 淘宝搜索优化,实质是零和竞争。每天的搜索量就那么多,你得到了,竞争对手们就失去。你的回头客基数增加了,对手的基数就减少了。从竞争意义去看,店铺的搜索优化能力,是极其重要的战略能力。然而大部分的店铺,在搜索优化上的投入是不足的。包括很多经营已经很好的店铺,在搜索优化精细度上是不够的。

 卖家在打造宝贝权重上花费的大投入,跟在搜索优化上的投入,完全不成比例。相当于辛辛苦苦把矿挖出来,却用很粗放的方式提炼。在流量资源稀缺年代,这是非常奇怪的反差。

  本文讨论的只是淘宝seo中最最古老的话题:标题优化和下架时间优化,哪怕这个人人耳熟能详的领域,我们仍能找到极多的增长点。而这仅仅是优化空间的冰山一角。

  大家很容易推论,我们日常浪费了多少本来可以得到的搜索流量,自己却不知道。
  评论这张
 
阅读(18)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017