如何利用聚合页和词库做SEO流量

  • A+
所属分类:seo分析 网站优化

对大中型网站的SEO工作来说,人工分类只能解决中短尾词的着陆页需求,可能做成分类列表,也可能做成专题页来抢占关键词排名。

但还有大量的长尾搜索需求该如何覆盖呢?

常规做法是长尾词聚合页

聚合页是什么?

举个例子,看阿里巴巴产品聚合页

聚合页面之间需要做一些内链,并且在网站高权重页面加索引入口,以加快收录,从而获得大量长尾流量。

这种做法对于B2B和分类信息网站来说都是惯用手段。

搜索引擎也会时不时打击下这种页面类型,但如果网站内容足够丰富,搜索相关性不是太离谱,内容足够支撑页面的话,这种优化方法必须要做。

词库搭建

因为聚合页是由大量长尾关键词自动生成,所以词库质量好坏,直接影响到搜索流量。

如何获得大量长尾词?

金花关键词工具
战神关键词工具
5118关键词拓展

SEO流量

5118付费会员可以下载某个域名下的全部百度PC关键词。

通过以上工具,可以获得大量长尾关键词,以便于做后续的研究分析。

词库清洗

虽然可以通过第三方工具可以获得大量关键词,但是你需要做数据清洗,比如过滤一些违法词,或者对关键词进行文本分析替换或删除。

如果词量巨大,动辄百万,甚至千万的时候,常规的文本编辑器都很难处理了。(比如sublime,editplus等)

这时候需要用靠编程的手段来辅助处理,或者使用一些Linux下的强大文本处理指令,如Sed或Awk。这些工具Mac也是默认支持的。

比如我需获取从300万词中提取纯关键词,就是不包含地区名(主要是城市名)、不包含”供应“、”价格“、”批发“等,最好是一个专有名词,不包含其他修饰词或组合。

比如”宜昌专业的seo公司哪家好“,处理后的”纯词“应为”宜昌seo“。

这样方便以后自己拓展,比如为了抢产品的价格和报价,我们可以组合词 ”宜昌seo公司“,”宜昌seo公司报价“等长尾词,这样页面设计和SEO元素都会更加精准,页面质量也可以更高。

如果想做图片词聚合页面,使用”纯词“ 另外组合出”宜昌seo公司前十名“即可。

为了实现这样的效果,需要简单学一些sed命令。

删除包含某个关键词的行

比如我要删除包含:”美女“ 关键词的行。

sed -i.bak '/美女/d' filename

这个命令就可以删除词库中包含”美女“这个关键词的行,直接更新当前文件,并且对原始文件做一个备份,扩展名为.bak。(filename.bak)

关键词替换

比如我要把所有关键词中包含的”出口“换成“进口”:

sed -i.bak 's/出口/进口/g' filename

s字符代表替换,g代表全局替换,如果只替换第一个出现的“出口”,则可以去掉。

关键词删除

那删除呢?其实就是也是一种替换,那就是把符合的词,替换成空。

比如我要把所有关键词中开头包含的”供应“去掉:

sed -i.bak 's/^供应//g' filename

s字符代表替换,“^供应”代表以“供应”开头的关键词(支持正则),g代表替换所有“供应”,如果只替换第一个出现的“供应”,则可以去掉。

如果我要把所有关键词中结尾包含的”厂“去掉:

sed -i.bak 's/厂$//g' filename

“厂$”代表以“厂”结尾的关键词

根据关键词长度过滤词

删除小于等于三个字符的关键词

sed -i.bak -r '/^.{,3}$/d' filename
注意:这里不是按字节算的长度,比如即使UTF-8格式,也是每个汉字算1个,而不是算3。

删除大于等于十个字符的关键词

sed -i.bak -r '/^.{10,}$/d' filename
当然,值得字符长度区间也是可以的。

去掉所有匹配到的城市名

sed -i.bak 's/[鞍山|安阳|安庆|安康|阿克苏|安顺|阿勒泰|阿拉善|阿坝|阿里|阿拉尔|澳门|北京|保定|滨州|包头|宝鸡|本溪|蚌埠|北海|巴彦淖尔|白城|白山|亳州|巴中|白银|百色|毕节|巴音郭楞|保山|博尔塔拉|成都|重庆|长沙|长春|常州|沧州|赤峰|承德|常德|长治|郴州|滁州|巢湖|潮州|昌吉|池