首页>>新闻>>郑州APP开发闪创科技:怎样避免大量URL被重复收录

郑州APP开发闪创科技:怎样避免大量URL被重复收录

18-11-01

在网站优化的过程中,我们经常会碰到url被重复收录的现象,给网站优化添加了不少阻碍,那么如何避免这种情况呢?郑州APP开发闪创科技凭借多年网站运营经验,来跟大家说一说自己的方法。


一、URL参数

也叫URL query,是一个最复杂,最容易被忽视,最容易被妥协的问题。他是网站运营中必不可少的元素,如果简单的去除,其他部门就无法工作了。URL参数经常被用于以下几方面:

1.同一个实体的不同状态展示,比如同一个酒店,在不同时间点会有不同的房间库存。

2.为了统计不同渠道的流量

3.为了统计不同渠道,具体模块的点击量

4.调试

5.全世界最奇葩的是亚马逊,居然把统计参数放到了路径中

出现这种问题的坏处有几点:

(1)浪费搜索引擎对你网站的各项配额,从而影响其他正常的页面。

(2)丢失很多本应拿到的链接加分,站外渠道的链接往往是最优质的。同一个URL的分值可能分散成几十份。

(3)SEO的流量被统计到别的渠道(因为tracking字段写的是别的渠道,而且被收录被点击)。

(4)往往形成一种局面,产品用一套URL,SEO用另一套URL,甚至不同渠道用不同的URL,后期开发和维护的成本极高。

为了解决这个问题,首先要弄清网页的URL的定义。以我的理解,每一个URL是一个静态的、独立不重复的、有意义的实体,一般也有检索意义(就是有人会搜)。比如一个人,一辆车,一条道路,一个零件。而不能混入各种“状态”,比如这个人生病的时候,难道就不是他自己了么? 一件商品在促销的状态难道是另一件商品了么?

理论上canonical标签就可以解决这个问题了,但是从实际测试结果看,效果并不明显,几乎可以忽略不计。那么我的解决方案是这样的:

(1)建立好网站的思维导图和元信息。

(2)所有和SEO元信息相关的参数都放到路径中去

(3)所有和SEO元信息不相干的参数都放到#后边,因为#后边不影响web服务器返回的内容。简单的说就是用”#”替代”?”。

(4)每个页面中都利用js获取#后边的参数对,通过二次请求发回给统计服务器

(5)如果#后边的参数影响页面内容,比如酒店的入住日期。那么这部分内容用ajax加载就行,他是不稳定的,不属于页面内容的一部分。(当然还有变通的办法,暂不赘述。)

(6)原始的#锚点定义肯定会冲突,定义一个#后边的变量,并用js控制屏幕滚动,来保证原始锚点的作用。

有人可能会想到,根据ua判断,如果是搜索引擎爬虫,就用跳转的方式去掉URL参数。但效率最高的方法必然是从一开始就不展示错误URL。那么前面的例子优化后就变成了:

其实我们的竞争对手早就使用这种方式了,但是由于我们的开发效率无法及时实现,还没有赶上行业的进度。所以对于一般的小网站,一定要考虑开发成本,不要轻易冒进。只要能避免问题的发生,变通的方法是很多的。

   网站建设知识>>

郑州企业网站建设,找闪创科技!

如何知道一个网站用什么语言开发的?

   app开发知识>>

开发一个APP大概需要多少钱

程序员面向软件开发时,如何成功?

   运营服务>>

互联网公司,产品重要还是运营重要?

全面网站SEO优化攻略