发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
选择字号: 超大 标准 发布时间:2014-7-23 15:37:25 | 作者:Searcheo | 0个评论 | 人浏览
本文地址:http://www.searcheo.cn/post/140.html 转载请注明出处!
什么是URL规范化?
URL规范化(url normalization)其实就是一个标准化URL的过程,其实也就是将一个URL转化为一个符合规范的等价URL,这样程序可以确定这两个URL是等价的。
URL规范化用于搜索引擎可以减少对页面的重复索引,同时也可以减少爬虫的重复抓取。浏览器端识别用户是否访问过一个URL也需要使用URL规范化。
怎么样才能使URL更规范化呢?
1、网站所有URL尽量全部使用绝对地址,可以有效的防止网站被人家把恶意镜像。还有一重要的作用就是,网络中如果有人引用了你的网站内容,你会获得来自外界的导入链接。
2、尽量把带www与不带www的域名区别开来,尽量使用一个为常用的URL,然后另外一个做好301重定向。
如:常用的域名www.searcheo.cn 那么我们在网站上所有首页的域名都应该用www.searcheo.cn。这个时候我们就可以通过301把searcheo.cn这域名重定向到www.searcheo.cn上,www.searcheo.cn/index.html的也做301重定向到www.searcheo.cn,这样既减少页面的重复度并可以集中主域名的权重。
3、动态URL和静态URL都差不多,正常来说影响不大,扩展名其实无关紧要。如:.html,.htm,.asp,.php等等,对搜索来说,并没有什么区别,关键一点,我们在做锚文本时,尽量选择一个常用的,一般都选.html的。
如:第一次做锚文本用:http://www.searcheo.cn/lizhi/322.html有可能这个页面还可以通过http://www.searcheo.cn/lizhi/322.php访问。那么我们以后将出现同样锚文本时,也选择第一种。如果第一次做是选择的第二种,那以后出现在这样的锚文本时,则我们也全部用第二种。
4、外链与内部链接尽量做到一致,意思其实同上,也就是做外链时尽量也做与锚文本一样的URL。
5、URL 尽量用简单的英文,最好能包含页面的大概意思,比如页面主要介绍SEO的内容,那么URL可以www.searcheo.cn/seo/这样。
不规范的URL:
1 URL中多余的字符
1.1 子域名的URL中包含"www": "http://www.searcheo.cn/"
1.2 含有默认端口: "http://www.searcheo.cn:80/shuchao/"
1.3 松散的URL: "http://www.searcheo.cn/books/amazon-sucks-donkey-balls/9780470170779-item.html"
1.4 多余默认文件名index.html,default.aspx等:"http://www.searcheo.cn/shuchao/index.html"
1.5 文件路径中
(1) 多余的"/":"http://www.searcheo.cn/shuchao//"
(2) 多余的点修饰串:"x/y/z/http://www.searcheo.cn/a/b/http://www.searcheo.cn/../page.html"
1.6 查询串中多余的
(1) ? (空查询串):http://www.searcheo.cn/shuchao?
(2) &
(3) 无用的查询变量:http://www.searcheo.cn/display?id=123&fake=fake
2 URL缺少字符串
2.1 缺少"/":"http://www.searcheo.cn/shuchao"
2.2 查询串缺少名称或者值:"http://www.searcheo.cn/display?id=" 或者 "http://www.searcheo.cn/display?=123"
3 其他不规范的URL
3.1 "http://searcheo.cnm/" 与 "http://www.searcheo.cn/shuchao/"其实是相同的内容
3.2 使用IP代替域名
3.3 含有扩充字符(extended characters),大小写敏感("http://www.google.cn/Intl/zh-CN/about.html" 和"http://www.google.cn/intl/zh-CN/about.html")
3.4 "+"和"%20"混用
3.5 查询变量顺序混乱:"http://www.searcheo.cn/test.aspx?bar=1&a=test"
3.6 含临时的状态变量:http://www.searcheo.cn/test?back=/prevpage.aspx
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
2015-2-12 10:16:13
2015-4-20 11:12:21
2016-3-25 18:17:36
2014-9-26 9:55:43