如何防止与对robots.txt的有效的用途的复制内容和机器人阶标记
复制内容是我们通常遇到作为搜索引擎优化服务一部分我们提供的其中一个问题。 如果查寻引擎确定您的站点包含相似的内容,这也许起因于甚而惩罚和排除查寻引擎。 幸运地它是容易地被矫正的问题。
选择您的主要武器反对复制内容的可以在“由所有主要查寻引擎现在采取了的机器人排除协议之内”被找到。
有二种方式控制搜索引擎蜘蛛怎么标注您的站点。
1. 机器人排除文件或“robots.txt”和
2. 机器人 < Meta=""> 标记
机器人排除文件(Robots.txt)
这是在笔记薄可以被创造的一个简单的文本文件。 即一旦创造您必须上载文件入您的网站www.yourwebsite.com/robots.txt根目录。 在搜索引擎蜘蛛标注您的网站之前他们寻找正确地告诉他们如何标注您的站点的内容的这个文件。
使用robots.txt文件最适用与静态html站点或与排除某些文件在动态站点。 如果多数您的站点那么动态地被创造得考虑使用机器人标记。
创造您的robots.txt文件
例子1情景
如果您想使.txt文件可适用对所有搜索引擎蜘蛛和做整个选址可利用索引的。 robots.txt文件如下所示: :
用户代理: *
禁止:
解释
使用与“用户代理的”星号意味这个robots.txt文件适用于所有搜索引擎蜘蛛。 通过留给“禁止”站点的所有部分适用于索引的空白。
例子2情景
如果您想使.txt文件可适用对所有搜索引擎蜘蛛和从标注常见问题解答停止蜘蛛, cgi容器图象目录和具体页称faqs.html在根目录, robots.txt文件内包含如下所示: :
用户代理: *
禁止: /faq/
禁止: /cgi-bin/
禁止: /images/
禁止: /faqs.html
解释
使用与“用户代理的”星号意味这个robots.txt文件适用于所有搜索引擎蜘蛛。 防止对目录的通入通过命名他们达到,并且具体页直接地参考。 名字文件&目录不会由任何搜索引擎蜘蛛现在标注。
例子3情景
如果您想使.txt文件可适用对谷歌蜘蛛, googlebot和从标注常见问题解答、cgi容器、图象目录和称在根目录内包含的faqs.html的具体超文字标记语言页停止它, robots.txt文件如下所示:
用户代理: googlebot
禁止: /faq/
禁止: /cgi-bin/
禁止: /images/
禁止: /faqs.html
解释
通过命名特殊查寻蜘蛛在“用户代理”您防止它标注您指定的内容。 防止对目录的通入通过命名他们达到,并且具体页直接地参考。 名字文件&目录不会由Google标注。
那是全部那里是对它!
如前面提到robots.txt文件可以是难实施在动态站点情况下,并且在这种情况下使用robots.txt的组合大概是必要的,并且机器人标记。
机器人标记
这个可供选择的方法告诉查寻引擎如何处理站点内容出现于网页的部分。 一个简单例子如下是;
在本例中我们告诉所有查寻引擎不标注页或不跟随在页内包含的其中任一个链接。
在这第二例子i,因为站点包含对时间敏感的信息,不要要谷歌贮藏页。 这可以通过增加“noarchive”方针达到。
什么可能是更加简单的!
虽然有防止复制内容其他方式出现于查寻引擎这是的最简单实施,并且所有网站应该操作robots.txt文件和或机器人标记组合。
您应该需要关于我们的搜索引擎行销的详细信息或优化服务喜欢拜访我们在
http://www.e-prominence.co.uk ? 查寻营销公司
文章来源: Messaggiamo.Com
Related:
» Credit Secrets Bible
» Cash Making Power Sites
» Home Cash Course
» Automated Cash Formula
网管得到HTML代码
加上这条到你的网站!
网站管理员提交你的文章
无须登记!填写好的表格和你的文章是在 Messaggiamo.Com 目录!
版权 2006-2011 Messaggiamo.Com -
网站地图 -
Privacy -
网站管理员提交你的文章,以 Messaggiamo.Com 目录 [0.01]