黑帽 SEO:404 页面如何避免被误认为

本文探讨了Web服务器404页面的自定义功能及其对搜索引擎的影响,介绍了如何利用这一特性进行搜索引擎优化,同时也提醒了在使用时要注意的问题。

404 页面是 Web 服务器无法检索到请求的网页或目录时,发回到浏览器端的一个提示页面,比如 IE8.0 访问某 IIS 时,返回的信息为:
<------------------------------------------------------------------------------>
无法找到该页
您正在搜索的页面可能已经删除、更名或暂时不可用。
--------------------------------------------------------------------------------
请尝试以下操作:
确保浏览器的地址栏中显示的网站地址的拼写和格式正确无误。
如果通过单击链接而到达了该网页,请与网站管理员联系,通知他们该链接的格式不正确。
单击后退按钮尝试另一个链接。
HTTP 错误 404 - 文件或目录未找到。
Internet 信息服务 (IIS)
--------------------------------------------------------------------------------
技术信息(为技术支持人员提供)
转到 Microsoft 产品支持服务并搜索包括“HTTP”和“404”的标题。
打开“IIS 帮助”(可在 IIS 管理器 (inetmgr) 中访问),然后搜索标题为“网站设置”、“常规管理任务”和“关于自定义错误消息”的主题。
<------------------------------------------------------------------------------>
而 Web 服务器 Apache 返回的信息形如:
<------------------------------------------------------------------------------>
Not Found
The requested URL /PHP5/DB/mysql/SP/sp_test.php was not found on this server.
<------------------------------------------------------------------------------>
Web 服务器 nginx 返回的信息形如:
<------------------------------------------------------------------------------>
404 Not Found
--------------------------------------------------------------------------------
nginx/0.7.62
<------------------------------------------------------------------------------>
但 Web 服务器,比如 Apache、IIS,通常都提供了对 404 报错页面的自定义功能,也就是说,允许指定一个页面,当发生 404 错误时,不是返回 Web 服务器的默认 404 页面,而是我们自己指定的这个页面。目的是提高网站的用户友好度。
很多人利用这个可以定制的 404 页面,放置一些公共信息,比如网站的介绍文字,甚至广告等等。
但很多人却利用了 Web 服务器的这种特性,对搜索引擎进行欺骗,从而达到一些个人目的。
具体怎么做呢?首先,他在网站上传若干页面,例如1000个,然后等待搜索引擎收录。待到被收录后,他不是继续制作新的页面,而仅仅是把这些页面改名。被收录的页面因为改名,被认为不存在了,这样网站就有1000个死链,而这些死链都会被 Web 服务器导向到 404 页面,例如广告页面。而改名后的1000个页面又可能会被搜素引擎再次收录。如此循环往复,虽然网站实际只有1000个页面,但搜索引擎会误认为有很多页面,因为搜索引擎排除死链是有一个时间延迟的。于是一个网站就会靠一部分网页,而把大量的搜索结果导向到定制的 404 页面,导致搜索引擎里包含大量的重复的、无效的指向。起初很多人就是靠这个来点击广告的。
后来这种伎俩被搜索引擎开发人员发现,他们就通过程序判断这种手法。但由于很多站长是由于网站改版等原因导致的这种结果,所以有时搜索引擎会误判。
所以站长对 404 定制页面要慎用,尤其像网站改版的时候。
作者:张庆(网眼) 2009-3-6
来自“网眼视界”:http://blog.why100000.com
“十万个为什么”电脑学习网:http://www.why100000.com

原文链接:http://blog.why100000.com/?p=718

内容概要:本文介绍了基于贝叶斯优化的CNN-LSTM混合神经网络在时间序列预测中的应用,并提供了完整的Matlab代码实现。该模型结合了卷积神经网络(CNN)在特征提取方面的优势与长短期记忆网络(LSTM)在处理时序依赖问题上的强大能力,形成一种高效的混合预测架构。通过贝叶斯优化算法自动调参,提升了模型的预测精度与泛化能力,适用于风电、光伏、负荷、交通流等多种复杂非线性系统的预测任务。文中还展示了模型训练流程、参数优化机制及实际预测效果分析,突出其在科研与工程应用中的实用性。; 适合人群:具备一定机器学习基基于贝叶斯优化CNN-LSTM混合神经网络预测(Matlab代码实现)础和Matlab编程经验的高校研究生、科研人员及从事预测建模的工程技术人员,尤其适合关注深度学习与智能优化算法结合应用的研究者。; 使用场景及目标:①解决各类时间序列预测问题,如能源出力预测、电力负荷预测、环境数据预测等;②学习如何将CNN-LSTM模型与贝叶斯优化相结合,提升模型性能;③掌握Matlab环境下深度学习模型搭建与超参数自动优化的技术路线。; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,重点关注贝叶斯优化模块与混合神经网络结构的设计逻辑,通过调整数据集和参数加深对模型工作机制的理解,同时可将其框架迁移至其他预测场景中验证效果。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值