一、动态网站相比静态的优势
互联网最初是以HTML静态页面形式在服务器上出现的,访问者浏览的页面都是这些静态页面。随着数据库和脚本技术PERL、ASP、 PHP和JSP等技术的发展,动态页面开始被大量的站点所使用。比如,我们在GOOGLE.COM上搜索一个内容,得到的 搜索结果页面文件"本身"在GOOGLE服务器上并不存在,其实在我们入搜索内容时从后台调用数据库的时候才生成的,所以说这些结果的页面都是动态的。静态页面的站点只单纯的与文件的传输方面相关,然而动态站点却比较复杂,网站不再是单纯的发布内容,用户和站点之间的互相交流越来越频繁,它成为了一种应用,是软件向互联网扩展的结果,从软件角度看,动态站点是逻辑应用层和数据层的分离,数据库负责站点数据的存储管理,而ASP、PHP、JSP等负责处理站点的逻辑应用。这样的分工协作使交互功能越来越多,并且有利于站点的维护、更新和升级。所以动态网站技术带来了互联网上超大型的站点。
二、如何优化动态网站
动态网站要通过内容发布系统软件转化成静态页面后被搜索引擎抓取,这个方法很适合于页面发布变动比较少的站点,像一些新闻类的站点,一般的动态网站可以用一下的方法让搜索引擎抓取:第一,要以假乱真,不要让动态页面的URL地址中存在"?",让他们看上去像静态页面,针对不同的动态技术可以采用不同的技术实现:
为了让上面这些动态页面被搜索引擎抓取我们需要把这些页面的参数告诉搜索引擎机器人,因为它们不会自己输入参数,在营销中称为"gateway page"的这些静态页面,包含着大量指向动态页面的链接。只需要将这些入口页面的地址提交到搜索引擎,这些页面和链 接的动态页面就很容易的被搜索引擎所抓取。
三、搜索引擎技术发展对动态网站更友好
动态站点为了适应搜索引擎随着搜索引擎的发展而跟着变化。当前有很多的搜索引擎并不支持动态页面的抓取,但是GOOGLE、HOTBOT等和国内的百度已经开始尝试抓取动 态网站页面,所以运用这些搜索引擎搜索时都会搜到一些动态链接,在抓取动态页面的过程中,为了避免"搜索机器人陷阱", 都只抓取通过静态页面链接的动态页面,对于那些由动态页面链接的动态页面都不抓取。所以在单纯的针对上面这些搜索引擎的时候可以对一些方法进行简化:只要将入口页面带有链接大量的动态页面递交给搜索引擎就可以了。对于那些直接使用动态URL的地址要注意文件中不要存在Session Id,以及不要用I D作为参数名称,尽量减少参数的数量保持在2个以内;能不能就不用,把一些参数转移到其他位置,这样动态页面被抓取的概率就会大大提高。 |