第一种策略是非实时静态策略,但不适用于需要频繁更新数据并要求搜索引擎具有高实时性能的大型门户网站。大型新闻网站,例如网站新文章或公告,经常需要搜索引擎尽快在新闻中链接和关键词索引,因此频繁更新缓存页面服务器成本将非常大,缓存文件的空间将越来越大,因此为此提出了实时静态策略。

请求页面立即生成时间破坏静态页面缓存,爬虫机器人请求,首先查找是否存在缓存,以及页面缓存是否失效,如果缓存静态页面,则返回池中的有效静态页面,生成新的反向静态页面或更新静态页面的静态池,修改实时静态策略的原则。同时,这种实时静态策略还改进了页面缓存的方式。它为不同缓存页面的关键字设置不同的清理权重(即更新频率,需要手动设置)。相对稳定的页面,如主菜单、公司信息和其他显示页面,可以设置较小的权重值;对于经常更新的页面,如新闻公告和已发布消息的摘要页面,可以设置更大的权重值。权重较小的静态页面缓存时间较长,可以存储一天甚至一周,这可以大大节省频繁生成此类缓存的资源浪费。但是,具有较高权重的静态页面经常更新,因此缓存时间较短。考虑到搜索引擎的爬虫机器人不会实时捕获信息,而是在一段时间后(一般为4到5小时)才重新捕获信息,这种缓存可以在2到3小时或更短时间后清理。

在这种情况下,缓存可能无法清除。因此,在确定缓存是否存在时,需要检查静态页面的过期时间,以避免旧页面的过期缓存影响新发布信息的检索。该政策还规定,当重新部署网站时,所有缓存都将被强制清理。


广州网站建设,新跃,广州新跃,广州高端网站建设,广州建网站公司,广州小程序开发;


广州新跃专注网站建设,小程序开发多年,通过了解企业的特性进行打造适合各种企业网站,小程序;

获取您的专业报价方案
取得联络 无限可能往往从第一次交流开始
15814558325微信二维码线上服务咨询