<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OurApache &#187; Etag</title>
	<atom:link href="http://ourapache.com/archives/tag/etag/feed" rel="self" type="application/rss+xml" />
	<link>http://ourapache.com</link>
	<description>我们致力于一个Apache知识的分享网站</description>
	<lastBuildDate>Tue, 13 Apr 2010 05:18:24 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>基于资源的HTTP Cache的实现介绍</title>
		<link>http://ourapache.com/archives/303</link>
		<comments>http://ourapache.com/archives/303#comments</comments>
		<pubDate>Sat, 05 Sep 2009 16:02:58 +0000</pubDate>
		<dc:creator>OurApache</dc:creator>
				<category><![CDATA[HTTP相关知识]]></category>
		<category><![CDATA[cache]]></category>
		<category><![CDATA[Etag]]></category>

		<guid isPermaLink="false">http://www.ourapache.com/?p=303</guid>
		<description><![CDATA[我们都知道浏览器会缓存访问过网站的网页，浏览器通过URL地址访问一个网页，显示网页内容的同时会在电脑上面缓存网页内容。如果网页没有更新的话，浏览器再次访问这个URL地址的时候，就不会再次下载网页，而是直接使用本地缓存的网页。只有当网站明确标识资源已经更新，浏览器才会再次下载网页。 ]]></description>
			<content:encoded><![CDATA[<p>我们都知道浏览器会缓存访问过网站的网页，浏览器通过URL地址访问一个网页，显示网页内容的同时会在电脑上面缓存网页内容。如果网页没有更新的话，浏览器再次访问这个URL地址的时候，就不会再次下载网页，而是直接使用本地缓存的网页。只有当网站明确标识资源已经更新，浏览器才会再次下载网页。</p>
<p><strong>一、什么是HTTP <a href="http://ourapache.com/archives/tag/cache" class="st_tag internal_tag" rel="tag" title="标签 cache 下的日志">Cache</a></strong></p>
<p>对于浏览器的这种网页缓存机制大家已经耳熟能详了，举个例子来说，JavaEye的新闻订阅地址：http://www.javaeye.com/rss/news ， 当浏览器或者订阅程序访问这个URL地址的时候，JavaEye的服务器在response的header里面会发送给浏览器如下状态标识：</p>
<blockquote><p><a href="http://ourapache.com/archives/tag/etag" class="st_tag internal_tag" rel="tag" title="标签 Etag 下的日志">Etag</a> “427fe7b6442f2096dff4f92339305444&#8243;<br />
Last-Modified Fri, 04 Sep 2009 05:55:43 GMT</p>
<p>Etag “427fe7b6442f2096dff4f92339305444&#8243;<br />
Last-Modified Fri, 04 Sep 2009 05:55:43 GMT</p></blockquote>
<p>这就是告诉浏览器，新闻订阅这个网络资源的最后修改时间和Etag。于是浏览器把这两个状态信息连同网页内容在本地进行缓存，当浏览器再次访问JavaEye新闻订阅地址的时候，浏览器会发送如下两个状态标识给JavaEye服务器：</p>
<blockquote><p>If-None-Match “427fe7b6442f2096dff4f92339305444&#8243;<br />
If-Modified-Since Fri, 04 Sep 2009 05:55:43 GMT</p>
<p>If-None-Match “427fe7b6442f2096dff4f92339305444&#8243;<br />
If-Modified-Since Fri, 04 Sep 2009 05:55:43 GMT</p></blockquote>
<p>就是告诉服务器，我本地缓存的网页最后修改时间和Etag是什么，请问你服务器的资源有没有在我上次访问之后有更新啊？于是JavaEye服务器会核对一下，如果该用户上次访问之后没有更新过新闻，那么根本就不必生成这个RSS了，直接告诉浏览器：“没什么新东西，你还是看自己缓存的网页吧”，于是服务器就发送一个304 Not Modified的消息，其他什么都不用干了。</p>
<p>这就是HTTP层的Cache，使用这种基于资源的缓存机制，不但大大节省服务器程序资源，而且还减少了网页下载次数，节约了很多网络带宽。</p>
<p><strong>二、HTTP Cache究竟有什么作用？</strong></p>
<p>我们通常的动态网站编程，服务器端程序根本就不去处理浏览器发送过来的If-None-Match和If-Modified-Since状态标识，只要有请求就生成网页发送给浏览器。对于一般情况来说，用户不会总是没完没了刷新一个页面，所以大家并不认为这种基于资源的缓存有什么太大的作用，但实际情况并非如此：</p>
<p>1、像Google这种比较智能的网络爬虫可以有效识别资源的状态信息，如果使用这种缓存机制，可以大大减少爬虫的爬取次数。</p>
<p>比方说Google每天爬JavaEye网站大概15万次左右，但实际上JavaEye每天有更新的内容不会超过1万个网页。因为很多内容更新比较快，因此Google就会反复不停的爬取，这样本身就造成了很多资源的浪费。如果我们使用HTTP Cache，那么只有当网页内容发生改变的时候，才会真正进行爬取，其他时候我们直接告诉Google的爬虫304 Not Modified就可以了。这样不但降低了服务器本身的负载和爬虫造成的网络带宽消耗，实际上也大大提高了Google爬虫的工作效率，岂不是皆大欢喜？</p>
<p>2、很多内容更新不频繁的网页，尽管用户不会频繁的刷新，但是从一个比较长的时间段来看使用HTTP Cache，仍然可以起到很大的缓存作用。</p>
<p>比方说一些历史讨论帖子，已经过去了几个月了，这些帖子内容很少更新。用户可能通过搜索，收藏链接，文章关联等方式时不时访问到这个页面。那么只要用户访问过一次以后，后续所有访问服务器直接发送304 Not Modified就可以了，不用真正生成页面。</p>
<p>3、对于历史帖子使用HTTP Cache可以避免爬虫反复的爬取。</p>
<p>比方说JavaEye的论坛帖子列表页面，分页到20页后面的帖子已经很少有人直接访问了，但是从服务器日志去看，每天仍然有大量爬虫反复爬取这些分页到很后面的页面。这些页面由于用户很少去点击，所以基本上没有被应用程序的memcached缓存住，每次访问都会造成很高的资源消耗，爬虫隔一段时间就爬一次，对服务器是很大的负担。如果使用了HTTP Cache，那么只要爬虫爬过一次以后，以后无论爬虫爬多少次，都可以直接返回304 Not Modified了，极大的节省了服务器的负载。</p>
<p><strong>三、如何在应用程序里面使用HTTP Cache</strong></p>
<p>如果我们要在自己的程序里面实现HTTP Cache，是件非常简单的事情，特别是对Rails来说只需要添加一点点代码，以上面的JavaEye新闻订阅来说，只要添加一行代码：</p>
<blockquote><p>def news<br />
fresh_when(:last_modified =&gt; News.last.created_at, :etag =&gt; News.last)<br />
end</p>
<p>def news<br />
fresh_when(:last_modified =&gt; News.last.created_at, :etag =&gt; News.last)<br />
end</p></blockquote>
<p>用最新新闻文章作为Etag，该文章最后修改时间作为资源的最后修改时间，这样就OK了。如果浏览器发送过来的标识和服务器标识一致，说明内容没有更新，直接发送304 Not Modified；如果不一致，说明内容更新，浏览器本地的缓存太古老了，那么就需要服务器真正生成页面了。</p>
<p>以上只是一个最简单的例子，如果我们需要根据状态做一些更多的工作也是很容易的。比方说JavaEye博客的RSS订阅地址： http://robbin.javaeye.com/rss</p>
<blockquote><p>@blogs = @blog_owner.last_blogs<br />
@hash = @blogs.collect{|b| {b.id =&gt; b.post.modified_at.to_i + b.posts_count}}.hash<br />
if stale?(:last_modified =&gt; (@blog_owner.last_blog.post.modified_at || @blog_owner.last_blog.post.created_at), :etag =&gt; @hash)<br />
render :template =&gt; “rss/blog”<br />
end</p>
<p>@blogs = @blog_owner.last_blogs<br />
@hash = @blogs.collect{|b| {b.id =&gt; b.post.modified_at.to_i + b.posts_count}}.hash<br />
if stale?(:last_modified =&gt; (@blog_owner.last_blog.post.modified_at || @blog_owner.last_blog.post.created_at), :etag =&gt; @hash)<br />
render :template =&gt; “rss/blog”<br />
end</p></blockquote>
<p>这个实现稍微复杂一些。我们需要判断博客订阅所有的输出文章是否有更新，所以我们用博客文章内容最后修改时间和博客的评论数量做一个hash，然后用这个hash值作为资源的Etag，那么只要这些博客文章当中任何文章内容被修改，或者有新评论，都会改变Etag值，从而通知浏览器内容有更新了。</p>
<p>除了RSS订阅之外，JavaEye网站还有很多地方适合使用HTTP Cache，比方说JavaEye论坛的版面列表页面，一些经常喜欢泡论坛的用户，可能时不时会上来刷新一下版面， 看看有没有新的帖子，那么我们就不必每次用户请求的时候都去执行程序，生成页面给他。我们判断一下如果没有新帖子的话，直接告诉他304 Not Modified就可以了，在没有使用HTTP Cache之前的版面Action代码：</p>
<blockquote><p>def board<br />
@topics = @forum.topics.paginate&#8230;<br />
@announcements = (params[:page] || 1).to_i == 1 ? Topic.find :all, :conditions =&gt; &#8230;<br />
render :action =&gt; &#8216;show&#8217;<br />
end</p>
<p>def board<br />
@topics = @forum.topics.paginate&#8230;<br />
@announcements = (params[:page] || 1).to_i == 1 ? Topic.find :all, :conditions =&gt; &#8230;<br />
render :action =&gt; &#8216;show&#8217;<br />
end</p></blockquote>
<p>添加HTTP Cache以后，代码如下：</p>
<blockquote><p>def board<br />
@topics = @forum.topics.paginate&#8230;<br />
if logged_in? || stale?(:last_modified =&gt; @topics[0].last_post.created_at, :etag =&gt; @topics.collect{|t| {t.id =&gt; t.posts_count}}.hash)<br />
@announcements = (params[:page] || 1).to_i == 1 ? Topic.find :all, :conditions&#8230;<br />
render :action =&gt; &#8216;show&#8217;<br />
end<br />
end</p>
<p>def board<br />
@topics = @forum.topics.paginate&#8230;<br />
if logged_in? || stale?(:last_modified =&gt; @topics[0].last_post.created_at, :etag =&gt; @topics.collect{|t| {t.id =&gt; t.posts_count}}.hash)<br />
@announcements = (params[:page] || 1).to_i == 1 ? Topic.find :all, :conditions&#8230;<br />
render :action =&gt; &#8216;show&#8217;<br />
end<br />
end</p></blockquote>
<p>对于登录用户，不使用HTTP Cache，这是因为登录用户需要实时接收站内短信通知和订阅通知，因此我们只能对匿名用户使用HTTP Cache，然后我们使用当前所有帖子id和回帖数构造hash作Etag，这样只要当前分页列表页面有任何帖子发生改变或者有了新回帖，就更新页面，否则就不必重新生成页面。</p>
<p>Rails的Controller提供了fresh_when和stale?方法帮助我们实现HTTP Cahe功能，代码写起来已经非常简单了。但是直接在action里面添加Cache代码还是有点难看，所以我们可以用一个第三方插件：easy http cache来进一步简化工作，这样我们仅仅需要添加一个声明就可以了，如下例：</p>
<blockquote><p>class ListsController &lt; ApplicationController<br />
http_cache :show, :last_modified =&gt; :list, :etag =&gt; :current_user<br />
enddef show<br />
# expensive stuff<br />
endprotected<br />
def list<br />
@list ||= List.find(params[:id])<br />
enddef current_user<br />
@current_user ||= User.find(params[:user_id])<br />
end</p>
<p>class ListsController &lt; ApplicationController<br />
http_cache :show, :last_modified =&gt; :list, :etag =&gt; :current_user<br />
enddef show<br />
# expensive stuff<br />
endprotected<br />
def list<br />
@list ||= List.find(params[:id])<br />
enddef current_user<br />
@current_user ||= User.find(params[:user_id])<br />
end</p></blockquote>
<p>Easy Http Cache插件更多用法可以参考：http://github.com/josevalim/easy_http_cache/tree/master</p>
<p>在给JavaEye网站所有的RSS订阅输出添加了HTTP Cache以后，通过一天的观察发现，超过一半的RSS订阅请求已经被缓存了，直接返回304 Not Modified，所以效果非常明显，由于JavaEye网站每天RSS订阅的动态请求就超过了10万次，因此添加HTTP Cache可以减轻不少服务器的负担和带宽消耗。</p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2009年08月12号 -- <a href="http://ourapache.com/archives/268" title="Etag和Expires">Etag和Expires</a></li><li>2009年02月25号 -- <a href="http://ourapache.com/archives/178" title="Apache缓存系统">Apache缓存系统</a></li><li>2009年02月25号 -- <a href="http://ourapache.com/archives/165" title="Apache 设置web 缓存">Apache 设置web 缓存</a></li></ul>
	标签：<a href="http://ourapache.com/archives/tag/cache" title="cache" rel="tag">cache</a>, <a href="http://ourapache.com/archives/tag/etag" title="Etag" rel="tag">Etag</a>, <a href="http://ourapache.com/archives/category/http" title="HTTP相关知识" rel="tag">HTTP相关知识</a><br />
]]></content:encoded>
			<wfw:commentRss>http://ourapache.com/archives/303/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Etag和Expires</title>
		<link>http://ourapache.com/archives/268</link>
		<comments>http://ourapache.com/archives/268#comments</comments>
		<pubDate>Wed, 12 Aug 2009 15:58:57 +0000</pubDate>
		<dc:creator>OurApache</dc:creator>
				<category><![CDATA[HTTP相关知识]]></category>
		<category><![CDATA[Etag]]></category>
		<category><![CDATA[Expires]]></category>

		<guid isPermaLink="false">http://www.ourapache.com/?p=268</guid>
		<description><![CDATA[1、Etag和Expires中Client 端Http Request Header及Server端Http Reponse Header工作原理。
2、静态下Apache、Lighttpd和Nginx中Etag和Expires配置
3、非实时交互动态页面中Etag和Expires处理]]></description>
			<content:encoded><![CDATA[<p><strong>题记</strong>：本文对页面中Etag和Expires标识处理，使得页面更加有效被Cache。</p>
<p><strong>摘要</strong></p>
<p>1、Etag和Expires中Client 端Http Request Header及Server端Http Reponse Header工作原理。<br />
2、静态下Apache、Lighttpd和Nginx中Etag和Expires配置<br />
3、非实时交互动态页面中Etag和Expires处理</p>
<p>在客户端通过浏览器发出第一次请求某一个URL时，根据 <a href="http://www.w3.org/Protocols/rfc2616/rfc2616.html" target="_blank">HTTP 协议</a>的规定，浏览器会向服务器传送报头(<a href="http://en.wikipedia.org/wiki/List_of_HTTP_headers" target="_blank">Http Request Header</a>)，服务器端响应同时记录相关属性标记(<a href="http://en.wikipedia.org/wiki/List_of_HTTP_headers" target="_blank">Http Reponse Header</a>)，服务器端的返回状态会是200，格式类似如下：</p>
<blockquote><p>HTTP/1.1 200 OK</p>
<p>Date: Tue, 03 Mar 2009 04:58:40 GMT</p>
<p>Content-Type: image/jpeg</p>
<p>Content-Length: 83185</p>
<p>Last-Modified: Tue, 24 Feb 2009 08:01:04 GMT</p>
<p><a href="http://ourapache.com/archives/tag/cache" class="st_tag internal_tag" rel="tag" title="标签 cache 下的日志">Cache</a>-Control: max-age=2592000</p>
<p><a href="http://ourapache.com/archives/tag/expires" class="st_tag internal_tag" rel="tag" title="标签 Expires 下的日志">Expires</a>: Thu, 02 Apr 2009 05:14:08 GMT</p>
<p><a href="http://ourapache.com/archives/tag/etag" class="st_tag internal_tag" rel="tag" title="标签 Etag 下的日志">Etag</a>: “5d8c72a5edda8d6a:3239″</p></blockquote>
<p>客户端第二次请求此URL时，根据 HTTP 协议的规定，浏览器会向服务器传送报头(Http Request Header)，服务器端响应并记录相关记录属性标记文件没有发生改动,服务器端返回304，直接从缓存中读取：</p>
<blockquote><p>HTTP/1.x 304 Not Modified</p>
<p>Date: Tue, 03 Mar 2009 05:03:56 GMT</p>
<p>Content-Type: image/jpeg</p>
<p>Content-Length: 83185</p>
<p>Last-Modified: Tue, 24 Feb 2009 08:01:04 GMT</p>
<p>Cache-Control: max-age=2592000</p>
<p>Expires: Thu, 02 Apr 2009 05:14:08 GMT</p>
<p>Etag: “5d8c72a5edda8d6a:3239″</p></blockquote>
<p>其中Last-Modified、Expires和Etag是标记页面缓存标识</p>
<p><strong>一、Last-Modified、Expires和Etag相关工作原理</strong></p>
<p><strong>1、Last-Modified</strong></p>
<p>在浏览器第一次请求某一个URL时，服务器端的返回状态会是200，内容是你请求的资源，同时有一个Last-Modified的属性标记(Http Reponse Header)此文件在服务期端最后被修改的时间，格式类似这样：</p>
<blockquote><p>Last-Modified: Tue, 24 Feb 2009 08:01:04 GMT</p></blockquote>
<p>客户端第二次请求此URL时，根据 HTTP 协议的规定，浏览器会向服务器传送 If-Modified-Since 报头(Http Request Header)，询问该时间之后文件是否有被修改过：</p>
<blockquote><p>If-Modified-Since: Tue, 24 Feb 2009 08:01:04 GMT</p></blockquote>
<p>如果服务器端的资源没有变化，则自动返回 HTTP 304 （Not Changed.）状态码，内容为空，这样就节省了传输数据量。当服务器端代码发生改变或者重启服务器时，则重新发出资源，返回和第一次请求时类似。从而 保证不向客户端重复发出资源，也保证当服务器有变化时，客户端能够得到最新的资源。</p>
<p>注：如果If-Modified-Since的时间比服务器当前时间(当前的请求时间request_time)还晚，会认为是个非法请求</p>
<p><strong>2、Etag工作原理</strong></p>
<p>HTTP 协议规格说明定义ETag为“被请求变量的实体标记” （参见<a href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.19" target="_blank">14.19</a>）。简单点即服务器响应时给请求URL标记，并在HTTP响应头中将其传送到客户端，类似服务器端返回的格式：</p>
<blockquote><p>Etag: “5d8c72a5edda8d6a:3239″</p></blockquote>
<p>客户端的查询更新格式是这样的：</p>
<blockquote><p>If-None-Match: “5d8c72a5edda8d6a:3239″</p></blockquote>
<p>如果ETag没改变，则返回状态304。</p>
<p>即:在客户端发出请求后，Http Reponse Header中包含 Etag: “5d8c72a5edda8d6a:3239″<br />
标识，等于告诉Client端，你拿到的这个的资源有表示ID：5d8c72a5edda8d6a:3239。当下次需要发Request索要同一个 URI的时候，浏览器同时发出一个If-None-Match报头( Http Request Header)此时包头中信息包含上次访问得到的Etag: “5d8c72a5edda8d6a:3239″标识。</p>
<blockquote><p>If-None-Match: “5d8c72a5edda8d6a:3239“</p></blockquote>
<p>,这样，Client端等于Cache了两份，服务器端就会比对2者的etag。如果If-None-Match为False，不返回200，返回304 (Not Modified) Response。</p>
<p><strong>3、Expires</strong></p>
<p>给出的日期/时间后，被响应认为是过时。如Expires: Thu, 02 Apr 2009 05:14:08 GMT</p>
<p>需和Last-Modified结合使用。用于控制请求文件的有效时间，当请求数据在有效期内时客户端浏览器从缓存请求数据而不是服务器端. 当缓存中数据失效或过期，才决定从服务器更新数据。</p>
<p><strong>4、Last-Modified和Expires</strong></p>
<p>Last-Modified标识能够节省一点带宽，但是还是逃不掉发一个HTTP请求出去，而且要和Expires一起用。而Expires标识却 使得浏览器干脆连HTTP请求都不用发，比如当用户F5或者点击Refresh按钮的时候就算对于有Expires的URI，一样也会发一个HTTP请求 出去，所以，Last-Modified还是要用的，而 且要和Expires一起用。</p>
<p><strong>5、Etag和Expires</strong></p>
<p>如果服务器端同时设置了Etag和Expires时，Etag原理同样，即与Last-Modified/Etag对应的Http Request Header:If-Modified-Since和If-None-Match。我们可以看到这两个Header的值和Web Server发出的Last-Modified,Etag值完全一样；在完全匹配If-Modified-Since和If-None-Match即检查 完修改时间和Etag之后，服务器才能返回304.</p>
<p><strong>6、Last-Modified和Etag</strong></p>
<p>Last-Modified 和ETags请求的http报头一起使用，服务器首先产生 Last-Modified/Etag标记，服务器可在稍后使用它来判断页面是否已经被修改，来决定文件是否继续缓存</p>
<p>过程如下:</p>
<p>1. 客户端请求一个页面（A）。</p>
<p>2. 服务器返回页面A，并在给A加上一个Last-Modified/ETag。</p>
<p>3. 客户端展现该页面，并将页面连同Last-Modified/ETag一起缓存。</p>
<p>4. 客户再次请求页面A，并将上次请求时服务器返回的Last-Modified/ETag一起传递给服务器。</p>
<p>5. 服务器检查该Last-Modified或ETag，并判断出该页面自上次客户端请求之后还未被修改，直接返回响应304和一个空的响应体。</p>
<p>注：</p>
<p>1、Last-Modified和Etag头都是由Web Server发出的Http Reponse Header，Web Server应该同时支持这两种头。</p>
<p>2、Web Server发送完Last-Modified/Etag头给客户端后，客户端会缓存这些头；</p>
<p>3、客户端再次发起相同页面的请求时，将分别发送与Last-Modified/Etag对应的Http Request Header:If-Modified-Since和If-None-Match。我们可以看到这两个Header的值和Web Server发出的Last-Modified,Etag值完全一样；</p>
<p>4、通过上述值到服务器端检查，判断文件是否继续缓存；</p>
<p><strong>二、Apache、Lighttpd和Nginx中针配置Etag和Expires，有效缓存纯静态如css/js/pic/页面/流媒体等文件。</strong></p>
<p><strong>A、Expires</strong></p>
<p><strong>A.1、Apache Etag</strong></p>
<p>使用Apache的mod_expires 模块来设置，这包括控制应答时的Expires头内容和Cache-Control头的max-age指令</p>
<blockquote><p>ExpiresActive On<br />
ExpiresByType image/gif “access plus 1 month”</p>
<p>ExpiresByType image/jpg “access plus 1 month”</p>
<p>ExpiresByType image/jpeg “access plus 1 month”<br />
ExpiresByType image/x-icon “access plus 1 month”</p>
<p>ExpiresByType image/bmp “access plus 1 month”<br />
ExpiresByType image/png “access plus 1 month”<br />
ExpiresByType text/html “access plus 30 minutes”<br />
ExpiresByType text/css  “access plus 30 minutes”</p>
<p>ExpiresByType text/txt  “access plus 30 minutes”<br />
ExpiresByType text/js   ”access plus 30 minutes”<br />
ExpiresByType application/x-javascript   ”access plus 30 minutes”<br />
ExpiresByType application/x-shockwave-flash     ”access plus 30 minutes”</p></blockquote>
<p>或</p>
<blockquote><p>&lt;ifmodule mod_expires.c&gt;</p>
<p>&lt;filesmatch “\.(jpg|gif|png|css|js)$”&gt;</p>
<p>ExpiresActive on</p>
<p>ExpiresDefault “access plus 1 year”</p>
<p>&lt;/filesmatch&gt;</p>
<p>&lt;/ifmodule&gt;</p></blockquote>
<p>当设置了expires后，会自动输出Cache-Control 的max-age 信息</p>
<p>具体关于 Expires 详细内容可以查看<a href="http://httpd.apache.org/docs/2.2/mod/mod_expires.html" target="_blank">Apache官方文档</a>。</p>
<p>在这个时间段里，该文件的请求都将直接通过缓存服务器获取，当然如果需要忽略浏览器的刷新请求（F5)，缓存服务器squid还需要使用 refresh_pattern 选项来忽略该请求</p>
<blockquote><p>refresh_pattern -i \.gif$ 1440 100% 28800 ignore-reload</p>
<p>refresh_pattern -i \.jpg$ 1440 100% 28800 ignore-reload</p>
<p>refresh_pattern -i \.jpeg$ 1440 100% 28800 ignore-reload</p>
<p>refresh_pattern -i \.png$ 1440 100% 28800 ignore-reload</p>
<p>refresh_pattern -i \.bmp$ 1440 100% 28800 ignore-reload</p>
<p>refresh_pattern -i \.htm$ 60 100% 100 ignore-reload</p>
<p>refresh_pattern -i \.html$ 1440 50% 28800 ignore-reload</p>
<p>refresh_pattern -i \.xml$ 1440 50% 28800 ignore-reload</p>
<p>refresh_pattern -i \.txt$ 1440 50% 28800 ignore-reload</p>
<p>refresh_pattern -i \.css$ 1440 50% 28800 reload-into-ims</p>
<p>refresh_pattern -i \.js$ 60 50% 100 reload-into-ims</p>
<p>refresh_pattern . 10 50% 60</p></blockquote>
<p>有关Squid中Expires的说明，请参考Squid官方中<a href="http://www.squid-cache.org/Doc/config/refresh_pattern/" target="_blank">refresh_pattern</a>介绍。</p>
<blockquote><p>A.2、Lighttpd Expires</p></blockquote>
<p>和Apache一样Lighttpd设置expire也要先查看是否支持了mod_expire模块，</p>
<p>下面的设置是让URI中所有images目录下的文件1小时后过期；</p>
<blockquote><p>expire.url = ( “/images/” =&gt; “access 1 hours” )</p></blockquote>
<p>下面是让作用于images目录及其子目录的文件；</p>
<blockquote><p>$HTTP["url"] =~ “^/images/” {</p>
<p>expire.url = ( “” =&gt; “access 1 hours” )</p>
<p>}</p></blockquote>
<p>也可以指定文件的类型；</p>
<blockquote><p>$HTTP["url"] =~ “\.(jpg|gif|png|css|js)$” {</p>
<p>expire.url = ( “” =&gt; “access 1 hours” )</p>
<p>}</p></blockquote>
<p>具体参考Lighttpd官方<a href="http://redmine.lighttpd.net/projects/lighttpd/wiki/Docs:ModExpire" target="_blank">Expires</a>解释</p>
<p><strong>A.3、Nginx中Expires</strong></p>
<blockquote><p>location ~ .*\.(gif|jpg|jpeg|png|bmp|swf)$</p>
<p>{</p>
<p>expires 30d;</p>
<p>}</p>
<p>location ~ .*\.(js|css)?$</p>
<p>{</p>
<p>expires 1h;</p>
<p>}</p></blockquote>
<p>这类文件并不常修改，通过 expires 指令来控制其在浏览器的缓存，以减少不必要的请求。 expires 指令可以控制 HTTP 应答中的“ Expires ”和“ Cache-Control ”的头标（起到控制页面缓存的作用）。其他请参考Nginx中<a href="http://wiki.codemongers.com/NginxHttpHeadersModule" target="_blank">Expires</a></p>
<p><strong>B.1、Apache中Etag设置</strong></p>
<p>在Apache中设置Etag的支持比较简单，只用在含有静态文件的目录中建立一个文件.htaccess, 里面加入：</p>
<p>FileETag MTime Size</p>
<p>这样就行了，详细的可以参考Apache的<a href="http://httpd.apache.org/docs/2.2/mod/core.html#fileetag" target="_blank">FileEtag</a>文档页</p>
<p><strong>B.2、Lighttpd Etag</strong></p>
<p>在Lighttpd中设置Etag支持：</p>
<p>etag.use-inode: 是否使用inode作为Etag</p>
<p>etag.use-mtime: 是否使用文件修改时间作为Etag</p>
<p>etag.use-size: 是否使用文件大小作为Etag</p>
<p>static-file.etags: 是否启用Etag的功能</p>
<p>第四个参数肯定是要enable的， 前面三个就看实际的需要来选吧，推荐使用修改时间</p>
<p><strong>B.3、 Nginx Etag</strong></p>
<p>Nginx中默认没有添加对Etag标识.<a href="http://sysoev.ru/en/" target="_blank"> Igor Sysoev</a>的观点”在对静态文件处理上看不出如何Etag好于Last-Modified标识。”</p>
<blockquote><p>Note:</p>
<p>Yes, it’s addition,and it’s easy to add, however, I do not see how ETag is better than Last-Modified for static files. -Igor Sysoev</p>
<p>A nice short description is here:</p>
<p>http://www.mnot.net/cache_docs/#WORK</p>
<p>It looks to me that it makes some caches out there to cache the response from the origin server more reliable as in rfc2616 (ftp://ftp.rfc-editor.org/in-notes/rfc2616.txt) is written.</p>
<p>3.11 Entity Tags 13.3.2 Entity Tag Cache Validators 14.19 ETag</p></blockquote>
<p>当然也有第三方nginx-static-etags 模块了，请参考</p>
<p>http://mikewest.org/2008/11/generating-etags-for-static-content-using-nginx</p>
<p><strong>三、对于非实时交互动态页面中Epires和Etag处理</strong></p>
<p>对数据更新并不频繁、如tag分类归档等等，可以考虑对其cache。简单点就是在非实时交互的动态程序中输出expires和etag标识，让其 缓存。但需要注意关闭session，防止http response时http header包含session id标识；</p>
<p><strong>3.1、Expires</strong></p>
<p>如expires.php</p>
<blockquote><p>&lt;?php</p>
<p>header(’Cache-Control: max-age=86400,must-revalidate’);<br />
header(’Last-Modified: ‘ .gmdate(’D, d M Y H:i:s’) . ‘ GMT’ );<br />
header(”Expires: ” .gmdate (’D, d M Y H:i:s’, time() + ‘86400′ ). ‘ GMT’);</p>
<p>?&gt;</p></blockquote>
<p>以上信息表示该文件自请求后24小时后过期。</p>
<p>其他需要处理的动态页面直接调用即可。</p>
<p><strong>3.2、Etag</strong></p>
<p>根据Http返回状态来处理。当返回304直接从缓存中读取</p>
<p>如etag.php</p>
<blockquote><p>&lt;?php</p>
<p>cache();</p>
<p>echo date(”Y-m-d H:i:s”);</p>
<p>function cache()</p>
<p>{</p>
<p>$etag = “http://longrujun.name”;</p>
<p>if ($_SERVER['HTTP_IF_NONE_MATCH'] == $etag)</p>
<p>{</p>
<p>header(’Etag:’.$etag,true,304);</p>
<p>exit;</p>
<p>}</p>
<p>else header(’Etag:’.$etag);</p>
<p>}</p>
<p>?&gt;</p></blockquote>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2009年09月6号 -- <a href="http://ourapache.com/archives/303" title="基于资源的HTTP Cache的实现介绍">基于资源的HTTP Cache的实现介绍</a></li></ul>
	标签：<a href="http://ourapache.com/archives/tag/etag" title="Etag" rel="tag">Etag</a>, <a href="http://ourapache.com/archives/tag/expires" title="Expires" rel="tag">Expires</a>, <a href="http://ourapache.com/archives/category/http" title="HTTP相关知识" rel="tag">HTTP相关知识</a><br />
]]></content:encoded>
			<wfw:commentRss>http://ourapache.com/archives/268/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

