详解HTML5中的manifest缓存使⽤
起源
html5之前的⽹页,都是⽆连接,必须联⽹才能访问,这其实也是web的特⾊,这其实对于PC是时代问题并不⼤,但到了移动互联⽹时代,设备终端位置不再固定,依赖⽆线信号,⽹络的可靠性变得降低,⽐如坐在⽕车上,过了⼀个隧道(15分钟),便⽆法访问⽹站,这对于web的伤害是很⼤的,⽐如对于《ecmascript合集》这样的为阅读⽽⽣的页⾯。
html5便引⼊了cache manifest ⽂件。那么什么是cache manifest呢,接下来会讲到。
什么是Cache Manifest
⾸先manifest是⼀个后缀名为minifest的⽂件,在⽂件中定义那些需要缓存的⽂件,⽀持manifest的浏览器,会将按照manifest ⽂件的规则,像⽂件保存在本地,从⽽在没有⽹络链接的情况下,也能访问页⾯。
当我们第⼀次正确配置app cache后,当我们再次访问该应⽤时,浏览器会⾸先检查manifest⽂件是否有变动,如果有变动就会把相应的变得跟新下来,同时改变浏览器⾥⾯的app cache,如果没有变动,就会直接把app cache的资源返回,基本流程是这样的。
Manifest的特点
离线浏览: ⽤户可以在离线状态下浏览⽹站内容。
更快的速度: 因为数据被存储在本地,所以速度会更快.
减轻服务器的负载: 浏览器只会下载在服务器上发⽣改变的资源。
浏览器⽀持情况
所有主流浏览器均⽀持应⽤程序缓存,除了 Internet Explorer。caniu给出的答案如下图所⽰。
如何使⽤
html新增了⼀个manifest属性,可以⽤来指定当前页⾯的manifest⽂件。
创建⼀个和html同名的manifest⽂件,⽐如页⾯为index.html,那么可以建⼀个index.manifest的⽂件,然后给index.html的html标签添加如下属性即可:
XML/HTML Code复制内容到剪贴板
1. <html lang="en" manifest="index.manifest">
Manifest⽂件
接下来详细说说manifest的细节,⼀个典型的manifest⽂件代码结构像下⾯这样:
CACHE MANIFEST#version 1.3CACHE: test.cssNETWORK:*
manifest⽂件,基本格式为三段: CACHE, NETWORK,与 FALLBACK,其中NETWORK和FALLBACK为可选项。
⽽第⼀⾏CACHE MANIFEST为固定格式,必须写在前⾯。
以#号开头的是注释,⼀般会在第⼆⾏写个版本号,⽤来在缓存的⽂件更新时,更改manifest的作⽤,可以是版本号,时间戳或者md5码等等。
CACHE:(必须)
标识出哪些⽂件需要缓存,可以是相对路径也可以是绝对路径。
这⼀部分是要绕过缓存直接读取的⽂件,可以使⽤通配符*。
下⾯的代码 “login.asp” 永远不会被缓存,且离线时是不可⽤的:
NETWORK:login.asp
可以使⽤星号来指⽰所有其他资源/⽂件都需要因特⽹连接:
NETWORK:* ###FALLBACK:(可选)
指定了⼀个后备页⾯,当资源⽆法访问时,浏览器会使⽤该页⾯。该段落的每条记录都列出两个 URI—第⼀个表⽰资源,第⼆个表⽰后备页⾯。两个 URI 都必须使⽤相对路径并且与清单⽂件同源。可以使⽤通配符。
下⾯的例⼦中,如果⽆法建⽴因特⽹连接,则⽤ “404.html” 替代 /html5/ ⽬录中的所有⽂件。
FALLBACK:/html5/ /404.html
下⾯的例⼦中,则⽤ “404.html” 替代所有⽂件。
FALLBACK:*.html /404.html
如何更新缓存
如下三种⽅式,可以更新缓存:
(1)更新manifest⽂件
(2)通过javascript操作
(3)清除浏览器缓存
给manifest添加或删除⽂件,都可更新缓存,如果我们更改了js,⽽没有新增或删除,前⾯例⼦中注释中的版本号,可以很好的⽤来更新manifest⽂件。
html5中引⼊了js操作离线缓存的⽅法,下⾯的js可以⼿动更新本地缓存。
window.applicationCache.update();
如果⽤户清除了浏览器缓存(⼿动或⽤其他⼀些⼯具)都会重新下载⽂件。
注意事项
浏览器对缓存数据的容量限制可能不太⼀样(某些浏览器设置的限制是每个站点 5MB)。
如果manifest⽂件,或者内部列举的某⼀个⽂件不能正常下载,整个更新过程都将失败,浏览器继续全部使⽤⽼的缓存。
贺新郎张元干
引⽤manifest的html必须与manifest⽂件同源,在同⼀个域下。
FALLBACK中的资源必须和manifest⽂件同源。
当⼀个资源被缓存后,该浏览器直接请求这个绝对路径也会访问缓存中的资源。
站点中的其他页⾯即使没有设置manifest属性,请求的资源如果在缓存中也从缓存中访问。
当manifest⽂件发⽣改变时,资源请求本⾝也会触发更新。
⾃动化⼯具
manifest⽂件中的cache部分不能使⽤通配符,必须⼿动指定,这实在太让⼈不可理解,⽂件⼀多,就成了体⼒活了,这⾥介绍的 grunt-manifest能⾃动⽣成manifest⽂件的⽬的。grunt-manifest依赖grunt,grunt是⼀个⾃动化构建⼯具,如果你不知道grunt,请移步这⾥。
如下的命令可以安装grunt-manifest,并加⼊到依赖⽂件。
复制代码
代码如下:
npm install grunt-manifest --save-dev
如下的代码,可以在grunt中载⼊grunt-manifest,然后便可使⽤。
复制代码
代码如下:
grunt.loadNpmTasks('grunt-manifest');
使⽤grunt-manifest的⼀个典型的配置⽂件如下所⽰:
复制代码
代码如下:
</p> <p>grunt.initConfig({
manifest: {
generate: {
options: {
扇子拼音baPath: "../",
cache: ["js/app.js", "css/style.css"]
network: ["*", "*"],
fallback: ["/ /offline.html"],
exclude: ["js/jquery.min.js"],
preferOnline: true,
verbo: true,
timestamp: true
},
src: [
"some_files/*.html",
"js/*.min.js",
"css/*.css"
],
dest: "index.manifest"
}
}
});
游漓江攻略其中options定义⽣成manifest的⼀些⾃定义参数,src是要⽣成的⽂件,dest是输出⽂件。
options下有很多参数,主要参数如下:
baPath 设置出⼊⽂件的根⽬录
cache ⼿动添加缓存⽂件
network ⼿动添加⽹络⽂件
fallback ⼿动添加后备⽂件
exclude 设置不添加到cache的⽂件
verbo 是否添加版权信息
timestamp是否添加时间戳
⽰例
菱形脸发型描写秋天的作文300字要使⽤manifest缓存,我们⾸先需要写⼀个manifest⽂件。这个⽂件有严格的格式要求,下⾯是个例⼦
复制代码
代码如下:
</p> <p>CACHE MANIFEST
#我是注释,这个⽂件名叫test.manifest
CACHE:
/test.css
/test.js
这就是⼀个简单的manifest⽂件。⼀开始必须是“CACHE MANIFEST”来声明这是⼀个manifest⽂件。后⾯的“CACHE:”是操作类型,再后⾯的两个⽂件按路径是“CACHE:”这个操作类型作⽤的⽂件,表⽰这些⽂件需要缓存。当然,操作类型不⽌CACHE⼀种,这个后⾯再说。我们先来说说⼤家最关⼼的问题。这个manifest⽂件怎么使⽤?
使⽤manifest⽂件只要在页⾯的HTML标签中加⼊⼀个属性“manifest="manifest⽂件路径"”就可以了,⽐如
XML/HTML Code复制内容到剪贴板
1. <html manifest="test.manifest">
2. <head>
3. <link href="test.css" rel="stylesheet" />
长期腹泻大便不成形4. <script src="test.js"></script>
5. </head>
形容笑容很灿烂的句子
6. <body>
7. <div>次碳酸钴</div>
8. <body>
9. </html>
这个页⾯就使⽤了上⾯写的manifest⽂件,我们⽤Chrome打开这个页⾯就可以在控制台中找到这个manifest的⼯作信
息。
从这个信息中可以看出,我们设置的需要缓存的两个⽂件都缓存了。⽽且引⽤manifest的那个页⾯也被缓存了。这个很重要,这个是manifest的机制,它除了会缓存设置好的⽂件之外,还会缓存当前引
⽤manifest⽂件的页⾯(想关都关不掉)。所以使⽤起来很不⽅便,这就需要注意。
另外,manifest缓存之后的东西只有在manifest⽂件发⽣变化时才会跟新(貌似是这个⽂件的md5发⽣变化时才更新)。⽽被缓存⽂件更新时浏览器是不会去获取新⽂件的。也就是说,刚刚那个页⾯已经缓存了test.css,现在我修改了test.css,页⾯也不会有任何变化。除⾮我修改manifest⽂件本⾝的内容(注意是内容,不是修改时间)。⼀般为了更新这个缓存,可以在⾥⾯的注释中放⼊修改时间来更新它。这个我就不截图了,好⿇烦的。
说完这些问题,现在回过头来看看manifest本⾝的写法。除了上⾯的“CACHE:”之外,还有⼏个操作类型。下⾯是这些操作类型和说明
CACHE:设置后⾯的⽂件为缓存
NETWORK:置后⾯的⽂件为不缓存(⽆法设置⾃⾝页⾯)
FALLBACK:置后⾯的⽂件错误或不存在的时候使⽤另⼀个⽂件
SETTINGS:可以设置fast或prefer-online两种模式
CACHE是设置缓存,之前已经说过了。
NETWORK是设置不缓存。由于manifest的机制是把整个页⾯(或者说Web应⽤)储存的本地。所以,当前页⾯使⽤的所有资源都必须有⼀个设置。如果不设置就会在页⾯缓存之后找不到,所以通常需要使⽤NETWORK来匹配所有不需要缓存的资源,如下⾯这样。
复制代码
代码如下:
CACHE MANIFEST
NETWORK:
*
FALLBACK是不存在是使⽤另⼀个⽂件替代,下⾯是个例⼦
复制代码
代码如下:
CACHE MANIFEST
立春时节的诗句#test.manifest
FALLBACK:
/x.css /test.css
XML/HTML Code复制内容到剪贴板
1. <html manifest="test.manifest">
2. <head>
3. <link href="x.css" rel="stylesheet" />
4. </head>
5. </html>
由于x.css不存在,所以缓存时候采⽤了test.css来代替它。
SETTINGS可以设置成两种模式,默认是fast。但是在我的测试中没感觉到这两种模式有什么区别,
这个就暂时不说了。 这些就是manifest缓存最基本的东西,还有⼀个很⼤的问题就是⽕狐的警告。当使⽤manifest时,⽕狐下会出现警告。
这就是这个东西最蛋疼的地⽅,所以现在先稍稍了解下,不去深⼊研究。等以后这些问题都解决了在来回头看这货吧。其实manifest的作⽤是把Web应⽤本地化,如果仅仅是做“Web应⽤本地化”,确实可以⽤上。但是这个东西在其他⽅⾯实在是不给⼒。所以⽬前的项⽬都不会考虑⽤这党疼的玩意⼉。上⾯的这么多也只是⼊门级的测试,还有好多东西需要测试。不过由于现在⽤不上,暂时就不研究了。