js中编码escape、encodeURI、encodeURIComponent三种⽅法及。。。
先⼀下总结吧!
js对⽂字进⾏编码涉及3个函数:escape、encodeURI、encodeURIComponent。
相应3个解码函数:unescape、decodeURI、decodeURIComponent。
建议使⽤encodeURIComponent与decodeURIComponent原因:它可以将参数中的中⽂、特殊字符进⾏转义,⽽不会影响整个URL。
本⽂摘⾃(MDN)
1、escape(),对应的解码:unescape()
语法
escape(string)
参数
string待编码的字符串。
描述
escape函数是全局对象的属性.特⾊字符如:@*_±./被排除在外.
字符的16进制格式值,当该值⼩于等于0xFF时,⽤⼀个2位转移序列:%xx表⽰.⼤于的话则使⽤4位序列:%uxxxx表⽰。
⽰例
escape("abc123");//"abc123"
escape("äöü");//"%E4%F6%FC"
escape("ć");//"%u0107"
//specialcharacters
escape("@*_+-./");//"@*_+-./"
2、encodeURI(URI),对应的解码:decodeURI()
语法
escape(string)
参数
URI⼀个完整的URI
返回值
⼀个新字符串,表⽰提供的字符串编码为统⼀资源标识符(URI)。
描述
假定⼀个URI是完整的URI,那么⽆需对那些保留的并且在URI中有特殊意思的字符进⾏编码。
urname:password@:80/path/to/?foo=316&bar=this+has+spaces#anchor
encodeURI会替换所有的字符,但不包括以下字符,即使它们具有适当的UTF-8转义序列:
类型包含
保留字符;,/?:@&=+$
⾮转义的字符字母数字-_.!~*’()
数字符号#
请注意,encodeURI⾃⾝⽆法产⽣能适⽤于HTTPGET或POST请求的URI,例如对于XMLHTTPRequests,因为“&”,“+”,和
“=”不会被编码,然⽽在GET和POST请求中它们是特殊字符。然⽽encodeURIComponent这个⽅法会对这些字符编码。
⽰例
//另外,如果试图编码⼀个⾮⾼-低位完整的代理字符,将会抛出⼀个URIError错误,例如:
//编码⾼-低位完整字符ok
(encodeURI('uD800uDFFF'));
//编码单独的⾼位字符抛出"UncaughtURIError:URImalformed"
(encodeURI('uD800'));
//编码单独的低位字符抛出"UncaughtURIError:URImalformed"
(encodeURI('uDFFF'));
//并且需要注意,如果URL需要遵循较新的RFC3986标准,那么⽅括号是被保留的(给IPv6),因此对于那些没有被编码的URL部分(例如主机),可以使⽤下⾯的
代码:
functionfixedEncodeURI(str){
returnencodeURI(str).replace(/%5B/g,'[').replace(/%5D/g,']');
}
3、encodeURIComponent(String),对应的解码:decodeURIComponent()
语法
encodeURIComponent(String);
参数
的组成部分。
返回值
原字符串作为URI组成部分被编码后形成的字符串。
描述
是对统⼀资源标识符(URI)的组成部分进⾏编码的⽅法。它使⽤⼀到四个转义序列来表⽰字符串中的每个字符的UTF-8编码(只有由两个
Unicode代理区字符组成的字符才⽤四个转义字符编码)。
encodeURIComponent转义除了以下字符外的所有字符:
不转义的字符:
A-Za-z0-9-_.!~*'()
encodeURIComponent()和encodeURI有以下⼏个不同点:
vart1=";,/?:@&=+$";//保留字符
vart2="-_.!~*'()";//不转义字符
vart3="#";//数字标志
vart4="ABCabc123";//字母数字字符和空格
(encodeURI(t1));//;,/?:@&=+$
(encodeURI(t2));//-_.!~*'()
(encodeURI(t3));//
#(encodeURI(t4));//ABC%20abc%20123(thespacegetncodedas%20)
(encodeURIComponent(t1));//%3B%2C%2F%3F%3A%40%26%3D%2B%24
(encodeURIComponent(t2));//-_.!~*'()
(encodeURIComponent(t3));//%23
(encodeURIComponent(t4));//ABC%20abc%20123(thespacegetncodedas%20)
注意,如果试图编码⼀个⾮⾼-低位完整的代理字符,将会抛出⼀个URIError错误,例如:
//⾼低位完整
alert(encodeURIComponent('uD800uDFFF'));
//只有⾼位,将抛出"URIError:malformedURIquence"
alert(encodeURIComponent('uD800'));
//只有低位,将抛出"URIError:malformedURIquence"
alert(encodeURIComponent('uDFFF'));
为了避免服务器收到不可预知的请求,对任何⽤户输⼊的作为URI部分的内容你都需要⽤encodeURIComponent进⾏转义。⽐如,⼀个⽤
户可能会输⼊"Thyme&time=again"作为comment变量的⼀部分。如果不使⽤encodeURIComponent对此内容进⾏转义,服务器得到
的将是comment=Thyme%20&time=again。请注意,"&“符号和”="符号产⽣了⼀个新的键值对,所以服务器得到两个键值对(⼀个
键值对是comment=Thyme,另⼀个则是time=again),⽽不是⼀个键值对。
对于application/x-www-form-urlencoded(POST)这种数据⽅式,空格需要被替换成‘+’,所以通常使⽤encodeURIComponent
的时候还会把“%20”替换为“+”。
为了更严格的遵循RFC3986(它保留!,',(,),和*),即使这些字符并没有正式划定URI的⽤途,下⾯这种⽅式是⽐较安全的:
functionfixedEncodeURIComponent(str){
returnencodeURIComponent(str).replace(/[!'()*]/g,function(c){
return'%'+deAt(0).toString(16);
});
}
⽰例
下⾯这个例⼦提供了UTF-8下Content-Disposition和Link的服务器响应头信息的参数(例如UTF-8⽂件名):
varfileName='myfile(2).txt';
varheader="Content-Disposition:attachment;filename*=UTF-8''"
+encodeRFC5987ValueChars(fileName);
(header);
//输出"Content-Disposition:attachment;filename*=UTF-8''my%20file%282%"
functionencodeRFC5987ValueChars(str){
returnencodeURIComponent(str).
//注意,仅管RFC3986保留"!",但RFC5987并没有
//所以我们并不需要过滤它
replace(/['()]/g,escape).//i.e.,%27%28%29
replace(/*/g,'%2A').
//下⾯的并不是RFC5987中URI编码必须的
//所以对于|`^这3个字符我们可以稍稍提⾼⼀点可读性
replace(/%(?:7C|60|5E)/g,unescape);
}
本文发布于:2022-12-09 19:17:49,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/74405.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |