为什么python在urlencode空格的时候会被编码成“20”而不是“+”?

更新时间:2023-05-25 22:30:14 阅读: 评论:0

为什么python在urlencode空格的时候会被编码成“20”⽽不
是“+”?
1、简介
空格⽬前有两种不同的编码⽅式,⼀种是在HTML4中定义的,⽽另⼀种是在RFC-3986中定义的。
1.1 HTML4编码⽅式
HTML4的application/x-www-form-urlencoded⼀节对空格的编码定义如下:
Control names and values are escaped. Space characters are replaced by  +', and then rerved characters are escaped as described in [RFC1738], ction 2.2: Non-alphanumeric characters are replaced by %HH', a percent sign and two hexadecimal digits reprenting the ASCII code of the character. Line breaks are reprented as "CR LF" pairs (i.e., `%0D%0A').
The control names/values are listed in the order they appear in the document. The name is parated from the value by  =' and name/value pairs are parated from each other by &'.
按照HTML4规范,空格应该被编码成加号"+",⽽如果字符本⾝就是加号"+",则应该被编码成%2B。
1.2 RFC-3986编码⽅式
RFC-3986中采⽤统⼀的编码⽅式,字符的编码格式为:%HH(H为⼗六进制字符), 并没有对空格做特殊处理。按照RFC-3986规范,空格被编码成%20,⽽加号"+"被编码成%2B。
1.3 导致的问题
pid是什么意思从上⾯可以看出,空格在两种规范下有不同的编码⽅式,也因此导致我们在开发时会遇到意想不到的错误。例如⽤户明明提交的是"你 好",写⼊数据库之后却变成了"你+好",往往这种错误让⼈摸不着头脑,其实这就是由于空格的编码错误导致的。
2. 编码建议
其实避免上⾯错误的⽅法很简单,就是在开发中我们要统⼀客户端和服务端的编码⽅式,⽽不能两者混⽤。建议客户端和服务端同时使⽤RFC-3986编码⽅式,将请求参数全部编码成%HH格式。当然为了保证正确的编码解码,统⼀的字符集也不可缺少,最好都使⽤UTF-8。
3. 编码⽰例
图书馆英语怎么读
如果客户端提交的查询字符串是"开源+中国 博客", 则HTML4采⽤UTF-8编码后结果为:
mor code
defrost
%E5%BC%80%E6%BA%90%2B%E4%B8%AD%E5%9B%BD+%E5%8D%9A%E5%AE%A2
chess怎么读注意,加号被直接编码成%2B,⽽空格则被编码成了加号"+"。
英汉
⽽RFC-3986采⽤UTF-8编码后结果为:
%E5%BC%80%E6%BA%90%2B%E4%B8%AD%E5%9B%BD%20%E5%8D%9A%E5%AE%A2
加号被直接编码成%2B,空格也被直接编码成%20。
4. Python3中的URL编码
同样的在Python3中也有html4规范的url编码⽅法quote_plus
zf是什么意思
import urllib.par
query = '/test+ test'kaixinw>公主英文
urllib.par.quote_plus(query)
>>> 'https%3A%2F%%2Ftest%2B+test'
enquery = urllib.par.quote_plus(query)
urllib.par.unquote_plus(enquery)
>>> '/test+ test'
韩语发音词典Python
Copy
RFC-3986的⽅法为quote
import urllib.par
query = '/test+ test' urllib.par.quote(query)
>>> https%3A///test%2B%20test' enquery = urllib.par.quote(query)
urllib.par.unquote(enquery)
>>> '/test+ test'

本文发布于:2023-05-25 22:30:14,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/122620.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:编码   空格   客户端   错误
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图