python正则替换中的unicode问题

更新时间:2023-06-16 16:00:43 阅读: 评论:0

python正则替换中的unicode问题
17-19,结论:对于unicode字符串,要⽤unicode正则字符串查找,unicode正则字符串的构成有两个要件,⼀是字符串本⾝由unicode字符构成,⼆是⽤'u'引导(python2);湿地科学
20-23,结论:对于str字符串,要⽤⼆进制正则字符串查找,⽤'r'引导,如果⽤'u'引导,因为并不包含unicode字符,其实际上不起作⽤,相当于'r';
In [17]: %paste
import re
html = u"abcd 32⼈喜欢 efgh"
html = re.sub(ur'(\d+)\u4eba\u559c\u6b22', r'<div class="like">\1</div>', html)
print html
## -- End pasted text --
梦见来大姨妈什么预兆abcd <div class="like">32</div> efgh
In [18]: %paste
import re麦冬的副作用
html = u"abcd 32⼈喜欢 efgh"
html = re.sub(r'(\d+)\u4eba\u559c\u6b22', r'<div class="like">\1</div>', html)
print html
宋城景区## -- End pasted text --
abcd 32⼈喜欢 efgh
In [19]: %paste
import re
html = u"abcd 32⼈喜欢 efgh"
html = re.sub(r'(\d+)\xe4\xba\xba\xe5\x96\x9c\xe6\xac\xa2', r'<div class="like">\1</div>', html)
print html
## -- End pasted text --
abcd 32⼈喜欢 efgh
发形In [20]: %paste
import re
html = "abcd 32⼈喜欢 efgh"
html = re.sub(r'(\d+)\u4eba\u559c\u6b22', r'<div class="like">\1</div>', html)
print html
## -- End pasted text --
abcd 32浜哄枩娆?efgh
女性肩周炎症状有哪些In [21]: %paste
import re
html = "abcd 32⼈喜欢 efgh"
html = re.sub(ur'(\d+)\u4eba\u559c\u6b22', r'<div class="like">\1</div>', html)
print html
## -- End pasted text --
abcd 32浜哄枩娆?efgh
In [22]: %paste
import re
南通市环保局
html = "abcd 32⼈喜欢 efgh"
html = re.sub(r'(\d+)\xe4\xba\xba\xe5\x96\x9c\xe6\xac\xa2', r'<div class="like">\1</div>', html)
print html
## -- End pasted text --
abcd <div class="like">32</div> efgh
体育锻炼In [23]: %paste
import re
html = "abcd 32⼈喜欢 efgh"
html = re.sub(ur'(\d+)\xe4\xba\xba\xe5\x96\x9c\xe6\xac\xa2', r'<div class="like">\1</div>', html)
print html
## -- End pasted text --
abcd <div class="like">32</div> efgh

本文发布于:2023-06-16 16:00:43,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1041259.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:petrel快捷键
标签:字符串   正则   查找   构成   肩周炎   起作
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图