本文实例讲述了php实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大世界上最多牙齿的动物是什么家参考。具体实现方法如下:
一、需求:
最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包时间英语含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。
二、解决方案:
要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是赞助合同实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。
三、实现代码:
复制代码 代码如下: $len_all = strlen($comment[‘text’]);
$len_st = mb_strlen($comment[‘text’], ̵好看的韩剧古装6;utf-8’);
if(($len_all-$len_st)/(2*$len_st) < 0.5){
$error = “中文字符少于百分之五十”;
}
如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。
希望本文所述对大家的php程序设计怀旧空吟有所帮助。
本文发布于:2023-04-06 09:24:04,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/3189218640a824348905f487a1923b9c.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:PHP实现通过中文字符比率来判断垃圾评论的方法.doc
本文 PDF 下载地址:PHP实现通过中文字符比率来判断垃圾评论的方法.pdf
留言与评论(共有 0 条评论) |