首先登陆百度开发者中心,搜索文字识别服务:
创建一个应用,获取appid、apikey、cretkey秘钥信息:
下载c# sdk,将aipsdk.dll动态库导入unity:
本文以通用文字识别为例,查阅官方文档,以下是通用文字识别的返回数据结构:
在unity中定义相应的数据结构:
using system; /// <summary>/// 通用文字识别/// </summary>[rializable]public class generalocr{ /// <summary> /// 图像方向 -1未定义 0正弦 1逆时针90度 2逆时针180度 3逆时针270度 /// </summary> public int direction; /// <summary> /// 唯一的log id,用于问题定位 /// </summary> public int log_id; /// <summary> /// 识别结果数,表示words_result的元素个数 /// </summa高考前家长注意事项ry> public int words_result_num; /// <s洛夫斯基ummary> /// 定位和识别微信群名称大全结果数组 /// </summary> public string[] words_result; /// <summary> /// 行置信度信息 /// </summary> public probability probability;} /// <summary>/// 行置信度信息/// </summary>[rializable]public class probability{ /// <summary> /// 行置信度平均值 /// </summary> public int average; /// <summary> /// 行置信度方差 /// </summary> public int variance; /// <summary> /// 行置信度最小值 /// </summary> public int min;}
下面是调用时传入的相关参数:
封装调用函数:
using system;using system.collections.generic;using unityengine; public class ocr { //以下信息于百度开发者中心创建应用获取 private const string appid = ""; private const string apikey = ""; private const string cretkey = ""; /// <summary> /// 通用文字识别 /// </summary> /// <param name="bytes">图片字节数据</param> /// <param name="language">识别语言类型 默认chn_eng中英文混合</param> /// <param name="detectdirection">是否检测图像朝向</param> /// <param name="detectlanguage">是否检测语言,当前支持中、英、日、韩</param> /// <param name="probability">是否返回识别结果中每一行的置信度</param> /// <returns></returns> public static generalocr general(byte[] bytes, string language = "chn_eng", bool detectdirection = fal, bool detectlanguage = fal, bool probability = fal) { var client = new baidu.aip.ocr.ocr(apikey, cretkey); try { var options = new dictiona天将降大任于斯人也出自哪篇文章ry<string, object> { { "language_type", language }, { "detect_direction", detectdirection }, { "detect_language", detectlanguage }, { "probability", probability } }; var respon = client.generalbasic(bytes, options); generalocr generalocr = jsonutility.fromjson<generalocr>(respon.tostring()); 爱国事例素材 return generalocr; } catch (exception error) { debug.logerror(error); } return null; }}
以上是传入图片字节数据调用接口的方式,也可以通过url调用,只需将generalbasic换为重载函数generalbasicurl:
测试图片:
ocr.general(file.readallbytes(application.datapath + "/picture.jpg"));
以上就是unity实现ocr文字识别功能的详细内容,更多关于unity ocr文字识别的资料请关注www.887551.com其它相关文章!
本文发布于:2023-04-04 09:53:12,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/cae34d35f6839a513c5212e769f5193e.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:Unity实现OCR文字识别功能.doc
本文 PDF 下载地址:Unity实现OCR文字识别功能.pdf
留言与评论(共有 0 条评论) |