
OCR通用文字识别

算法介绍
采用先进AI视觉算法,支持印刷文档、手写内容及自然场景文字识别,覆盖证书、说明书、合同签名、路标牌匾等多形态文本。可识别中英文多语种,手写体识别准确率达85%+,支持任意角度与低像素字符解析,输出高效精准。
- ● 单字符识别精度为16*16像素,可识别任意角度
- ● 印刷数字、字母识别精度在98%以上
- ● 印刷中文字符准确率90%以上
- ● 手写体、英文准确率85%以上
- ● 拍摄要求:清晰,正对,无反光,票据在照片中所占位置不低于80%
常见问题
-
算法精度网站已发布算法精度皆在90%以上,实际使用时出现掉点现象的原因可能包括:
(1)数据成像质量差,如
强光、逆光、夜间、雨雪雾导致图像质量下降;
低分辨率、运动模糊、镜头污损、压缩失真、传感器噪声;
目标被部分或完全遮挡(常见于目标检测、跟踪、姿态估计);
(2)网站提供通用和长尾(罕见场景/稀有目标类别/数据量不足)两大类算法,长尾算法泛化性较差
(3)边界或极端场景下的测试不保证精度
-
部署推理提供模型/APP/SDK多种形式部署
与华为昇腾/天数/登临等10余家芯片厂商完成适配,兼容国产CPU/GPU/NPU,高质量满足信创要求
针对不同算力的硬件适配不同参数量的高精度模型
-
算法如何定制网站所展示的算法模型皆有对应模型和应用案例,可直接获取。如需进一步优化或者定制可参考以下两种方案:
(1)常规定制 (高精度,周期较长):需求沟通->回流有效数据(场景图片不低于1000张/视频不低于100段)->定制算法开发部署->测试验收
(2)快速实现 (Monolith一站式算法生产平台:https://monolith.sensefoundry.cn/ ):平台提供了极为友好、易上手的Web界面,用户无需深厚的AI背景,即可一站式完成数据上传、智能标注、模型训练与部署等全流程操作。只需30分钟,便可快速生成并上线一个高性能视觉模型,大幅缩短算法生产周期。