chineseocr_lite 是一个开源项目,用来实现中文的文字识别,支持竖排文字识别、繁体识别,总模型只有 17M(很小就是了),无需联网,支持 CPU 与 GPU,但需要自己部署。@Appinn
目前绝大多数图片转文字,或者说中文 OCR 系统,都使用了云服务,也就是需要联网使用,这使得服务商有着大量的数据可以进行机器学习,而 chineseocr_lite 就有点厉害了:
超轻量级中文 ocr,支持竖排文字识别, 支持 ncnn 推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅 17M
虽然说,青小蛙对上面的几个项目不是很熟(第一次见),但测试了一番,识别率还是可以的,这就行了。
如何安装?
chineseocr_lite 是一款需要自行编译、自行部署的开源软件(GitHub 开源),所以…有使用门槛!
必备环境:
- Python
- PyTorch(官网)
- VS2015(Windows 需要)
Linux 与 macOS 直接编译就好,青小蛙在想要不要搞成 Docker 方便大家用…想用的人多么?
编译也非常简单,只需要先复制源代码,然后跟着编译即可:
git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
cd psenet/pse
rm -rf pse.so
make
如何运行?
pip3 install -r requirements.txt
cd chineseocr_lite ## 进入chineseocr目录
python3 app.py 8080 ## 8080端口号,可以设置任意端口
上面的安装和运行两个步骤,对于新手会有不少的坑,所以你需要善用搜索引擎…总之青小蛙觉得这是一个能挡住 90% 普通用户的项目 ?
如何使用?
在浏览器上输入 ip:8080 就能打开页面,然后加载图片进行识别了。并且还有 火车票、身份证 两个单独识别选项。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/166419.html