官网:https://haomo-tech.com
作者:胡小根 陈赛康
邮箱:hxg@haomo-studio.com
1 概述
1.1 技术描述
文档扫描,根据终端的不同,可以分为:
a. PC端
b. Web端
c. APP端
这是一个数字化加工或数字化扫描加工的技术。
涵盖的关键技术点如下:
CCD成像技术
将图像像素转换成数字信号;
1.2 技术发展历史
显而易见,文件扫描对应的职责为文档信息管理。过去一直使用粗放型模式即以增加办公人员和办公费用为解决这一难题的唯一手段,致使管理成
本大幅上涨。而数字化信息管理使传统的以纸质为载体的信息对象转为[机读信息,不仅节约了保管费用,节省了占地空间,而且查阅起来极为方
便迅速,从而避免了反复印制资料而造成的纸张和人员的浪费。
1.3 技术发展趋势
文件扫描是顺应信息数字化的产物。信息数字化是随着计算机技术、扫描技术、扫描矩阵CCD技术、OCR技术、数字摄影技术\(录音、录像\)、
数据库技术、多媒体技术、存储技术的发展而产生的一种新型信息形态,它把各种载体的信息资源转化为数字化的信息,以数字化的形式存储,
网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的信息库,及时提供利用,实现资源共享。
2 技术方案
2.1 方案1:PC端
扫描仪的应用;
2.2 方案2:Web端
通过调用相应插件(Activex)或SDK(Dynamic Web TWAIN SDK+Node.js)调用
扫描仪实现连续扫描并上传图像,从而实现扫描;
2.3 方案3:App端
基于智能手机拍照功能\(CDD成像技术\)+Opencv+OCR等技术而集成的sdk的应用。
3 市场应用
3.1 xxx行业应用
3.2 xxx行业应用
3.3 xxx行业应用
4 产品方案对比
4.1 开源方案
4.1.1 AndroidScannerDemo
网址:https://github.com/jhansireddy/AndroidScannerDemo
优点:
集成依赖库,便于移植; 可进行切边操作,实用性更好; 以静态加载的方法调用Opencv,避免直接引用OpencvManger,增加用户体验;
美中不足:
软件包过大(20M),降低下载量;
4.1.2 OpenNoteScanner
网址:https://github.com/ctodobom/OpenNoteScanner
优点:
拍照功能引用zxing,拍照性能优化; 功能多样,具备操作文档的浏览功能; 应用占用空间小,仅2M左右,且功能齐全;
缺点:
直接引用Opnecv,捆绑式下载OpencvManager,降低用户体验; 未进行集成封装,移植性欠缺;
4.1.3 IPDFCameraViewController
4.1.4 MAImagePickerController-of-InstaPDF
网址:https://github.com/mmackh/MAImagePickerController-of-InstaPDF
4.1.5 ScannerLite
4.1.6 react-native-document-scanner
网址:https://github.com/Michaelvilleneuve/react-native-document-scanner
4.1.7 MMCamScanner
4.1.8 ldbm-image-background-remover
网址:
4.1.9 Deep Image Matting Tensorflow
4.1.10 Rectangle Detection
4.1.11 MADRectDetect
4.2 商业方案
4.1.1 CamScan-SDK
网址:https://dev.camscanner.com/
上线项目:扫描全能王,名片全能王;
上海合合信息科技;
优点:
自动找到图像边框,去除多余背景,矫正偏斜的文档; 具备五种图像增强模式,能让文档更清晰,方便阅读; 具备个性化调整图像参数的功能,获得更满意的扫描效果; 能实现将扫描结果转换为PDF或JPG文件。
缺点:
不开源,SDK对外公开价码30W; 上线项目实测时(全能扫描王)涵盖的OCR功能识别率不高;
5 参考资料
- 快速和准确的文件检测扫描
- Augmented camera previews for the Dropbox Android Document Scanner
- 用OpenCV实现“扫描全能王”APP
- 制作一个类"全能扫描王"的简易扫描软件
- 论文笔记:Deep Image Matting
- Deep Image Matting复现过程总结
- [Object Tracking] Contour Detection through Tensorflow running on smartphone
- 手机端运行卷积神经网络的一次实践 -- 基于 TensorFlow 和 OpenCV 实现文档检测功能
- 如何用TensorFlow和TF-Slim实现图像分类与分割
- Richer Convolutional Features for Edge Detection
- 用OpenCV检测图像中的长方形画布或纸张并提取图像内容