Git Product home page Git Product logo

wanqieddy / license-plate-detect-recognition-via-deep-neural-networks-accuracy-up-to-99.9 Goto Github PK

View Code? Open in Web Editor NEW

This project forked from zhubenfu/license-plate-detect-recognition-via-deep-neural-networks-accuracy-up-to-99.9

0.0 2.0 0.0 361.48 MB

works in real-time with detection and recognition accuracy up to 99.8% for Chinese license plates: 100 ms/plate

CMake 1.91% C++ 86.51% C 0.10% Cuda 8.77% Batchfile 0.03% Python 2.62% Shell 0.06%

license-plate-detect-recognition-via-deep-neural-networks-accuracy-up-to-99.9's Introduction

License-Plate-Detect-Recognition-via-Deep-Neural-Networks-accuracy-up-to-99.9

works in real-time with detection and recognition accuracy up to 99.8% for Chinese license plates: 100 ms/plate!

进来看一定要加star!右上角!

github 里面会有一个列表,专门收集了你所有 star 过的项目,点击 github 个人头像,可以看到 your stars 的条目,点击就可以查看你 star 过的所有项目了。

准商业项目:正在整理文档 后面全部开放出来文档和全部资料。

本项目采用了多种方式识别车牌,每一种方式各有优缺点,现在统一更新出来!

检测大牌 分割单个字符 识别车牌 项目支持
haar+cascade haar+cascade 切割出单个字符通过cnn识别 [Y]
mtcnn 图像处理 lstm+ctc [Y]
图像处理:跳变点 fcn全卷积网络带单个字符定位 [ ]
YOLO [ ]
原图 目标 点回归
YOLO 归一化 X 增一层
mtcnn X 归一化 增一层
haar+cascade X 归一化

需用用到的第三方库下载3rdparty 20180726 百度云

注意说明: 项目采用vs2015 x64 release cuda9.2编译

##一、整个大车牌检测基于haar+cascade的检测或者mtcnn的检测,

车牌识别技术详解六--基于Adaboost+haar训练的车牌检测

大牌检测采用车牌比例为90:36的比例,训练基于haar特征的adaboost检测。

(1)准备样本: 正样本:样本处理和选择非常有技巧,我的标准是框住整个车牌留出边框,这样既保留了车牌原有的字符特征,字符组特征还有车牌的边框特征。其中双行车牌我只取底下面的一行。并且检测样本最好不要预处理,输入源给出什么图形就用什么图形。具体的抠图方式可以参考我其他博客车牌识别技术详解三--字符检测的正负样本得取(利用鼠标画框抠图)。

负样本:负样本选择同样非常有技巧性。尽量采集车牌使用环境下的背景图片,并且需要包含一部分车牌字符但是非正样本的取在车牌周围的负样本。

##二、mtcnn检测到车牌之后,通过回归得到四个角点,做透视变换对齐得到水平车牌,实测可以处理角度非常偏的车牌,

image

##三、单个车牌字符分割是基于haar+cascade加上逻辑筛选,

###1、图像识别中最核心最难搞的模块之一:目标检测定位分割 做识别应用最难的部分就是分割了,图像分割好了,后端做识别才更简单。

*检测前需不需要做图像预处理:建议可以根据实际情况简单处理下,常用的比如cvNorm,但是仅在备份图像上做处理,原图尽量不动,原图留做识别抠图。 *训练一个分类器进行目标检测,以haar+adaboost为例,详细参考字符检测的正负样本得取(利用鼠标画框抠图)和准备样本等。

image

###2.**往往分类器仅仅只能得到以上一个初步的效果,这时候需要根据项目实际图像固有的特征规律进行一些调整。 **

车牌识别技术详解三--字符检测的正负样本得取(利用鼠标画框抠图)

单个字符的分割可以基于haar或者采用fcn!

车牌识别技术详解四--二值化找轮廓做分割得样本(车牌分割,验证码分割)

##四、识别支持blstm+ctc全图识别、单个字符分割识别和FCN全卷积识别。

算法 识别车牌的方法 优缺点
haar+cascade 切割出单个字符通过cnn识别 由于单个字符样本较多,所以识别率在正面车牌情况下,非常高
lstm+ctc 全图识别,可以处理角度,污迹等等
fcn+反卷积 fcn全卷机网络带单个字符定位 带定位,但是依赖数据过多

(1)**FCN Multilabel Caffe方法综述FCN的车牌图像识别,end-to-end 目标定位、图像识别 **

image

image

(2)单个字符识别: 识别样本丰富性处理:很多应用你取不到特别多的样本,覆盖不了所有的情况,并且样本之间的均衡性也很难平衡。常见的情况肯定是出现最多的,样本是最多的,还有可能某类样本数是最多的,另一类别下的样本数也是比较少的。 实际项目其实时间花的最多的就是在那20%-30%的情况下做边界处理占了项目90%的时间。 我们需要尽可能的保证样本的均衡性,采样时候各种情况尽可能包含,每类别下的样本数量尽量均衡。 某类样本数量不够可以采集图像处理增加样本量,常用的有分割的时候上下左右平移,图像拉伸,滤波等。

##五、部分结果展示

image

image

image

image

image

##六、数据资源共享交流: 主要是促进交流,不为盈利!将准商业的产品开源,欢迎交流,各抒己见,逐步完善成一个通用的目标检测分割识别的OCR开源项目

(1)交流加群:加QQ群 图像处理分析机器视觉 109128646

感谢群友:E-图像处理_仪山湖 贡献的操作说明!和完整的第三方库,下载地址在群共享里面!

1: 安装CUDA 9.2, cuda9.2版已经带有显卡驱动,默认安装,保持cuda和显卡驱动一致,否则会报cuda runtime is inefficient 35号错误。

2:确认各项目的include、lib和第三方库路径的配置,本人在项目中除CUDA使用绝对路径外,其余的include、lib路径均使用相对路径

    caffe项目:
	   C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\include
..\..\opensource\boost_1_57_0
..\..\opensource\opencv\include
..\..\3rdparty\include
..\..\include
..\..\3rdparty\include\lmdb
..\..\3rdparty\include\hdf5
..\..\src\
..\..\3rdparty\include\glog
..\..\3rdparty\include\cudnn
..\..\src\caffe\proto
..\..\3rdparty\include\openblas
   
   ..\..\opensource\boost_1_57_0\lib
..\..\opensource\opencv\lib
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\lib\x64
..\..\3rdparty\lib
..\..\tools_bin

 
	libClassfication项目:
	..\..\3rdparty\include\openblas
..\..\opensource\opencv\include
..\..\opensource\boost_1_57_0
..\..\3rdparty\include
..\..\include
..\..\3rdparty\include\lmdb
..\..\3rdparty\include\hdf5
..\..\src\
..\..\3rdparty\include\glog
..\..\3rdparty\include\cudnn
..\..\src\caffe\proto
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\include

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\lib\x64
..\..\opensource\boost_1_57_0\lib
..\..\opensource\opencv\lib
..\..\3rdparty\lib
..\..\tools_bin
	
	ocr_test:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\include
..\..\opensource\boost_1_57_0
..\..\opensource\opencv\include
..\libClassification
..\..\include
..\..\3rdparty\include
..\..\src\
..\..\3rdparty\include\openblas

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2\lib\x64
..\..\opensource\opencv\lib
..\..\opensource\boost_1_57_0\lib
..\..\tools_bin

3:生成时要选择Release,x64格式

4:在项目的cuda生成host代码时,支持一些旧版本的cu伪代码,三个项目都设置成:compute_61,sm_61;compute_52,sm_52;compute_50,sm_50;compute_35,sm_35;compute_30,sm_30,否则会报no kernel image 40号错误

5:整理的3rdparty请使用群文件的3rdparty-20180730.tar

6:在visual studio 2015打开caffe.sln方案时(项目根目录下),如果出现无法加载工程的错误,打开项目根目录下的caffe-vsproj\caffe.sln

7:导入工程后,在ocr_test的项目,右键,选择【生成依赖项】-> 【项目依赖项】,勾选caffe, libClassfication两个项目

8: 项目代码中对路径没有做规范化处理,导致在运行期间报找不到模型文件的错误,为了调试方便,这里把代码中的路径全部修改成绝对路径,如ocr_test.cpp的962行, string modelfolder = "E:\License-Plate-Detect-Recognition\caffe-vsproj\ocr_test\plateCard_test"; 其他的类似修改 但要区分MTCNN模型和ICNNPredict模型的位置

9:启动一个cmd,切换到工程根目录下的tools_bin目录,启动ocr_test.ext

(2)武汉周边的朋友可以加我,周末一起约起,多交流相互学习! image

license-plate-detect-recognition-via-deep-neural-networks-accuracy-up-to-99.9's People

Contributors

zhubenfu avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.