google提出的Attention-ocr论文.pdf

摘要 : 本文提出了一种基于卷积神经网络、循环神经网络和新型注意力机制的神经网络模型,该模型能够在挑战性的法国街道名称标志(FSNS)数据集上实现84.2%的准确度,显著优于之前的最新研究成果(72.46%)。此外,本文的新方法比之前的方法更简单、更通用。针对一种更具挑战性的基于Google Street View的数据集,在该数据集上,本文模型的目标是从店面中提取商家名称。最后,本文研究了使用不同深度的CNN特征提取器所得到的速度/准确性权衡。令人惊讶的是,我们发现深度并不总是越深越好(在准确度和速度方面)。本文的模型简单、准确、快速,可以在各种具有挑战性的现实世界文本提取问题的大规模应用。传统的OCR系统集中在从扫描文档中提取文本,而从自然场景中获取的文本因失真、遮挡、模糊、背景杂乱或不同视角而更具挑战性。但在深度学习方面取得的最新进展,使得在这方面的研究取得了重大进展。
在线阅读 下载报告 | 6.72 MB | 7页
阅读和下载会消耗积分,
登录、注册、邀请好友、上传报告均可获得积分。
与最强人工智能Ai对话