google提出的Attention-ocr论文.pdf
摘要 : 本文提出了一种基于卷积神经网络、循环神经网络和新型注意力机制的神经网络模型,该模型能够在挑战性的法国街道名称标志(FSNS)数据集上实现84.2%的准确度,显著优于之前的最新研究成果(72.46%)。此外,本文的新方法比之前的方法更简单、更通用。针对一种更具挑战性的基于Google Street View的数据集,在该数据集上,本文模型的目标是从店面中提取商家名称。最后,本文研究了使用不同深度的CNN特征提取器所得到的速度/准确性权衡。令人惊讶的是,我们发现深度并不总是越深越好(在准确度和速度方面)。本文的模型简单、准确、快速,可以在各种具有挑战性的现实世界文本提取问题的大规模应用。传统的OCR系统集中在从扫描文档中提取文本,而从自然场景中获取的文本因失真、遮挡、模糊、背景杂乱或不同视角而更具挑战性。但在深度学习方面取得的最新进展,使得在这方面的研究取得了重大进展。
相关报告
-
6.48 MB 86页 【论文推荐】基于大语言模型的智能体综述——复旦NLP -.pdf
-
5.17 MB 86页 基于人脸识别的门禁系统实现_倪伟健硕士学位论文.pdf
-
3.82 MB 41页 Google母公司的万亿理想——Waymo公司案例研究分析.pdf
-
598.67 KB 17页 银保监会工作论文-区块链、数字货币和分布式账户的发展与监管研究-2018.6-16页.pdf
-
1.02 MB 14页 人口的转变,应对超低生育率的海外经验-国金证券-20240422.pdf
-
649.18 KB 14页 黄金上涨的宏观逻辑及运行空间-招商证券-20240418.pdf
-
840.01 KB 12页 “天工”系列专题之四:隐秘的角落,小企业景气恢复-申万宏源-20240419.pdf
-
35.07 MB 37页 2024中国年轻人的钻石新意:真正的奢华是“悦己”-JINGDAILY-202404.pdf
-
4.15 MB 27页 【中国移动研究院】面向5GB5G和算力网络的传送网技术发展探讨.pdf