文本识别OCR全球权威测试结果发布：中国打包前五名

资讯热点

当前位置：首页 > 电商动态 > 文本识别OCR全球权威测试结果发布：中国打包前五名

发布时间：2024-4-27 分类：电商动态

11月20日，国际文件分析和识别大会（ICDAR）数据集的最新结果被宣布，该数据集在OCR领域被称为奥斯卡。中国的大学和企业在排名中名列前五。中国人工智能“国家团队”基于云的Pixel-Anchor框架在几个ICDAR测试子集（ICDAR2015和ICDAR2017 MLT）中取得了第一名，特别是在东亚语言（包括中文）中。部分表现是光明的。

五大ICDAR2015数据集和框架名称分别为：Pixel-Anchor，南京大学和南京科技大学（PSENet），Mask Text，FOTS和IncepText。）。

五大ICDAR2017 MLT数据集和框架名称分别为Pixel-Anchor，ATL-cangjie，FOTS，EAST ++和南京大学（PSENet_NJU）。

国际文件分析和识别会议（ICDAR）侧重于文本领域的识别和应用。自2003年“健壮阅读比赛”大会成立以来，该竞赛已成为对自然场景/网络图片/自动提取复杂视频文本的评估和验证。随着最重要的国际竞赛和标准的发展，最新的智能识别技术，竞争中的许多方法都有很强的OCR技术发展动力。高科技难度和强大的实际应用也引起了研究机构和科技公司的关注。来自全球89个国家的3500多支队伍参加了比赛。

截至目前，世界顶尖大学，研究机构和企业都参与了这项测试，包括谷歌，微软，亚马逊，Facebook，以及中国的腾讯，搜狗，北京大学，中国科技大学。

科技云计算，阿里巴巴，南京大学，南京理工大学，上唐科技和Defiance科技在榜单上取得了不错的成绩，表明中国在国际舞台上继续引领OCR领域的研究。

计算机视觉基础技术

应用前景广泛

OCR（光学字符识别）是指分析和识别输入图像并获取图像中的文本信息的过程，并且具有广泛的应用场景。自然场景中的OCR技术不需要针对特殊场景进行定制，并且可以识别任何场景图片中的文本。

与传统的面向高质量文档图像的OCR相比，自然场景OCR跳出了输入图像的质量和场景的约束，可以应用于更广泛的领域，引起了学术界和业界的高度关注。。

然而，与传统的OCR相比，自然场景OCR中的各种商品，风景或自然场景图片的文本检测和识别面临着复杂的背景干扰，文本模糊和退化，不可预测的照明，字体多样性，垂直文本，斜文还有很多其他挑战。

OCR是计算机视觉领域的经典问题，长期以来一直是学术界和工业界关注的问题。在工业领域，谷歌，微软和亚马逊等大型互联网公司以及云聪科技等人工智能创业公司多年来一直致力于OCR技术的开发。随着技术的不断成熟，OCR也开始在互联网和其他行业中在线使用，其应用范围已从文档识别扩展到照片分析，车牌识别，图像广告过滤，场景理解，产品识别，街景定位和票证识别。领域。

« 春节微信红包的封面在线5000万册微信红包的封面等待领取 | 京东低调上线“京东优品”二手市场谁恐慌？ »

: 周一周五 8:30 - 18:00

鲁ICP备14007395号-43

客服QQ