近日,在三大计算机视觉顶级会议之一的2022ECCV(欧洲计算机视觉会议)上,科大讯飞荣膺2022OOV-ST挑战赛(TheECCV2022ChallengeonOutofVocabularySceneTextUnderstanding)文字识别赛道冠军,取得了OOV场景和综合场景双指标第一的佳绩。
人类能够通过学习简单样本快速提升知识水平,并具备较好的迁移能力——例如人类通过学习汉字的笔画和偏旁部首知识,就能完成对新汉字的辨认和转写。而这种能力是当前神经网络模型的薄弱项,也是本次比赛的核心考察项。
为此,科大讯飞研究院提出了基于视觉语言自适应权衡的VLADM(Vision-Language Adaptive Mutual Decoder)方案,在复杂场景上取得了集外词59.61%、综合指标70.31%的句正确率效果,最终夺冠。此次比赛所涉及的文字识别能力和集外词识别技术,目前已经在讯飞翻译机、讯飞AI学习机等产品中落地应用,为人们的工作、学习和生活提供了更多便利。
未来,讯飞研究院将在图文识别领域的相关技术上持续发力,并结合实际落地应用探索更多技术赋能场景,让机器拥有更犀利的“眼睛”和智慧的“头脑”。
来源:中国证券报·中证网 作者:董安琪
温馨提示:最新动态随时看,请关注金投网APP。
<上一篇 可持续发展伦理下ESG体系有不断提升空间
下一篇> 圣泉集团:生物基硬碳负极材料得到一致好评
相关推荐
- 光大证券:为客户提供全方位具有光证特色的金融服务
- 2月20日,光大证券2023年度线上投资策略会开幕。本次策略会以“新时代新格局新征程”为主题,历时10天。光大证券研究所33个研究团队集体亮相,与53位重磅专家和486家上市公司云端齐聚,共同探讨2023年经济形势,挖掘资本市场投资机会。
- 实时热点 交通 探索 0
热点话题
- 停止英语等级考试 英语的秘密你知道多少?
- 停止英语等级考试英语的秘密你知道多少?英...[详情]
- 中国成单身大国有哪些反思和危害?
- 中国成单身大国有哪些反思和危害?哪怕生活...[详情]
- 女生整容成刘亦菲 整容的真相你知道多少?
- 女生整容成刘亦菲整容有的真相你知道多少?...[详情]
- 霍金再次发出警告 究竟科技和毁灭要怎么看待?
- 霍金再次发出警告究竟科技和毁灭要怎么看待...[详情]