题目:深度学习时代的文字识别:从数据驱动到知识驱动
报告人:金连文
时间:2023年3月21日(周二),下午15:00-16:00
会议地点:31号楼9楼信息工程学院学术报告厅
报告摘要:
光学文字识别(OCR)技术在图像理解、信息录入、身份认证等诸多领域有非常广阔的应用前景,是计算机视觉及人工智能领域的重要问题之一。近年来,基于数据驱动的文字识别已经有很多深入的研究工作及成果报道,但如何解决数据稀缺及弱标注情况下的文字识别问题、如何利用领域知识、结合文本语义知识来更好的进行文字识别和理解文档图像,是OCR领域中的研究新方向及趋势之一。在本报告中,我将简要介绍近年来在OCR领域发展的一些弱监督/自监督文字识别、基于领域知识驱动的手写识别和基于OCR+NLP的文档图像理解等方面的一些研究进展,并探讨OCR领域未来发展的一些新方向及新问题。
报告人简介:
金连文,男,华南理工大学二级教授,兼任中国图像图形学学会(CSIG)常务理事、广东省图像图形学学会理事长、CSIG文档图像分析与识别专委会主任、CCF-HCI和CCF-CV执行委员、CSIG-CV、CAAI-PR和CAA-PRMI专委会常务委员等职。主要研究领域为文字识别、文档图像理解等,在IEEE Transactions及权威国际会议上发表学术论文200余篇,其中SCI Q1区+CCF A类论文90余篇,Google Scholar论文被引用数11000余次,H-Index 55。作为负责人先后主持国家科技支撑计划课题、国家重点研发计划课题/子课题、国家自然科学基金重点项目/面上项目、广东省自然科学基金团队项目/重点项目、企业合作项目等科研项目40余项;获省部级科技奖5项(其中一等奖2项,二等奖3项);荣获中国人工智能学会、中国电子学会和中国图象图形学会科技进步二等奖各1项;指导学生参加国际国内学术竞赛荣获冠军20余次。
中国·浙江 湖州市二环东路759号(313000) 浙ICP备10025412号 浙公网安备 33050202000195号 版权所有:党委宣传部