聚焦文本区域的场景图像超分辨率研究

来源：点击：时间：2022年07月21日 11:49

报告嘉宾：李斌

报告时间：2022年7月26日周二上午10点

报告题目：聚焦文本区域的场景图像超分辨率研究

腾讯会议号：654-793-373

报告人简介：李斌，复旦大学计算机科学技术学院研究员、博导，上海高校特聘教授（东方学者）。2009年获复旦大学理学博士学位，之后历任悉尼科技大学讲师、澳大利亚联邦科学与工业研究组织（CSIRO）资深研究员，2017年底回复旦大学任教。研究领域为机器学习、视觉智能、大数据分析，在IEEE TKDE、IEEE TCYB等知名期刊与ICML、NeurIPS、IJCAI、AAAI等人工智能顶级会议上发表论文60余篇，获2009年CCF优秀博士论文提名奖、PAKDD-13最佳论文奖，主持国家自然科学基金面上项目、上海市科委科技创新行动计划等项目。

报告摘要：光学字符识别（OCR）经过数十年的发展已广泛应用于各行各业。然而OCR在实际应用中仍面临诸多困难，例如复杂背景、文本变形、低分辨率等。由于远距离拍摄、相机失焦等原因，低分辨率文本图像较为常见，但是针对文本图像低分辨率的研究却相对较少——已有方法大多将包含文本的图像视作整体进行全局超分辨率处理，忽略了模型仅需聚焦文本的事实。受人类视觉中“非注意盲视”的启发，我们提出了一种聚焦文本区域的文本超分辨率方法，利用文本识别器感知到的字符位置和字符类别信息指导文本图像超分。进一步地，格式塔心理学表明人类能够通过观测到的局部细节恢复物体的完整形态，为此我们提出了一种聚焦笔画区域的文本超分辨率方法，通过引入更加细致的笔画位置先验信息指导文本图像超分。本报告首先介绍聚焦文本区域图像超分的研究动机，接着介绍文本图像超分任务的相关工作，最后重点介绍我们提出的聚焦文本区域的场景图像超分辨率方法。