当前位置: 首页 > 学科科研 > 学术动态 > 正文
【图灵学术大讲堂】第三讲 喻莉教授应邀作题为“面向机器视觉的图像视频编码技术”的学术报告
作者:佚名,2023-10-08,编辑:傅帆,浏览量: 次

927日下午15:00,计算机与信息科学学院在致用楼102学术会议厅举办图灵学术大讲堂第三讲,华中科技大学教授喻莉应邀做题为《面向机器视觉的图像视频编码技术》的学术报告。学院领导、全体教师、研究生参加,会议由副院长崔少国主持。

报告开始之前,学院为喻莉教授举行了兼职教授授予仪式,由院长魏延颁发兼职教授聘书并合影留念。魏延对喻莉教授的到来表示热烈欢迎,并对未来喻教授与学院相关工作的深入合作表示感激。崔院长详细介绍了喻教授近年来的科研成果、研究方向。

随后,喻教授首先基于自动驾驶、智慧城市、工业互联网等场景中的视频分析,对面向机器视觉的图像视频编码的研究背景进行阐释,指出面向人类的视频与面向机器的视频在应用场景、信息处理、编码和信息处理与使用上存在着差异。紧接着,她从VCM标准发展现状,Track-1特征压缩、Track-2 先压缩后分析的两条技术路线,以及MPEG143次会议中VCM最新进展等进行了详细介绍。她谈到,机器视觉编码是研究以智能应用为目标的压缩编码技术,在保障压缩率的同时,要做到计算机视觉任务的无损。提取到的压缩视频或特征码流可服务于多种机器任务,同时保障高压缩效率和机器智能任务性能。同时指出,三个核心任务(目标检测/实例分割/目标追踪)加两个主要评估数据集(OpenImageV6/TVD)。就两条思路中两条标准里所提到的VCM架构,一个是根据特征来统计的压缩方法,另一个是将特征转换成图像,然后再进行图像压缩编码。对于特征压缩,一方面是现有的编解码方案,可以把它变成HEVCVVC等。另一方面是新的技术方案,包括有特征变换,就是对统计特性进行视频域的分布的变换。对此,喻教授进行了详细的介绍。最后,喻教授向我们指明了面向机器视觉图像视频编码技术未来的努力方向。

讲座结束后,现场同学进行了热烈提问,大家分别就机器视觉提取出的特征难以恢复,用该技术是否可以用于隐私的保护/多尺度特征提取的问题/如何区分出感兴趣区域等提出问题,喻教授耐心地进行了详细的答疑解惑。

关闭


地 址:重庆市沙坪坝区大学城中路37号 , 致用楼  
邮 编:401331     院 办: 023-65910275
教科办:023-65910270 学工办: 023-65910272

Copyright@计算机与信息科学学院,2010-2022 
网页设计:汪晓玲
技术支持:谭华山,E-Mail:6510388@qq.com