【图灵学术大讲堂】第三讲喻莉教授应邀作题为“面向机器视觉的图像视频编码技术”的学术报告-重庆师范大学计算机与信息科学学院

当前位置：首页 > 学科科研 > 学术动态 > 正文

【图灵学术大讲堂】第三讲喻莉教授应邀作题为“面向机器视觉的图像视频编码技术”的学术报告

作者：佚名，2023-10-08，编辑：傅帆，浏览量：次

9月27日下午15:00，计算机与信息科学学院在致用楼102学术会议厅举办“图灵学术大讲堂”第三讲，华中科技大学教授喻莉应邀做题为《面向机器视觉的图像视频编码技术》的学术报告。学院领导、全体教师、研究生参加，会议由副院长崔少国主持。

报告开始之前，学院为喻莉教授举行了兼职教授授予仪式，由院长魏延颁发“兼职教授”聘书并合影留念。魏延对喻莉教授的到来表示热烈欢迎，并对未来喻教授与学院相关工作的深入合作表示感激。崔院长详细介绍了喻教授近年来的科研成果、研究方向。

随后，喻教授首先基于自动驾驶、智慧城市、工业互联网等场景中的视频分析，对面向机器视觉的图像视频编码的研究背景进行阐释，指出面向人类的视频与面向机器的视频在应用场景、信息处理、编码和信息处理与使用上存在着差异。紧接着，她从VCM标准发展现状，Track-1特征压缩、Track-2 先压缩后分析的两条技术路线，以及MPEG143次会议中VCM最新进展等进行了详细介绍。她谈到，机器视觉编码是研究以智能应用为目标的压缩编码技术，在保障压缩率的同时，要做到计算机视觉任务的无损。提取到的压缩视频或特征码流可服务于多种机器任务，同时保障高压缩效率和机器智能任务性能。同时指出，三个核心任务(目标检测/实例分割/目标追踪)加两个主要评估数据集(OpenImageV6/TVD)。就两条思路中两条标准里所提到的VCM架构，一个是根据特征来统计的压缩方法，另一个是将特征转换成图像，然后再进行图像压缩编码。对于特征压缩，一方面是现有的编解码方案，可以把它变成HEVC、VVC等。另一方面是新的技术方案，包括有特征变换，就是对统计特性进行视频域的分布的变换。对此，喻教授进行了详细的介绍。最后，喻教授向我们指明了面向机器视觉图像视频编码技术未来的努力方向。

讲座结束后，现场同学进行了热烈提问，大家分别就机器视觉提取出的特征难以恢复，用该技术是否可以用于隐私的保护/多尺度特征提取的问题/如何区分出感兴趣区域等提出问题，喻教授耐心地进行了详细的答疑解惑。

上一条：【智汇青年论坛】第四期曾攀博士、肖颗博士作题为“短期电力负荷预测中的特征取值和模型策略”“车联网高效数据分发的研究”的学术报告

下一条：【图灵学术讲堂】第二讲李伟生教授应邀作题为“国家自然科学基金项目申报的若干问题”的学术报告

【关闭】