本文旨在开发一种基于深度学习的框架,通过观察视频序列生成逼真的音频,其中基于Transformer的架构显示出最有潜力的结果。 [AS]《An Initial Exploration: Learning to Generate Realistic Audio for Silent Video》M Martel, J Wagner [UC Berkekey] (2023) 网页链接 #机器学习##人工智能##论文#