将视频转换为文本描述的最佳模型是什么? 我之前使用过gemini,但由于某种原因,它现在不再支持mp4格式了。 帮帮我
4.1K