人工智能多模态大语言模型综合评测 - 港大人工智能评测实验室

多模态大语言模型

多模态大语言模型(MLLMs)是一种能够理解和生成多种形式的内容（涵盖文本、图像、视频、音频等多种模态）的机器学习模型。它们通过融合不同模态的数据，实现了跨模态的信息理解与生成，被广泛应用于虚拟助手、内容创作等领域。

多模态大语言模型 (Multimodal large language models)

排行榜

注：该列表更新于2025年3月