当前位置：首页 > news >正文

深入解析：MME：多模态大语言模型综合评估基准

news 2026/3/26 19:49:16

深入解析：MME：多模态大语言模型综合评估基准

2025-12-03 19:02 tlnshuju 阅读(0) 评论(0) 收藏举报

论文标题：MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models
发表会议：NeurlPS2025
️作者单位：腾讯优图实验室、厦门大学
论文链接：https://arxiv.org/pdf/2306.13394
项目地址：https://mmmu-benchmark.github.io/#leaderboard
代码地址：https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models/tree/Evaluation

一、任务定义

多模态大语言模型（Multimodal Large Language Model, MLLM）利用强大的大语言模型处理多模态信息并给出推理结果，展现了令人惊讶的涌现能力。然而，现有的评估方