当前位置: 首页 > news >正文

深入解析:MME:多模态大语言模型综合评估基准

深入解析:MME:多模态大语言模型综合评估基准

2025-12-03 19:02  tlnshuju  阅读(0)  评论(0)    收藏  举报
  • 论文标题:MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

  • 发表会议:NeurlPS2025

  • ️作者单位:腾讯优图实验室、厦门大学

  • 论文链接:https://arxiv.org/pdf/2306.13394

  • 项目地址:https://mmmu-benchmark.github.io/#leaderboard

  • 代码地址:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models/tree/Evaluation

一、任务定义

  • 多模态大语言模型(Multimodal Large Language Model, MLLM)利用强大的大语言模型处理多模态信息并给出推理结果,展现了令人惊讶的涌现能力。然而,现有的评估方