当前位置：首页 > news >正文

ALMA评审系统：基于分层规则与LDA的专家精准匹配工程实践

news 2026/7/13 2:58:21

1. 项目概述：当评审专家遇上“千人千面”的提案

在科研项目管理，尤其是大型天文观测设施如ALMA（阿塔卡马大型毫米/亚毫米波阵列）的提案评审中，一个核心的工程难题是如何把一份探讨“原行星盘尘埃动力学”的提案，精准地送到既懂毫米波观测技术、又熟悉恒星形成理论、最好还对尘埃偏振建模有研究的专家手里。这远不是简单按“天文”或“物理”分类就能解决的。传统的指派方式依赖项目官员的个人知识网络或专家的自荐，不仅效率低下，更可能因信息不对称或“圈子文化”引入偏见，导致优秀的提案因未匹配到“对”的评审人而明珠蒙尘。

ALMA提案评审系统的核心任务，就是构建一个自动化、数据驱动的专家识别与匹配引擎。其技术内核在于，将每位潜在评审专家视为一个多维度的“专长向量”，而每份提案则是另一个“主题向量”，匹配的本质是计算这两个向量在高维语义空间中的相似度。听起来很美好，但实操中陷阱重重：一位资深教授可能同时是星系演化（类别1）和星际介质（类别2）的PI，简单合并其所有提案构建的专长向量会变得“四不像”，失去特异性；另一位专家可能自称擅长“行星形成”（类别4），但其历史提案却集中在“恒星物理”（类别3），盲目采信哪一方都会导致误判。更棘手的是，像“masers”（脉泽）、“polarization”（偏振）这类高频词，可能同时出现在星系、恒星乃至太阳系提案中，导致基于纯文本的LDA主题建模产生“虚假匹配”。

本文要拆解的，正是ALMA系统为解决这些“脏数据”和“复杂场景”而设计的一套融合策略。它没有完全抛弃LDA主题建模的宏观洞察力，也没有单纯依赖专家自声明的关键词，而是像一位经验丰富的侦探，将专家自声明关键词、历史提案所属科学类别、在提案中的角色（PI/Co-I）以及不同科学类别之间的相似性等多条线索编织成一张逻辑严密的决策网。这套方法的价值超越了天文领域，它为任何需要处理“专家画像模糊”、“领域交叉严重”、“数据稀疏且嘈杂”的同行评审系统（如国家自然科学基金、企业研发项目评审）提供了一个可复现、可解释的工程范本。接下来，我将带你深入这套系统的“车间”，看看它是如何一步步将模糊的专家身份，淬炼成精准的匹配指标的。

2. 核心挑战与设计思路拆解：为什么简单的“贴标签”会失灵？

在构建专家匹配系统时，一个天真的想法是为每位专家打上几个固定的领域标签，比如“星系天文学”、“恒星形成”，然后根据提案的标签进行匹配。这种方法在小型、同质化的评审中或许可行，但在ALMA这种每年接收数千份跨学科提案的庞然大物面前，会立刻暴露出其局限性。我们需要从根源上理解这些挑战，才能欣赏后续解决方案的精妙之处。

2.1 专家专长向量的“稀释效应”与“主导效应”

想象一下，一位活跃的天体物理学家张教授。他既是两个大型星系巡天项目的首席研究员（PI），也作为合作者（Co-I）参与了几个关于原行星盘磁场的项目。如果我们将他所有的提案文本（作为PI和Co-I的）合并，用LDA模型提取出一个统一的“专家主题向量”，会发生什么？

这个向量会试图平均化他在“星系尺度上的气体动力学”和“恒星尺度的磁场测量”这两个差异显著的主题上的贡献。结果就是，这个“平均向量”在匹配一个纯粹的“星系中性氢观测”提案时，其相似度得分可能还不如一位只专注于星系研究的年轻学者高。这就是专长稀释：将多领域经验强行压缩成一个点，反而模糊了其在每个具体领域的尖锐性。

反之，如果张教授过去十年写了20份关于星系演化的提案，但只参与过2份关于系外行星大气的提案。在构建专长向量时，如果不加权重，星系演化的主题词会以10:1的数量优势“淹没”系外行星的特征。当一份关于“热木星大气光谱”的提案需要评审时，系统可能会因为张教授向量中强大的“星系”信号而错误地给予高匹配度，或者因为系外行星信号太弱而直接忽略他。这就是主导效应：高频主题压制了低频但可能更相关的专长。

2.2 声明与事实的“表里不一”

评审专家在系统中自声明的“擅长关键词”是其主观意愿的体现，但“过去提交的提案”是其客观行为的记录。两者不一致的情况非常普遍：

兴趣转移：专家早期研究恒星形成，现在兴趣转向了星系考古学，但历史提案库中仍是恒星形成为主，自声明关键词却已更新。
能力溢出：专家是观测技术的大牛，其数据处理方法可广泛应用于太阳系、恒星、星系等多个类别。他可能声明擅长“高精度测光”，但历史提案集中在“太阳系小天体”。一个关于“星系变星测光”的提案，他完全有能力评审，但仅凭历史提案类别匹配可能会漏掉他。
申报策略：有些专家可能倾向于声明更广泛或更热门的领域，以增加自己被选为评审人的机会，尽管其最深度的经验可能在另一个细分方向。

简单地以声明为准，可能指派了不具深度经验的专家；简单地以历史为准，又可能无法捕捉专家最新的兴趣和跨界潜力。系统必须能妥善处理这种“言行不一”。

2.3 LDA主题模型的“词语歧义”陷阱

LDA是一种无监督主题模型，它通过分析文档集中词的共现 patterns，自动发现潜在主题。但它本质上是基于词频统计的。在天文领域，大量专业术语具有高度的领域交叉性。

例如，“polarization”（偏振）这个词：

在星系类别中，它可能关联于“河外星系磁场”、“同步辐射偏振”。
在恒星形成类别中，它可能关联于“原恒星核磁场的塞曼效应探测”。
在太阳系类别中，它可能关联于“行星际尘埃的散射偏振”。

如果一份太阳系提案大量提到“polarization”，而一位星系专家的历史提案中也高频出现该词，LDA模型可能会在两者的主题向量中赋予“偏振”主题较高的权重，从而计算出虚假的高相似度。这就是由共同高频词引发的虚假匹配。系统需要一种机制来“校准”或“条件化”LDA的输出，确保匹配是基于深层的科学语境，而非表面的词汇重叠。

注意：这里的关键洞察是，专家匹配不是一个单纯的“文本相似度计算”问题，而是一个“证据融合与决策”问题。我们需要综合利用不同类型、不同可靠度的证据（声明关键词、历史行为、角色权重、领域知识），通过一个分层的、有优先级的决策流程，来构建最可能反映其当前评审能力的专长画像。

3. 解决方案架构：一个分层递进的专家专长构建流程

面对上述挑战，ALMA系统没有采用单一的复杂模型，而是设计了一套清晰、可解释、分步骤的规则引擎。这套流程的核心思想是：在构建某位专家对于某个特定提案类别（Parent Category）的专长向量时，优先使用最相关、最可靠的证据，并逐级降级寻找替代方案。这个流程完美地体现了“具体问题具体分析”的工程智慧。

3.1 基石：科学类别的相似性网络

在进行任何匹配之前，系统需要一份“领域地图”——即不同科学类别之间的亲疏关系。ALMA的提案类别不是孤立的，它们之间存在知识上的重叠。系统预先定义了类别的相似性（Similar）与相异性（Distinct）。例如：

类别1（星系演化）和类别2（星系际介质）被定义为“相似”，因为它们都处理星系尺度上的物理过程。
类别3（恒星形成）和类别4（原行星盘与行星形成）被定义为“相似”，构成一个从恒星诞生到行星形成的连续研究链条。
而类别1/2（星系相关）与类别3/4（恒星/行星相关）则被定义为“相异”，因为它们研究的空间尺度和物理问题核心差异较大。
类别5（太阳系）可能因其独特性，与所有其他类别都“相异”。

这张关系网是后续所有决策的逻辑基础。它为“在直接证据不足时，可以去哪里寻找间接证据”提供了路线图。

3.2 核心决策表：十一步优先级法则

整个专家专长构建流程被精炼为一张具有11个步骤的决策表（对应于原文中的Table 1）。这个表格是整个系统的“宪法”。我们可以将其逻辑归纳为三个主要阶段和若干检查步骤，我将用更工程化的语言重新解读：

第一阶段：理想情况——声明与行为在目标类别高度一致（步骤1-3）这一阶段的逻辑是：如果专家自己声明了擅长某个领域，并且用实实在在的“首席研究员”（PI）身份在该领域提交过提案，那么这就是最硬的证据。

步骤1（黄金标准）：检查专家是否在目标提案类别C中声明了专长关键词，并且是否曾是类别C中提案的PI。如果两者都为“是”，则仅使用该专家在类别C中作为PI的提案文本来构建其专长向量。这一步确保了专长向量高度聚焦、最具权威性。原文数据显示，超过91%的专家专长向量是通过这一步构建的，这证明了大多数专家的声明和行为在核心领域是一致的。
步骤2（相似领域替补）：如果步骤1不满足（例如，专家未在类别C声明专长，或在类别C没有PI提案），则检查专家是否在与C相似的类别中声明了专长且是PI。如果是，则使用其在相似类别中的PI提案来构建向量。这相当于说：“您没直接做过这个，但您做过非常接近的，我们认为您有能力评审。”
步骤3（相异领域谨慎采纳）：如果前两步都不行，则检查专家是否在与C相异的类别中声明了专长且是PI。如果是，也可采纳，但优先级最低。这通常适用于方法论通用的专家，例如，一位在星系领域（与C相异）开发了某种图像处理算法的PI，可能有能力评审太阳系（类别C）中应用同类算法的提案。

第二阶段：无声明，看行为（步骤7-10）这一阶段针对的是未声明专长关键词的专家。系统退而求其次，完全依据其历史提案行为来推断专长。

步骤7：检查专家是否是目标类别C中提案的PI。如果是，直接用这些提案构建向量。这相当于“用作品说话”。
步骤8/9：依次降级到相似类别、相异类别中寻找PI提案。
步骤10：如果以上都没有，最后考虑专家作为Co-I在目标类别C中的提案。Co-I的参与度通常低于PI，因此作为证据的权重也放在最后。

第三阶段：有声明，无直接相关提案行为（步骤4-6, 11）这是处理“言行不一”或“跨界专家”的关键阶段。

步骤4-6：对应步骤1-3，但将条件中的“PI”替换为“Co-I”。即，专家在某个类别声明了专长，但没有PI提案，只有Co-I提案。系统会按“目标类别 -> 相似类别 -> 相异类别”的优先级，使用其Co-I提案来构建向量。这捕捉了那些深度参与合作但非主导的专家。
步骤11：最特殊的情况。专家声明了在类别C的专长，但在系统记录中，他既不是类别C、也不是其相似或相异类别中任何提案的PI或Co-I。这意味着没有任何历史提案文本可作为依据。此时，系统会采取一个保守但合理的策略：为该专家在类别C的所有提案分配一个固定的、默认的相似度值。这个值通常是一个基于经验的基线分数，表明“该专家自称擅长此领域，但无历史证据，可谨慎考虑”。

3.3 对小众领域与细分主题的特别处理

流程中还有一个重要的“微调”机制。对于某些非常小众的科学类别（如原文提到的Category 5）或大类别下的冷门子方向（如“太阳系”之于“行星科学”类别），可用的专家和提案本身就少。如果严格遵循上述流程，一个在小众领域有专长的专家，仅仅因为他同时在热门领域有大量提案，其小众专长向量就可能被稀释或忽略。

为此，系统设置了“专长向量分叉”逻辑：如果一位专家在某个小众关键词上既有声明，又有相关提案（PI或Co-I），系统会为他单独计算一个针对该小众主题的专长向量。当需要评审包含该小众关键词的提案时，就使用这个特定的向量进行相似度计算，而不是那个被大众主题“污染”的通用向量。这就像为专家建立了一个“主文件夹”和多个“专题子文件夹”，确保了细分领域匹配的精度。

实操心得：这个分层流程的魅力在于它的可解释性和可调试性。如果某次匹配结果不合理，项目官员可以很容易地追溯：系统是依据哪一步（如步骤2）为该专家构建了专长向量？使用的提案来源是哪个类别？这比一个“黑箱”深度学习模型的输出要容易审计得多。在构建类似的系统时，将业务规则清晰地编码为这样的优先级步骤，是保证系统可靠性和获得用户信任的关键。

4. 技术实现细节与实操要点

理解了宏观架构，我们深入到技术实现的“肌肉与骨骼”。这里主要涉及两大块：一是如何从文本中提取“主题向量”（即LDA建模），二是如何实现上述分层决策流程。

4.1 LDA主题建模的工程化实践

LDA在这里的作用，是将一份提案或一组提案（代表专家专长）从冗长的文本，压缩成一个固定长度的、数值化的“主题概率分布向量”。例如，一个向量可能是[星系主题:0.6, 仪器主题:0.3, 恒星主题:0.1]。

4.1.1 文本预处理：比想象中更关键天文提案的文本包含大量公式、编号、特定观测设备名称（如“ALMA Band 6”）和通用科学词汇。预处理步骤直接决定模型“看”到什么。

停用词列表定制：除了通用的“the, is, at”，需要移除天文领域的“通用高频低信息量词”，例如“propose”, “observation”, “we”, “will”，以及望远镜名称“ALMA”、“Hubble”等（除非研究的就是该仪器本身）。但要注意保留关键物理量，如“flux density”（流量密度）。
词干化与词形还原：将“stars”, “starring”, “starred”都归并为“star”。使用专业的科学领域词形还原库（如SciSpacy）比通用库更准确。
N-gram短语抽取：单一词汇会丢失信息。“circumstellar disk”（星周盘）作为一个整体短语，比单独的“circumstellar”和“disk”更有意义。需要使用统计方法（如点互信息PMI）或基于词性的规则来抽取这类固定搭配。
处理数字与单位：将“5 sigma”、“10 km/s”这样的数字-单位组合视为一个整体token，或者将其泛化为“<SIGMA>”、“<VELOCITY>”这类占位符，防止具体数值干扰主题分布。

4.1.2 模型训练与主题数选择

训练语料：使用历史所有提案的摘要和科学目标部分作为训练集。专家专长向量也是基于其关联提案的文本集合训练得出。
主题数（K值）：这是LDA最重要的超参数。K太小，主题过于宽泛，区分度不够（如只有一个“天体物理”主题）；K太大，主题过于碎片化，且容易过拟合。需要通过困惑度（Perplexity）和主题一致性（Coherence Score）曲线来综合判断。通常，对于数千份提案，主题数可能在50到200之间。更重要的是结合领域知识进行人工评估，检查自动生成的主题是否具有清晰的科学含义（例如，“星系动力学”、“恒星磁活动”、“行星大气化学”）。
避免虚假匹配的后期处理：如前所述，LDA可能因为共有词汇产生虚假主题关联。一种缓解方法是：在计算提案与专家向量的相似度（如余弦相似度）之前，对主题向量进行“类别条件化”加权。例如，如果当前提案属于“星系”类别，那么在计算相似度时，可以适当提升专家向量中与“星系”先验相关的主题权重，或降低那些已知的跨类别高歧义主题（如“偏振”）的权重。这需要一份由领域专家标注的“主题-类别”关联表作为先验知识。

4.2 分层决策流程的代码级实现

整个11步的决策逻辑，本质上是一个if-elif-else的规则树。下面以一个伪代码/Python风格的结构展示其核心实现逻辑，这比单纯描述更清晰：

class Expert: def __init__(self, id, declared_keywords, proposal_history): self.id = id # declared_keywords: dict, key: category_id, value: list of keywords self.declared_keywords = declared_keywords # proposal_history: list of dicts, each dict: {'category': cat, 'role': 'PI'/'CoI', 'text': proposal_text} self.proposal_history = proposal_history class Proposal: def __init__(self, id, category, text, keywords): self.id = id self.category = category self.text = text self.keywords = keywords def construct_expertise_vector(expert, target_category, category_similarity_map): """ 根据决策表为专家构建针对目标类别的专长向量。 返回：用于计算的提案文本列表，以及所使用的步骤编号。 """ # 阶段一：有声明 + 有PI提案 (步骤1-3) # 步骤1: 声明在目标类别，且是目标类别的PI if target_category in expert.declared_keywords: pi_proposals_in_target = [p for p in expert.proposal_history if p['category'] == target_category and p['role'] == 'PI'] if pi_proposals_in_target: return extract_texts(pi_proposals_in_target), 1 # 步骤2: 声明在相似类别，且是相似类别的PI similar_cats = category_similarity_map.get_similar(target_category) for cat in similar_cats: if cat in expert.declared_keywords: pi_proposals_in_similar = [p for p in expert.proposal_history if p['category'] == cat and p['role'] == 'PI'] if pi_proposals_in_similar: return extract_texts(pi_proposals_in_similar), 2 # 步骤3: 声明在相异类别，且是相异类别的PI distinct_cats = category_similarity_map.get_distinct(target_category) for cat in distinct_cats: if cat in expert.declared_keywords: pi_proposals_in_distinct = [p for p in expert.proposal_history if p['category'] == cat and p['role'] == 'PI'] if pi_proposals_in_distinct: return extract_texts(pi_proposals_in_distinct), 3 # 阶段二：无声明，看行为 (步骤7-10) # 步骤7: 是目标类别的PI (无论声明) pi_proposals_in_target = [p for p in expert.proposal_history if p['category'] == target_category and p['role'] == 'PI'] if pi_proposals_in_target: return extract_texts(pi_proposals_in_target), 7 # 步骤8: 是相似类别的PI for cat in similar_cats: pi_proposals_in_similar = [p for p in expert.proposal_history if p['category'] == cat and p['role'] == 'PI'] if pi_proposals_in_similar: return extract_texts(pi_proposals_in_similar), 8 # 步骤9: 是相异类别的PI for cat in distinct_cats: pi_proposals_in_distinct = [p for p in expert.proposal_history if p['category'] == cat and p['role'] == 'PI'] if pi_proposals_in_distinct: return extract_texts(pi_proposals_in_distinct), 9 # 步骤10: 是目标类别的Co-I coi_proposals_in_target = [p for p in expert.proposal_history if p['category'] == target_category and p['role'] == 'CoI'] if coi_proposals_in_target: return extract_texts(coi_proposals_in_target), 10 # 阶段三：有声明但无直接提案行为 (步骤4-6, 11) # 步骤4-6: 逻辑同1-3，但角色为Co-I (代码略，结构相同) # ... # 步骤11: 有声明，但无任何相关提案记录(PI或Co-I) if target_category in expert.declared_keywords: # 返回一个特殊标记，指示使用默认相似度 return None, 11 # 如果所有步骤都不满足，该专家对此类别无有效专长向量 return None, 0 def extract_texts(proposal_list): """从提案列表中提取文本内容，用于后续LDA向量化。""" return [p['text'] for p in proposal_list]

关键实现细节：

category_similarity_map：这是一个核心数据结构，存储了类别间的相似与相异关系。通常实现为一个图或简单的字典映射。
效率考量：对于数千名专家和提案，每次匹配都实时运行这个流程并调用LDA模型计算向量是不现实的。通常的做法是离线预处理：为每位专家，针对每个可能的科学类别，预先运行一次construct_expertise_vector函数，计算出其在该类别下的专长向量（或标记为使用默认值），并存储结果。在线匹配时，只需进行快速的向量相似度计算。
小众主题向量分叉：在离线预处理时，需要额外检查。如果专家对某个小众关键词有声明且有相关提案，除了计算主类别的向量，还需要用这些特定提案单独训练一个“小众专长向量”，并建立“专家-小众关键词-专属向量”的索引。

5. 系统评估、常见问题与调优经验

任何算法系统上线后，都需要持续的评估与调优。ALMA的这套方法虽然规则清晰，但在实际运行中仍会遇到各种边界情况。

5.1 如何评估匹配质量？

评估一个专家匹配系统的好坏，不能只看算法指标，最终要落到“评审质量”上。但评审质量本身难以量化。通常采用以下几种混合评估方式：

人工抽样审计：项目官员定期抽样检查系统推荐的专家-提案匹配对。评估标准包括：
- 相关性：该专家的已知研究领域是否与提案主题强相关？
- 覆盖度：匹配的专家组合是否覆盖了提案所涉及的主要技术和方法？
- 避嫌：系统是否成功避免了合作者、同一机构等利益冲突？（这部分通常有独立的冲突检测模块，但需与匹配结果协同检查）。
专家反馈调查：在评审结束后，向专家发送简短问卷：“您认为被分配的提案与您的专长匹配程度如何？（1-5分）”。长期收集这些数据可以评估系统的感知质量。
回溯性分析：分析历史评审数据。例如，检查那些最终获得资助的高质量提案，当初分配给它们的评审专家是否在专长上高度一致？或者，对比系统自动匹配与项目官员手动调整的比例和原因。如果手动调整率很高，且调整原因有规律（如“系统忽略了专家的新方向”），则说明系统有改进空间。

5.2 典型问题与排查思路

即使遵循了上述流程，实践中还是会遇到一些“疑难杂症”。以下是一些常见问题及基于经验的排查思路：

问题一：某位明明很合适的资深专家，总是无法被系统推荐给某个领域的提案。

排查步骤：
1. 检查专长向量构建步骤：调用该专家针对该提案类别的construct_expertise_vector函数，看输出是第几步？使用的提案来源是哪个类别？可能系统通过步骤3（相异类别PI）为其构建了向量，但该向量与目标提案相似度很低。
2. 检查历史提案数据：该专家是否在目标类别有PI或Co-I提案？数据是否完整、标签（类别、角色）是否正确？常见数据错误包括类别标注错误、角色信息缺失。
3. 检查声明关键词：专家是否在系统中正确声明了该领域的关键词？有时专家可能漏填或使用了非标准的关键词。
4. 分析LDA主题向量：分别查看该专家的专长向量和目标提案的主题向量。是否因为预处理过度（如删除了关键术语）或主题数K设置不合理，导致两者的核心主题没有被模型正确捕捉？

问题二：系统频繁将涉及“偏振”研究的提案匹配给星系专家，但实际这些提案是关于恒星磁场。

排查步骤：
1. 确认是否为词语歧义问题：这正是前文提到的LDA陷阱。检查“偏振”主题在LDA模型中的主题词分布。它是否同时包含了星系和恒星相关的词汇？
2. 实施“类别条件化”加权：引入人工先验知识。在计算相似度时，对于属于“恒星形成”类别的提案，降低专家向量中与“星系”强相关的主题权重，或提升与“恒星磁场”相关的主题权重。这需要领域专家协助定义一份“主题-类别相关性矩阵”。
3. 引入关键词强化：在计算最终匹配分时，不仅考虑LDA向量相似度，还加入一个基于专家声明关键词与提案关键词重合度的分数。例如，如果提案明确包含“Zeeman effect”（塞曼效应，恒星磁场探测关键方法），而某专家声明了此关键词，即使其LDA向量相似度不高，也应获得加分。

问题三：对于年轻学者或新进入领域的专家，历史提案很少，系统无法为其构建有效专长向量。

解决方案：
1. 启用“步骤11”默认分：对于有声明但无提案记录的专家，给予一个基线分数，让他们有机会参与评审，但优先级低于有证据的专家。
2. 引入外部数据源：在数据许可的情况下，可以整合专家发表的论文数据。利用其发表论文的摘要和关键词，通过同样的LDA模型构建“论文专长向量”，作为历史提案数据的补充。这能有效解决“新手专家”的冷启动问题。
3. 手动标注与反馈学习：允许项目官员对少数匹配进行手动覆盖或评分。这些人工反馈可以作为宝贵的数据，用于微调匹配算法的权重（例如，提高声明关键词的权重，或调整类别相似性的定义）。

5.3 参数调优与迭代经验

这套系统的“旋钮”很多，需要小心调校：

LDA主题数K：这不是一劳永逸的。随着时间推移，新的科学热点出现（如“快速射电暴”、“引力波电磁对应体”），需要定期（如每年）用最新的提案数据重新训练LDA模型，并评估是否需要增加K值以容纳新主题。
类别相似性定义：科学领域也在演化。最初“相异”的类别，可能因为新技术的应用而产生交叉。需要领域专家委员会定期复审和更新类别相似性关系图。
决策步骤的权重：虽然步骤有优先级，但在最终排序时，来自不同步骤的专家是否可以放在一起比较？例如，步骤1（黄金标准）产生的专家，其匹配相似度得分是否应该乘以一个大于1的系数，以绝对优先于步骤2的专家？这需要通过历史匹配效果的数据分析来确定。
处理“超级明星”专家：有些顶尖专家涉猎极广，在多个类别都有大量PI提案。严格按照流程，他们在每个类别都可能通过步骤1获得很高的专长向量质量。但这可能导致他们被匹配到过多的提案，负担过重。系统需要引入负载均衡机制，例如设置每位专家在每个评审周期内最多评审的提案数量，并在匹配算法中将其视为一个约束条件。

踩坑实录：在我们自研类似系统的初期，曾过分依赖LDA的纯数学相似度，忽略了“角色权重”。最初我们将PI和Co-I的提案文本等同对待。结果发现，一些作为Co-I参与了很多合作项目的专家，被匹配到了其参与度不深的核心技术提案上，导致评审深度不够。后来我们严格区分PI和Co-I，并在流程中赋予PI提案更高的优先级（步骤1-3 vs 步骤4-6），匹配准确性显著提升。这个教训是：在学术评价体系中，“主导者”和“参与者”的贡献权重差异，必须在数据层面予以体现。

查看全文

http://www.jsqmd.com/news/879421/