告别 AI “一家之言”,打造你的专属 LLM 决策委员会,@karpathy 开源了一个多模型评审会的demo,体验链接见最后👇
这个系统的核心是让 DeepSeek、Qwen、Grok 等模型同台辩论,引入了学术界的“同行评审”机制,用魔法打败魔法
核心亮点:
1. 第一阶段是全员提案:多模型并行输出,打破单一视角局限
2. 第二阶段是匿名盲评:模型间互相“找茬”并打分,杜绝身份偏见
3. 第三阶段是优中选优:由主席模型博采众长,过滤幻觉,输出唯一的最佳答案
简单来说:三个臭皮匠,顶个诸葛亮。让 AI 互相监督,给出最可信的结果
Github:https://t.co/mMh1HpixGy
在线体验:https://t.co/QyGOG0pijB
点击图片查看原图