Encoder vs Decoder LLM

1 天

ACL 2026 | 不训练LLM也能支持未见语言问答？中科院计算所团队让多 ...

一个直观的解释是训练数据不足，但更本质的问题在于表示空间不匹配。已有研究表明，LLM 已经在统一的语义空间中编码了丰富的跨语言知识，并且在处理多语言文本时会专门「经过」这个统一语义空间（如英语表示空间）。这意味着， LLM ...

谷歌T5Gemma重燃架构之战，「套壳」反杀Gemma本尊，9B推理快得离谱

Google双线出击！T5Gemma重燃encoder-decoder架构战火，性能暴涨12分；MedGemma坚守decoder-only路线，强攻医疗多模态，击穿闭源壁垒。Gemma体系完成「架构+落地」双重进化，打响Google开源反击战。 2023年以来，大模型的战场由decoder-only架构一统江湖。从GPT家族到LLaMA、Gemma ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

ACL 2026 | 不训练LLM也能支持未见语言问答？中科院计算所团队让多 ...

谷歌T5Gemma重燃架构之战，「套壳」反杀Gemma本尊，9B推理快得离谱

今日热点