GPT-OSS-20B简介 - Passion Blog

GPT-OSS-20B 是 OpenAI 发布的一款开源大语言模型（OSS = Open-Source Series），参数量约 200 亿（20B），采用稀疏专家模型（MoE, Mixture of Experts）架构。

它的主要特点：

性能对比 GPT-3.5

上下文长度 & 实时响应 gpt-oss-20b 支持长达 131K token 的上下文输入，相比 GPT-3.5 Turbo 的 16K token 有明显提升。此外，在推理速度和成本方面，也更具优势。
信息更新 GPT-3.5 的训练数据截止至 2021 年 9 月，而 gpt-oss-20b 的最新训练数据更新至 2024 年 4 月，知识基础更加新颖。

在数学推导、代码生成、工具调用等基准测试中，整体接近 GPT-4o mini 水平

可以运行在16G显存的设备上。

如果要达到可以支持的131Ktoken上下文，需要更多显存。