nanochat
互联网
2025-10-16 10:06:15
nanochat是AI领域专家Andrej Karpathy发布的开源项目,以极低成本和高效流程训练小型语言模型,实现类似ChatGPT的对话功能。仅需约100美元(使用8张H100 GPU训练4小时),即可训练出能进行基础对话、创作故事/诗歌、回答简单问题的小型模型。若增加预算至1000美元(训练约41.6小时),模型性能可显著提升,能解决简单数学/代码问题并参与多项选择题测试。项目包含从数据准备、预训练、中期训练、监督微调(SFT)、强化学习(RL)到推理部署的完整流程,约8000行代码实现端到端训练,代码简洁易读,适合学习和实践。

![金佳悦作为媒体人能够身体力行地参与到文化传播中也倍感荣幸[求关注][羞嗒嗒]](https://imgs.knowsafe.com:8087/img/aideep/2022/2/22/6383fd8d9f35c7fbfd07a1de8bc178f5.jpg?w=250)





