近日,李开复「零一万物」公司的Yi-34B模型受到质疑,有网友称该模型基本上采用了LLaMA的架构,只是重命名了两个张量。引起热议后,零一万物官方很快在 Hugging Face 与媒体平台中作出回应,表示团队确实沿用了 LLaMA 与 GPT 基础架构,并会将代码更新,重新命名,以符合大模型开源社区的要求。
「零一万物」表示:GPT是一个业内公认的成熟架构,LLaMA在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,同时基于零一万物团队对模型和训练的理解做了大量工作,这是我们首次发布获得优秀结果的地基之一。
扫一扫
在手机上阅读