来源:IT之家
浏览量:5592
时间:2023-06-28 09:21
阅读量:17505,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。
IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。
微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5还要好。
微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。
目前关于 phi-1 的论文已经在 arXiv 中发布,可以在这里找到论文的相关内容。
广告声明:本文含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考。IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
:6月27日,保利发展控股集团股份有限公司发布公告称,近日收到中国证券监督管理委员会出具的《关于同意保利发展控股集团股份有限公司向特定对象发行股票注册的批复》。 批复文件主要内...
2023-06-28 08:47发布年度业绩,股东应占亏损2320.6万港元同比盈转亏) 智通财经APP讯,乙德投资控股发布截至2023年3月31日止年度业绩,该集团取得收益1.89亿港元,同比减少43.85...
2023-06-28 08:44在6月27日召开的北京地区农业保险信息化工作专题发布会上,据北京保险行业协会秘书长邵艳介绍,自2007年北京市启动建立了政策性农业保险制度以来,经过多年运行,取得了较为显著的成效...
2023-06-28 08:32人民币对美元汇率在在岸和离岸市场继续双双走低。 6月26日,离岸人民币对美元汇率接连跌破7.22和7.23关口,继续刷新2022年11月末以来的新低。 人民币对美元汇率在在岸...
2023-06-27 14:182023年6月19日,大家保险集团与北京大学经济学院战略合作协议签约仪式在北京大学举行,根据协议,双方将共同设计专业的课程体系,共同探索更加专业的专属培养模式,合力打造一支专业养...
2023-06-27 14:04