来源:中国网
浏览量:5640
时间:2023-09-07 09:28
阅读量:85989月6日,百川智能召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。
据介绍,Baichuan2-7B-Base和Baichuan2-13B-Base均基于2.6万亿高质量多语言数据进行训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署门槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。
其中Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。
Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者通过邮件申请获得官方商用许可后,即可以免费商用。
大模型训练包含海量高质量数据获取、大规模训练集群稳定训练、模型算法调优等多个环节。每个环节都需要大量人才、算力等资源的投入,从零到一完整训练一个模型的高昂成本,阻碍了学术界对大模型训练的深入研究。
百川智能本次开源了模型训练从220B到2640B全过程的Check Ponit,并宣布将发布 Baichuan 2技术报告,详细介绍Baichuan 2的训练细节,帮助大模型学术机构、开发者和企业用户更深入的了解其训练过程,更好地推动大模型学术研究和社区的技术发展。
百川智能由前搜狗CEO王小川创办于今年4月,已相继发布Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型,以及一款搜索增强大模型Baichuan-53B。8月31日,百川智能宣布百川大模型通过《生成式人工智能服务管理暂行办法》备案,面向公众开放。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
,根据科技媒体engadget报道,语言学习平台多邻国正积极拓宽相关课程,在涉足数学领域之后近日再准备推出音乐相关课程。 IT之家援引该媒体报道,多邻国本次推出的音乐课程将通过...
2023-09-07 09:18近两年水泥需求下降,相关上市公司业绩不振。据海螺水泥日前披露的半年报显示,今年1月份至6月份公司实现营业收入654.36亿元,同比增长16.28%;实现净利润64.68亿元,同比...
2023-09-07 08:42,根据Asymco机构分析师贺拉斯?德迪欧发布的最新报告,苹果iPhone用户在应用上的平均支出,是安卓用户的7.4倍,远高于此前提出的4倍观点。 德迪欧表示在10年前,就观察...
2023-09-07 08:399月5日,第十二届“中华慈善奖”评选表彰大会在北京举行。腾讯公司获得本届“中华慈善奖”——捐赠企业奖;由工业和信息化部推荐,农业农村部主导、腾讯公司政企合作、共同组织实施的“耕耘...
2023-09-07 08:372023年9月5日,由《中国经营报》主办的“责任引领凝聚共识”2023中国企业社会责任创新发展论坛圆满落幕。本届论坛携手权威专家学者、企业家、专业机构,围绕“双碳战略”、“可持续...
2023-09-06 16:47