百川智能发布Baichuan2开源大模型,号称“文理兼备全面领先LLaM
,百川智能今日召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本,并且均为免费可商用。
据百川智能官方介绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。
其中 Baichuan2-13B-Base 相比上一代 13B 模型,数学能力提升 49%,代码能力提升 46%,安全能力提升 37%,逻辑推理能力提升 25%,语义理解能力提升 15%。
在 MMLU、CMMLU、GSM8K 等基准测试中,百川智能的两个模型都比 LLaMA 2 的分数要高一些,且在“中文通用”部分优势较大。
Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
- 经济观察中国将加速5G融合应用发展
- 11月中国进出口额同比增1.2%月度增速加快
- 济宁市2023年下半年绿色低碳高质量发展现场观摩会——中国中
- 兴化市戴南镇志愿者为百名老人送“爱心饺子”
- 中国A股周二下跌沪指失守3000点
- 多维度数据凸显经济澎湃活力“历史新高”“稳中向好”成关键词
- 阿里网络大腾挪:接连“退出”美年健康、分众等7家公司,非主业
- 德定安航空在上海设立新工厂法国驻沪总领事:相信法国企业能为中
- 莱克洗地吸尘器,宝爸宝妈的全屋清洁利器
- 回暖、活跃、回升、增强……企业信心足中国经济“加速跑”
- 国内足金首饰金价突破630元/克
- 济宁市2023年下半年绿色低碳高质量发展现场观摩会——西城新
- 第六届进博会光明食品集团“THESMARTCHAIN全球食品
- 万亿信创赛道前景广阔 睿银科技发力竞逐领跑市场
- 市场规模持续增长,敷尔佳联合青眼发布《2024年面膜趋势洞察
- 灌南经济技术开发区:舞动项目建设龙头,锻造产业发展“黄金链”
- 中国A股12月开局平稳央企旗下公司增持指数基金
- “大地情深”全国优秀群众文艺作品汇演举办