微软打造13亿参数小型LLMAI模型,号称实际效果胜于千亿参数GPT-3
,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。
IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。
微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5还要好。
微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。
目前关于 phi-1 的论文已经在 arXiv 中发布,可以在这里找到论文的相关内容。
广告声明:本文含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考。IT之家所有文章均包含本声明。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
- 经济观察中国将加速5G融合应用发展
- 11月中国进出口额同比增1.2%月度增速加快
- 济宁市2023年下半年绿色低碳高质量发展现场观摩会——中国中
- 兴化市戴南镇志愿者为百名老人送“爱心饺子”
- 中国A股周二下跌沪指失守3000点
- 多维度数据凸显经济澎湃活力“历史新高”“稳中向好”成关键词
- 阿里网络大腾挪:接连“退出”美年健康、分众等7家公司,非主业
- 德定安航空在上海设立新工厂法国驻沪总领事:相信法国企业能为中
- 莱克洗地吸尘器,宝爸宝妈的全屋清洁利器
- 回暖、活跃、回升、增强……企业信心足中国经济“加速跑”
- 国内足金首饰金价突破630元/克
- 济宁市2023年下半年绿色低碳高质量发展现场观摩会——西城新
- 第六届进博会光明食品集团“THESMARTCHAIN全球食品
- 万亿信创赛道前景广阔 睿银科技发力竞逐领跑市场
- 市场规模持续增长,敷尔佳联合青眼发布《2024年面膜趋势洞察
- 灌南经济技术开发区:舞动项目建设龙头,锻造产业发展“黄金链”
- 中国A股12月开局平稳央企旗下公司增持指数基金
- “大地情深”全国优秀群众文艺作品汇演举办