OpenAITriton已开始合并AMDROCm代码,9月20日举行开发
,Triton 是一种类似于 Python 的开源编程语言,它可以使没有 CUDA 经验的研究人员顺利编写高效的 GPU 代码,而且号称小白也可以写出与专业人士相媲美的代码,就是让用户用相对较少的努力实现最高的硬件性能,但 Triton 初期只支持英伟达 GPU。
OpenAI 声称:Triton 只要 25 行代码,就能在 FP16 矩阵乘法上达到与 cuBLAS 相当的性能。
从 Github 我们可以看到,OpenAI 已经开始在最新的Triton 版本中合并 AMD ROCm 相关分支代码,也正因此暴露了很多东西。也就是说,最新 Triton 后端已适配 AMD 平台,可谓意义重大。
通过官方的说法来看,他们已经通过了“test_core.py”上的大多数单元测试环节,但由于各种原因跳过了一些测试。
IT之家注意到,OpenAI 还宣布将于 9 月 20 日上午 10 点至下午 4 点在加利福尼亚州山景城的微软硅谷园区举行 Triton 开发者大会,而日程安排中就包括“将 Triton 引入 AMD GPU”和“Triton 的英特尔 XPU”两大环节,预计 Triton 将很快摆脱英伟达 CUDA 垄断的历史。
值得一提的是,Triton 是开源的,比起闭源的 CUDA,其他硬件加速器能直接集成到 Triton 中,大大减少了为新硬件建立 AI 编译器栈的时间。
在此前发布的 PyTorch 2.0 版本中,TorchInductor 便引入了 OpenAI Triton 支持,可为多个加速器和后端自动生成快速代码,同时实现用 Python 取代 CUDA 编程来写底层硬件的代码。也就是说,Triton 已经是PyTorch2.0 后端编译器关键构成部分。
实际上,此前 AMD ROCm 则主要是采用 Hipify 工具实现CUDA 兼容,而随着 AMD 开始为 RDNA 3 消费级显卡提供 ROCm 支持,预计后续将会有更多平台选择适配 AMD 硬件。
相关阅读:
《AMD 将为 RDNA 3 消费级显卡提供 ROCm 支持,从 Radeon RX 7900 XTX 和 Pro W7900 开始》
《AMD 正式推出 HIP SDK:拓展 ROCm 生态,支持运行英伟达 CUDA 应用》
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
- 经济观察中国将加速5G融合应用发展
- 11月中国进出口额同比增1.2%月度增速加快
- 济宁市2023年下半年绿色低碳高质量发展现场观摩会——中国中
- 兴化市戴南镇志愿者为百名老人送“爱心饺子”
- 中国A股周二下跌沪指失守3000点
- 多维度数据凸显经济澎湃活力“历史新高”“稳中向好”成关键词
- 阿里网络大腾挪:接连“退出”美年健康、分众等7家公司,非主业
- 德定安航空在上海设立新工厂法国驻沪总领事:相信法国企业能为中
- 莱克洗地吸尘器,宝爸宝妈的全屋清洁利器
- 回暖、活跃、回升、增强……企业信心足中国经济“加速跑”
- 国内足金首饰金价突破630元/克
- 济宁市2023年下半年绿色低碳高质量发展现场观摩会——西城新
- 第六届进博会光明食品集团“THESMARTCHAIN全球食品
- 万亿信创赛道前景广阔 睿银科技发力竞逐领跑市场
- 市场规模持续增长,敷尔佳联合青眼发布《2024年面膜趋势洞察
- 灌南经济技术开发区:舞动项目建设龙头,锻造产业发展“黄金链”
- 中国A股12月开局平稳央企旗下公司增持指数基金
- “大地情深”全国优秀群众文艺作品汇演举办