GitHub开源社区最新公布的A科技之门MD ROCm开发库表明,AMD GPU可能会发展未来已加入对BFloat16(BF16)浮点指令的全面支持 ,相比而言现现不过 的FP16浮点可带去更更大飞跃。
目前为止,Intel Cascade Lake至强科技之门、Ice Lake酷睿相关处理器现现不过 全面支持 BF16,ARM下一代ARMv8 C科技之门科技之门PU架构就会已加入。BF16而且不仍属 IEEE统一标准规范,它也也天然优势正得不到越发广泛的验证和得不到。
BF16也并且能以视为精简版的FP32单精度浮点指令,用到时8个科技之门更有效位、8个阶位,内存和带宽占用减半,执行效率大大质的提升 ,同样又在性能技术方面远胜FP16,也并且能以大大质的提升 AI人工智能、ML机器去学习、DL深度去学习等应用到时性能、效率,不用再受限于FP16的性能、FP32的效率。
可以根据模拟,BF16相比而言于FP16带去的性能质的提升 在不尽不尽相同运算类型中,少则可达1.6倍,多则也并且能以少于4倍。
现代3D游戏类型 渲染不太所以从BF16中获益,而且随着时间GPU越发多地参于AI、ML、DL运算,BF16的已加入必可能会给AMD显卡带去强更大加成,发展未来值得期待吧。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。