8月21日,DeepSeek V3.1正式发布,宣告迈向Agent时代。在新模型之外,外界被另一件事吸引,DeepSeek官方发文配资炒股平台网,表示DeepSeek-V3.1使用了 UE8M0 FP8 Scale 的参数精度。并留言提到:UE8M0FP8是针对即将发布的下一代国产芯片设计。
这句看似不经意的评论一石激起千层浪,让外界把DeepSeek和国产芯片捧上神坛。
网友普遍认为这一格式将改写国产芯片的历史,成为中国芯片“弯道超车”的开始。其中,国产芯片公司寒武纪带头起飞,近一个月累计有10个交易日股价刷新历史纪录,总市值一度超过6000亿。
一时之间,相关股票一阵喧腾。
资料显示,UE8M0-FP8采用8位指数表示(无符号位和尾数),专为缩放因子设计,动态范围较传统FP8提升2倍,硬件实现难度降低40%,可以主要应用于大规模语言模型的训练和推理,特别是在MoE(混合专家)架构中。
该图为为MXFP技术的解释:MXFP(Microscaling Floating Point)是一种用于高效人工智能计算的数值格式。MXFP通过让一组数值共享一个“缩放尺子”,巧妙地实现了既保证计算精度又大幅提升计算效率的目标。
在行业专家看来,目前缺乏相关技术细节的披露,根据已有信息的判断,DeepSeek能把UE8M0 FP8 microscaling训练跑通,能够解决训练稳定性,是挺有意义的进步。这意味着国产芯片已经支持UE8M0 FP8 microscaling,也是很有意义的进展。
此外,该行业专家也澄清道,UE8M0是一种数据表达格式,它是UE8M0 FP8 microscaling这种低精度模型训练方案中的一个元素,而不是方案的全部。现在媒体说的好像UE8M0是数据表达的全部,而且好像只有国产芯片支持似的,这是不对的。
对于「这个格式突破“卡脖子”的论调」,行业专家个人认为卡脖子问题肯定能够解决,但不是单靠一个格式就取得突破性进展。这是向前的一步。但这个进展是否像大家期望的那样大到改变格局的程度,他个人认为不是。
任何一项新技术新方案,都需要严肃的效果验证。在此之前,我们需要更多理性的声音
网眼查配资提示:文章来自网络,不代表本站观点。