而海思和华芯设计的这套架构,通过采用“数据驱动并行计算”的方式,在处理视频、图像类的海量多媒体数据上相对比传统方式更加擅长。
可以说是青出于蓝而胜于蓝。
不过目前这套架构在构造的时候涉及到了很多的系统性的数学难题,比如激活函数、二维数据运算、解压缩等模块等等。
如果是在常规的CPU或者GPU芯片中,这些问题并不是难题。但是NPU神经性网络架构和前两者的性质不同,其数学的兼容性也完全不同。
这就导致设计出来的芯片在性能上甚至还不如10纳米甚至是14纳米的芯片。
目前来说,卡主海思和华芯的难点就在这里。
神经网络和机器学习处理在现在还是处于需求爆发的初期,这方面的数学家相对比传统的CPU/GPU架构数学家要少很多,国外研究这方面的人才都没有多少,更别提国内了。
所以迫不得已之下,发改那边才找上了他,寄希望于他能帮忙解决一下这方面的数学难题。
了解清楚整体的情况后,徐川才点开了数学文件,翻阅了起来。
《大规模稀疏矩阵特征值计算》
《非线性常微分方程组的初值问题的整体解》
内容未完,下一页继续阅读