我想做graph正交化来修复大矩阵,这些矩阵在纯Tensorflow中开始稍微偏离正交性(在较大的计算范围内在图上这样做,而不破坏它)。(虽然有更高的精度):44.71760.034667numpy version with tensorflow and variable re-assign to the result of numpycode
我在用Tensorflow。我有一个大数组(5000x5000 float32元素)。如何测量将这个数组从RAM移动到GPU内存实际上需要多长时间?我知道我可以创建一些非常简单的计算图,运行它,并测量它花了多长时间。然而,这有两个问题。首先,我担心测量的时间将被计算所需的时间所支配,而不是通过从RAM do GPU移动数据。第二,如果计算不涉及我提到的大数组,Tensorflow将简化计算图,使大数组不会在其中,也不会从RAM移动到G