单项选择题
当cache大小足以容纳矩阵一行N个元素,但远小于矩阵全部N*N个元素大小时,矩阵乘法平凡算法计拿C=A*B过程中,B中每个元素从主存读取到cache()次。
A.N*N
B.1
C.N
D.N/2
点击查看答案&解析
相关考题
-
单项选择题
一条shuffle指令不能实现()
A.以下皆不能实现
B.一个寄存器中元责任意提取重排到结果寄存器
C.三个寄存器中元素任意提取重排到结果寄存器
D.两个寄存器中元表任意提取重排到结果寄存器 -
单项选择题
编写OpenMP程序时,我们不推程定义线性函数,在其中手工编写程序进行任务分配的编程方式的原因是()
A.不容易实现负载均衡
B.容易产生更多bug
C.太繁琐,体现不出OpenMP的编程范式和优点
D.不容易降低通信开销 -
单项选择题
对单精度浮点数矩阵乘法程序进行AVX并行化,预期加速比为()
A.小于4
B.等于8
C.等于4
D.小于8
