首页 > 计算机科学与技术> 并行程序设计
题目内容 (请给出正确答案)
[主观题]

对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。

A.正确的

B.错误的

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循…”相关的问题
第1题
编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行()路循环展开。

A.2

B.4

C.8

D.16

点击查看答案
第2题
对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。

A.声明语句

B.条件分支语句

C.循环语句

D.输入输出语句

点击查看答案
第3题
采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在____。

A.CPU内存

B.GPU显存

C.GPU共享内存

D.GPU寄存器

点击查看答案
第4题
n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是____。

A、负载不均

B、通信开销大

C、CPU空闲等待严重

D、sum累加产生竞争条件,导致结果错误

点击查看答案
第5题
对奇偶转置排序进行OpenMP并行化,第一种策略是直接对内层循环使用ompparallelfor指令,第二种策略是对外层循环使用ompparallel指令,对内层循环使用ompfor指令,后者相对于前者的优点是()。

A.保持了数据依赖

B.消除了大量线程创建、销毁开销

C.有利于负载均衡

D.减少了线程间交互

点击查看答案
第6题
两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。

A、先将两个矩阵读入cache再进行乘法

B、先转置第一个矩阵再进行乘法

C、先转置第二个矩阵再进行乘法

D、以上皆错

点击查看答案
第7题
两个n*n的矩阵相乘,将所有n^2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分的数据并行。

A.输入数据

B.中间结果

C.输出数据

D.临时数据

点击查看答案
第8题
单精度浮点数矩阵乘法进行AVX并行,期望的加速比为()。

A.等于8

B.小于8

C.4到8之间

D.等于4

点击查看答案
第9题
MapReduce可以解决哪些计算问题()?

A.矩阵乘法

B.关系代数运算

C.聚合运算

D.关系投影运算

点击查看答案
第10题
组织学习类型的三重循环学习(名词解释)

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改