帮助 关于我们

返回检索结果

基于CUDA的矩阵乘法和FFT性能测试
Ability Test for Matrix-Multiplication and FFT Based on CUDA

查看参考文献6篇

文摘 针对NVIDIA公司的CUDA技术用Geforce8800GT在Visual Studio2008环境下进行测试,从程序运行时间比较判断CUBLAS库、CUDA内核程序、CUDA驱动API、C循环程序与Intel MKL库以及FFTW库与CUFFT库运行响应的差异.测试结果表明,在大规模矩阵乘法和快速傅里叶变换的应用方面,相对于CPU,利用GPU运算性能可提高25倍以上.
其他语种文摘 This paper introduces the result of a test that evaluates the effectiveness of Compute Unified Device Architecture(CUDA) using NVDIA GeForce8800GT and the compiler Visual Studio 2008. It tests the speed of NVIDIA CUBLAS, CUDA kernel, common C program, Intel MKL BLAS, CUDA driver API program, FFTW and CUFFT Library in matrix-multiplication and Fast Fourier Transform(FFT). Test result of the large scale data shows that the computing ability of GPU is 25 times better than that of CPU.
来源 计算机工程 ,2009,35(10):7-10 【核心库】
关键词 矩阵乘法 ; 快速傅里叶变换 ; 并行计算 ; GPU通用计算
地址

中国科学院国家天文台, 北京, 100012

语种 中文
文献类型 研究性论文
ISSN 1000-3428
学科 自动化技术、计算机技术
基金 国家973计划 ;  国家自然科学基金 ;  中国科学院知识创新工程项目
文献收藏号 CSCD:3589974

参考文献 共 6 共1页

1.  Dongarra J. Sourcebook of Parallel Computing,2003 CSCD被引 9    
2.  杨兵. GPU在复杂场景的阴影绘制中的应用. 计算机工程,2006,32(2):220-222 CSCD被引 3    
3.  . CUDA Programming Guide 1.1,2007 CSCD被引 2    
4.  . CUDA--走向GPGPU新时代. 程序员,2008,10(3):36-39 CSCD被引 3    
5.  龚敏敏. GPU精粹2,2007 CSCD被引 2    
6.  . Intel Math Kernel Library for the Windows* Operating System Users' Guide,2007 CSCD被引 1    
引证文献 13

1 杨川 基于TBB的傅里叶变换多核并行化实现 计算机工程,2010,36(16):288-290
CSCD被引 2

2 焦良葆 GPU核函数细化研究 计算机工程,2010,36(18):10-12
CSCD被引 1

显示所有13篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

iAuthor 链接
邓元勇 0000-0003-1988-4574
版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号