GPU容器共享技术cGPU
GPU容器共享技术cGPU是阿里云基于内核虚拟GPU隔离的容器共享技术。即多个容器共享一张GPU卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。
AI通信加速库DeepNCCL的架构、性能以及优化原理
DeepNCCL是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍DeepNCCL的架构、优化原理和性能说明。
GPU架构及异构计算环境安装配置
最新CUDA环境配置(Win10 + CUDA 11.6 + VS2019)本篇博客根据NVIDIA 官方文档所述, 并根据自己实践得出. 供各位需要的朋友参考.1.前言本篇文章的软件环境为:Windows 10CUDA 11.6VS2019CUDA是目前做人工智能, 深度学习等方向的必备工具库. 由CUDA衍生出的加速工具很多, 如: cuDNN, TensorRT, cuBLAS等HPC加速....

GPU架构及异构计算介绍GPU硬件平台
第四章 硬件实现更多精彩内容,请扫描下方二维码或者访问https://developer.nvidia.com/zh-cn/developer-program 来加入NVIDIA开发者计划NVIDIA GPU 架构围绕可扩展的多线程流式多处理器 (SM: Streaming Multiprocessors) 阵列构建。当主机 CPU 上的 CUDA 程序调用内核网格时,网格的块被枚举并分发到具有....

GPU架构及异构计算介绍GPU架构以及异构计算的基本原理
一篇文章理解CUDA架构、编程与进阶使用一、CUDA架构二、CUDA编程基础1.矩阵加法2.矩阵乘法三、CUDA进阶 I——利用共享内存加速访存1.CUDA内存读写速度比较2.申请共享内存四、CUDA进阶 II——利用stream加速大批量文件IO读写耗时1. 认识CUDA stream2. CUDA stream API介绍五、CUDA进阶 III——调用cuBLAS库API进行矩阵计算本文章....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
金融级分布式架构
SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。
+关注