OrionX AI算力资源池化软件
产品名称:
一池多芯:OrionX支持将NVIDIA、寒武纪、中科海光、华为昇腾等多个厂家的AI芯片放在同一个资源池统一管理、统一调度;
一池多云:OrionX支持在公有云、私有云、虚拟机、裸金属等多种架构上混合部署,支持容器、虚机、物理机等多种形态混合运行;
按需调用:AI应用可以根据负载需求调用任意大小的OrionX vGPU,甚至可以聚合多个物理节点的算力卡;在容器或虚机创建之后,仍然可以调整OrionX vGPU的数量和大小;
动态伸缩:在AI应用停止的时候,立刻释放AI算力资源回到整个资源池,以便于资源高效流转,充分利用。
细粒度切分:GPU物理卡的切分,按算力与显存两个维度,实现1%算力颗粒度,1MB显存颗粒度,以提供与需求相匹配的小于一块物理算力卡的算力;
远程调用:在一台CPU服务器上部署AI任务,可以通过网络远程调用AI算力资源进行加速,本地无需算力卡;
资源聚合:把资源池里的多块算力卡聚合给单个运算任务,让单个任务可以使用更多的AI算力资源而无需关注单机的算力卡数量;
算力/显存超分:可以将CPU的内存用于扩充算力卡的物理显存;
算力热迁移:将算力平台上正在运行的计算任务和数据,从一个物理算力设备无缝迁移到另一个物理算力设备,实现业务连续性和高可用;
算力规格化:允许用户自定义算力卡规格,可设置自定义算力卡的名称、显存以及算力,便于管理与分配。
一池多芯:OrionX支持将NVIDIA、寒武纪、中科海光、华为昇腾等多个厂家的AI芯片放在同一个资源池统一管理、统一调度;
一池多云:OrionX支持在公有云、私有云、虚拟机、裸金属等多种架构上混合部署,支持容器、虚机、物理机等多种形态混合运行;
按需调用:AI应用可以根据负载需求调用任意大小的OrionX vGPU,甚至可以聚合多个物理节点的算力卡;在容器或虚机创建之后,仍然可以调整OrionX vGPU的数量和大小;
动态伸缩:在AI应用停止的时候,立刻释放AI算力资源回到整个资源池,以便于资源高效流转,充分利用。
细粒度切分:GPU物理卡的切分,按算力与显存两个维度,实现1%算力颗粒度,1MB显存颗粒度,以提供与需求相匹配的小于一块物理算力卡的算力;
远程调用:在一台CPU服务器上部署AI任务,可以通过网络远程调用AI算力资源进行加速,本地无需算力卡;
资源聚合:把资源池里的多块算力卡聚合给单个运算任务,让单个任务可以使用更多的AI算力资源而无需关注单机的算力卡数量;
算力/显存超分:可以将CPU的内存用于扩充算力卡的物理显存;
算力热迁移:将算力平台上正在运行的计算任务和数据,从一个物理算力设备无缝迁移到另一个物理算力设备,实现业务连续性和高可用;
算力规格化:允许用户自定义算力卡规格,可设置自定义算力卡的名称、显存以及算力,便于管理与分配。