阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
来源:快科技 发表于2024-07-19 19:42:30 编辑:时寒峰

  原标题:阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

  7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%

  针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。

  随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。

  阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。

  通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。

  ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。

  为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。

  比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。

  在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。

  此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。

  在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。

  零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。

  小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。

投稿邮箱:lukejiwang@163.com
相关推荐
360集团发布纳米AI智能体,开启高效搜索与分析新时代
360集团发布纳米AI智能体,开启高效搜索与分析新时代

原标题:360集团发布纳米AI智能体,开启高效搜索与分析新时代 360集团近期震撼

AI2025-06-16 20:38:15

Meta推出AI视频编辑新技能,一键换装换场景轻松玩转视
Meta推出AI视频编辑新技能,一键换装换场景轻松玩转视

原标题:Meta推出AI视频编辑新技能,一键换装换场景轻松玩转视频创作 meta公司

AI2025-06-15 20:35:34

黄仁勋论AI与就业
黄仁勋论AI与就业

原标题:黄仁勋论AI与就业 近期,关于人工智能(AI)发展对就业市场的影响引

AI2025-06-14 17:53:04

夸克高考志愿大模型上线,智能生成专属填报报告助力
夸克高考志愿大模型上线,智能生成专属填报报告助力

原标题:夸克高考志愿大模型上线,智能生成专属填报报告助力考生 阿里巴巴

AI2025-06-12 18:17:45

ChatGPT高级语音模式大升级,情感丰富更自然,多语言翻
ChatGPT高级语音模式大升级,情感丰富更自然,多语言翻

原标题:ChatGPT高级语音模式大升级,情感丰富更自然,多语言翻译功能来袭!

AI2025-06-08 11:09:31

Meta携手迪士尼、A24,新智能眼镜Loma能否靠独家内容吸
Meta携手迪士尼、A24,新智能眼镜Loma能否靠独家内容吸

原标题:Meta携手迪士尼、A24,新智能眼镜Loma能否靠独家内容吸睛? 据最新报道

AI2025-06-05 20:10:55

OpenAI付费企业用户数猛增,预计年收入将达127亿美元
OpenAI付费企业用户数猛增,预计年收入将达127亿美元

原标题:OpenAI付费企业用户数猛增,预计年收入将达127亿美元 在周三的最新动

AI2025-06-05 19:50:37

首批!蚂蚁“AI健康管家”通过大模型可信评估 4000万用
首批!蚂蚁“AI健康管家”通过大模型可信评估 4000万用

原标题:首批!蚂蚁AI健康管家通过大模型可信评估 4000万用户已受益 6月3日消息

AI2025-06-03 20:48:17

仿生突破!可自我修复人造肌肉赋能软体机器人与可穿
仿生突破!可自我修复人造肌肉赋能软体机器人与可穿

原标题:仿生突破!可自我修复人造肌肉赋能软体机器人与可穿戴设备 在自然

AI2025-06-02 11:49:42

AI黑客大战,智能体竟能超越人类?
AI黑客大战,智能体竟能超越人类?

原标题:AI黑客大战,智能体竟能超越人类? 近期,网络安全领域迎来了一场前

AI2025-06-02 11:40:08