11月15日消息, 亚马逊云科技宣布,由自研芯片Amazon Trainium支持的Amazon Elastic Compute Cloud(Amazon EC2)Trn1实例正式可用,助力客户缩短机器学习模型训练时间,快速迭代模型以提升准确性,提高自然语言处理、语音和图像识别、语义搜索、推荐引擎、欺诈检测和预测等工作负载的运行效率。
据介绍,Trn1 实例专为在云中进行高性能机器学习模型训练而构建,与最新的、基于GPU的P4d实例相比,针对深度学习模型训练的成本可降低50%。
Trn1实例能够快速在亚马逊云科技上训练机器学习模型,Trn1实例配有16颗专为部署深度学习模型而构建的Amazon Trainium加速器,提供高达800 Gbps的网络带宽的实例,延迟更低,比最新的基于GPU的EC2实例快2倍。
Trn1实例基于Amazon Nitro系统构建,该系统是亚马逊云科技自研硬件和软件创新的集大成者,可简化隔离式多租户、专用网络和快速本地存储的交付。Amazon Nitro系统将CPU虚拟化、存储和网络功能卸载至专用硬件和软件,交付近乎裸机的性能。
目前,Trn1实例现已在美国东部(弗吉尼亚北部)和美国西部(俄勒冈)区域可用,其他区域也将很快推出。使用Trn1实例无需最低消费承诺或预付费用,客户只需为使用的计算量付费。
据悉,PyTorch、Helixon和Money Forward等客户与合作伙伴已在使用Trn1实例。