AWS Deep Learning Containers (AWS DL Containers) 是预先安装了深度学习框架的 Docker 镜像,可以让您跳过从头构建和优化环境的复杂流程,让您轻松快速部署自定义机器学习 (ML) 环境。AWS DL Containers 支持 TensorFlow、PyTorch 和 Apache MXNet。您可以在 Amazon SageMaker、Amazon Elastic Kubernetes Service (Amazon EKS)、Amazon EC2 上自主管理的 Kubernetes 以及 Amazon Elastic Container Service (Amazon ECS) 上部署 AWS DL Containers。这些容器可以通过 Amazon Elastic Container Registry (Amazon ECR) 和 AWS Marketplace 免费获得 – 您只需为您使用的资源付费。开始使用本教程。
Docker 容器是部署在多个环境中一致运行的自定义机器学习环境的热门方式。但是为深度学习构建和测试容器镜像比较困难且容易出错,并且可能因为软件依赖和版本兼容问题而花费数天时间。这些镜像还需要进行优化以便跨整个实例集群高效分发和扩展机器学习工作负载,这种工作需要有专业技能才能完成。在发布框架更新后,您必须重复该流程。所有这一切都是无差别的沉重负担,它们占用宝贵的开发人员时间并拖慢您的创新步伐。
AWS DL 容器可以提供预安装最新版热门深度学习框架并经过测试的 Docker 镜像以及它们需要的库。AWS DL 容器经过专门优化,可以在 AWS 上的实例集群中高效分发机器学习工作负载,以便您可以立即获得较高的性能和扩展能力。
优势
立刻开始构建
使用预打包的 Docker 镜像在几分钟内部署深度学习环境。该镜像包含要求的深度学习框架库(目前是 TensorFlow、PyTorch 和 Apache MXNet)和工具,并且经过充分测试。您可以在这些镜像之上轻松添加自己的库和工具,以便获得针对监控、合规性和数据处理的更高层次的控制能力。 有关更多信息,请参阅 AWS Deep Learning 容器镜像。
自动获得最高性能
AWS DL Containers 包括针对最新版热门框架(例如 TensorFlow、PyTorch 和 Apache MXNet)和库的 AWS 优化和改进,可以实现在云中训练和推理的最高性能。例如,AWS TensorFlow 优化大幅改进了 GPU 扩展,能够让模型的训练速度提升至原来的两倍。
快速将机器学习添加到 Kubernetes 应用程序
AWS DL 容器专为配合 Amazon EC2 上的 Kubernetes 而构建。如果您使用 Amazon EC2 将应用程序部署到了 Kubernetes,您可以快速使用 Amazon DL 容器将机器学习以微服务的形式添加到这些应用程序。
轻松管理机器学习工作流
AWS DL Containers 与 Amazon SageMaker、Amazon EKS 和 Amazon ECS 紧密集成,让您能够有选择性地灵活构建自定义机器学习工作流,以进行训练、验证和部署。通过这种集成,Amazon EKS 和 Amazon ECS 可以处理在虚拟机集群上部署和扩展 AWS DL Containers 所需的所有容器编排。
支持热门框架
AWS DL Containers 支持 TensorFlow、PyTorch 和 Apache MXNet。



客户

“Deep Learning 容器将我们的速度提升了 20%。在之前,我们需要将数据专家开发的模型部署到生产,因此拖慢了上市速度。数据专家通常使用 AWS Deep Learning AMI,而我们的部署团队在生产环境中使用 Docker 容器。确保研究与生产环境之间相等是耗时且容易出错的工作。现在使用 AWS Deep Learning 容器,我们可以从研究、训练到生产,在整个管道中使用相同的经过优化的稳定 TensorFlow 环境。”

“在 Accenture,我们的数据专家跨电信和资源产业等众多不同领域,利用计算机视觉和自然语言处理构建深度学习应用程序,为我们的客户开展创新。我们的团队可以快速行动,我们可以使用 Docker 容器快速训练和部署模型。以前遇到兼容性或依赖性问题的时候需要耗费数天宝贵时间,我们需要使用深度学习框架和库重复创建和维护容器镜像,因而拖慢了我们的速度。现在有了 Deep Learning 容器,我们可以使用开箱即用的容器镜像,在 AWS 上获得优化的性能。”

“在 Patchd,我们使用深度学习检测早期败血症。我们将 Docker 容器视为将我们的现有深度学习管道扩充 10 倍的方法,从而能够让我们快速、灵活地轻松测试数百个模型。但我们不想花费宝贵的数据科学和工程时间设置和优化用于深度学习的 Docker 环境。借助 Deep Learning 容器,我们可以在几分钟内设置优化的 TensorFlow 环境,而且不产生任何费用。”