ในงาน AWS re:Invent 2018 ทาง Amazon ได้ออกมาประกาศให้ AWS Deep Learning AMI สำหรับ Ubuntu และ Amazon Linux สนับสนุนการทำ Distributed Training ให้กับ TensorFlow Deep Learning Model ได้ด้วย GPU สูงถึง 256 ชุดแล้ว
AWS Deep Learning AMI คือระบบที่มาพร้อมกับ TensorFlow รุ่นปรับแต่งประสิทธิภาพและสามารถทำงานร่วมกับ Horovod Distributed Traning Framework ได้เพื่อรองรับการ Train ด้วยระบบขนาดใหญ่โดยเฉพาะ โดยทาง AWS ได้ประมาณประสิทธิภาพเอาไว้ว่าการ Train ResNet50 Model ด้วยระบบนี้จะสามารถทำให้แล้วเสร็จได้ภายในเวลาเพียง 15 นาทีเท่านั้น
ผู้ที่สนใจรายละเอียดเพิ่มเติม สามารถศึกษาข้อมูลใน Developer Guide ได้ที่ https://docs.aws.amazon.com/dlami/latest/devguide/gs.html ครับ
ที่มา: https://aws.amazon.com/about-aws/whats-new/2018/11/tensorflow-scalability-to-256-gpus/
from:https://www.techtalkthai.com/aws-supports-tensorflow-training-with-256-gpu/