微软 OpenPAI – 分布式AI 训练平台介绍

案例来源:Microsoft
会议地点:深圳
分享时间: 2019-06-23 09:00-10:00

邹欣 

Microsoft Principal Software Engineering Manager

邹欣现任微软Windows中国工程团队首席研发总监。 1996—2003年,邹欣在微软Outlook团队从事 开发工作,2003—2005年,他在微软内部质量 工具团队和Visual Studio团队负责软件项目管理工具的开发。2005—2012年,他担任微软亚洲研究院技术创新组研发主管,负责研究成果的产品化和创新项目。2012—2014年,他担任微软亚洲互联网工程院首席研发总监,负责必应搜索客户端、必应输入法、必应词典等产品。加入微软前,邹欣从事过商用Unix系统、 GPS/GIS软件开发及测试工作。 他在2007年出版了《移山之道》,于2008年出版了《编程之美》 (合作)。他于1991年获北京大学计算机软件专业学士学位。1996年获美国美国韦恩州立大学(Wayne State University)计算机软件专业硕士学位。

课程概要

背景介绍:
AI 的科研和工程中需要频繁地训练各种AI 模型,如何更充分地利用资源?我只有有限的GPU 资源,如何支持多用户的多种训练要求?
我不想在公共云上进行训练, 如何能高效地部署和管理私有云?

解决思路/成功要点:
OpenPAI AI 模型训练和资源管理能力的开源平台,能轻松扩展,并支持各种规模的私有部署、云和混合环境。
OpenPAI 用于管理计算资源,并对机器学习任务进行了优化。 通过 Docker 技术,硬件计算资源与软件相分离。这样,用户能轻松的进行分布式计算,在不同的深度学习框架间切换,也能在完全一致的环境中重复运行作业。
成果:
OpenPAI 已经在几个高校和创业公司部署,支持了各种 AI 的模型训练和教学任务。

听众收益

1、了解AI 训练平台面临的挑战
2、了解 OpenPAI 在各种情况下的解决方案。
3、了解 AI 训练平台发展的几个趋势, 为自己公司搭建或使用平台做明智的选择。

邹欣 

Microsoft
Principal Software Engineering Manager

邹欣现任微软Windows中国工程团队首席研发总监。 1996—2003年,邹欣在微软Outlook团队从事 开发工作,2003—2005年,他在微软内部质量 工具团队和Visual Studio团队负责软件项目管理工具的开发。2005—2012年,他担任微软亚洲研究院技术创新组研发主管,负责研究成果的产品化和创新项目。2012—2014年,他担任微软亚洲互联网工程院首席研发总监,负责必应搜索客户端、必应输入法、必应词典等产品。加入微软前,邹欣从事过商用Unix系统、 GPS/GIS软件开发及测试工作。 他在2007年出版了《移山之道》,于2008年出版了《编程之美》 (合作)。他于1991年获北京大学计算机软件专业学士学位。1996年获美国美国韦恩州立大学(Wayne State University)计算机软件专业硕士学位。

课程概要

背景介绍:
AI 的科研和工程中需要频繁地训练各种AI 模型,如何更充分地利用资源?我只有有限的GPU 资源,如何支持多用户的多种训练要求?
我不想在公共云上进行训练, 如何能高效地部署和管理私有云?

解决思路/成功要点:
OpenPAI AI 模型训练和资源管理能力的开源平台,能轻松扩展,并支持各种规模的私有部署、云和混合环境。
OpenPAI 用于管理计算资源,并对机器学习任务进行了优化。 通过 Docker 技术,硬件计算资源与软件相分离。这样,用户能轻松的进行分布式计算,在不同的深度学习框架间切换,也能在完全一致的环境中重复运行作业。
成果:
OpenPAI 已经在几个高校和创业公司部署,支持了各种 AI 的模型训练和教学任务。

听众收益

1、了解AI 训练平台面临的挑战
2、了解 OpenPAI 在各种情况下的解决方案。
3、了解 AI 训练平台发展的几个趋势, 为自己公司搭建或使用平台做明智的选择。

CopyRight © 2008-2019 Msup & 高可用架构