解密百度飞桨框架2.0正式版,从开发、训练到部署全面换代?
2016年,百度PaddlePaddle打响了国产深度学习框架开源的第一枪。
2019年秋季4月,在WavebookSummit深度学习开发者峰会上,首次推出PaddlePaddlebook的中文名飞桨,开始强调自己更适合中国开发者,更于深度学习模式的产业实践。同时,桨的发展开始加快。
时间到了2020年,这一年是国产深度学习框架的亮点时刻,作为国产领导者的飞桨动作频繁,不断更新升级。
2021?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????现在,在GitHub中,飞桨收获Star的数量达到了14.6k,被越来越多的开发者使用。
飞桨作为中国首个开源开放的深度学习平台,为了保持自己的地位,必须具有独特的优势。经过多年的更新反复,飞桨已经集开发了便利的核心框架、超大规模深度学习模型训练、多平台配置的高性能推理引擎和复盖多领域的产业级模型库四大核心技术于一体,始终保持技术领先和功能完善。现在飞桨聚集在265万开发者身上,服务了10万家以上的企业,创造了34万个以上的模型,帮助越来越多的行业完成AI实现了产业智能化的升级。
与以前的版本反复相比,这次的top2.0top版本的发表不仅是通常的升级,也是基础设施的全面更新!此次,百度从产业实践全过程出发,对深度学习模式的研发、培训、部署进行了整体优化,进一步加快了AI应用的大规模落地。
1、更高效率的研发AI;
1、成熟完善的动态图模式由于命令式编程模式(动态图)对开发商的友好性,飞桨在2019年初也在推动态图功能。这次升级,划桨将默认的开发模式升级为动态图,这表明划桨的动态图功能已经成熟完善。飞桨框架2.0支持用户使用动态图完成深入学习相关领域的模型算法开发。在动态图模式下,开发商可以随时查看变量的输入、输出,方便快捷的调试程序,带来更好的开发体验。
为了解决动态图的部署问题,飞桨提供了全面完善的动转支持,在Python语法支持的垄断度上达到了领先水平。开发商在动态图程序设计调试过程中,只需添加一个装饰器,就可以无缝地自动实现静态图培训或模型保存。同时,桨框架2.0也统一了模型存储和加载的接口,保证了动作静止后保存的模型文件可以用纯动态图加载和使用。
飞桨框架2.0版本上,官方支持的动态图算法数量达到270条,涵盖了计算机视觉、自然语言处理、语音、推荐等多个领域,动态图的训练效率和配置效率提高。2.0版本的动态图支持自动混合精度和量化训练功能,实现比静态图简洁灵活的混合精度训练界面,达到与静态图匹敌的混合精度和量化训练效果。
同时,为了推进各主流场景的产业级应用,飞桨系列开发套件也随着飞桨框架完成升级,全面支持动态图开发模式。
2、API系统新升级
API是用户使用深度学习框架的直接入口,对开发者的使用体验起着重要的作用。桨框2.0对API系统进行了全新的升级。包括系统化的整理和简洁的处理,桨框2.0的新API系统完全兼容历史版本,同时桨提供升级工具,帮助开发者降低升级转移成本。
系统化:飞桨重新整理和优化了API的系统结构,使其更加明确、科学,许多开发人员可以更容易地根据开发使用场景找到想要的API。另外,通过class、functional两种形式的API,可以模块化的组织代码和网络建设,提高开发效率。同时,API的丰富度大幅提高,共增加了API217,优化了API195。
简洁:提供更适合低代码编程的高层API。数据增强、数据生产线建立、循环批量训练等标准化的工作流程,以及一些经典的网络模型结构,在桨框2.0中,被封装为上层API。基于飞桨高层API,开发商只需10行左右的代码即可完成培训部分程序。最重要的是,高层API和基础API采用一体化设计,即在编程过程中可以同时使用上层API和基础API,使用户能够在简单的开发和精细的调整之间自由定制。
二、更高效地训练AI模型
2、业内首个通用异构参数服务器架构 飞桨框架2.0推出业内首个通用异构参数服务器技术,解除传统参数服务器模式必须严格使用同一硬件型号Trainer节点的束缚,使训练任务对硬件型号不敏感,同时使用不同的硬件进行混合异构训练,如CPU、GPU(如V100、P40、K40混合)、AI专用加速硬件,如昆仑芯片等通过异构参数服务器架构,用户可以在硬件异构集群中部署分布式培训任务,高效利用不同计算能力的芯片,为用户提供更高吞吐量、更低资源消耗的培训能力。 通用异构参数服务器结构被称为通用,主要是兼容性支持 1、CPU机械构成的传统参数服务器结构支持的训练任务。 2.GPU和其他AI加速芯片对应机构成的参数服务器可以兼容,充分利用机器内部的异构设备。 3.支持CPU机械和GPU或其他AI加速芯片对应机械的混布,构成机械间别参数服务器结构。 异构参数服务器具有非常高的性价比,如下图所示,仅用两台CPU机加两台GPU机就能达到与四台GPU机相似的训练速度,成本至少可节省35%。 三、将AI模型更广泛地部署到各种硬件 AI产业的广泛应用离不开各种人工智能硬件的繁荣。目前,英特尔、英伟达、ARM等众多芯片制造商纷纷开展飞桨支持。飞桨还跟飞腾、海光、鲲鹏、龙芯、申威等 CPU 进行深入适配,并结合麒麟、统信、普华操作系统,以及百度昆仑、海光 DCU、寒武纪、比特大陆、瑞芯微、高通、英伟达等 AI 芯片深度融合,与浪潮、中科曙光等服务器厂商合作形成软硬一体的全栈AI基础设施。当前飞桨已经适配和正在适配的芯片或 IP达到 29款优艾设计网_设计LOGO,处于业界领先地位。 自主可控的必要性:TensorFlow、PyTorch 并不完美 很多人对国产深度学习框架的发展抱有怀疑态度,认为这些工作只不过是在拾人牙慧,重复造轮子,而且 AI 开源框架的搭建是一项费时费力的庞大工程。如果没有超越现有主流框架的想法,去重复造一套没有技术创新的轮子,性价比似乎不高,对技术人员来说吸引力也不大。 但AI的大规模落地仍处于起步阶段,深度学习技术仍在发展,复杂性也在提高,而TensorFlow、PyTorch等海外框架不是没有提高的空间,飞桨等国产框架还有很大的机会。 业内算法工程师表示,TensorFlow对稀疏模型的处理能力大规模分布式计算能力和Embffffding存储利用率仍有上升空间,而且TensorFlow2.0对API混乱的问题也需要解决 此外,飞桨免费开放了很多预训练模型,可以直接在产业界落地,因此对于小型企业来说更有利,成本更低,同时也能取得不错的效果。由于 AI 正在从云端走向边缘端,而飞桨对多芯片平台的适配和支持,也带了很大的部署优势。 与此同时,百度也在加大构建飞桨社区的扶持,因此中国开发者也可以获得更及时、更个性化的支持。 今年 3 月美国国家人工智能安全委员会(the National Security Commission on Artificial Intelligence,NSCAI)发布的一份报告,提出了对于总统拜登、国会及企业和机构的数十项建议,以期压制中国 AI 的发展。这也说明了构建中国自主可控核心技术栈的重要性和必要性。 新加坡工程院士、IEEEFellow面水在CSDN《2020-2021中国开发者调查报告》中评价,以桨为代表的国产框架迅速崛起,其市场占有率不容忽视。 2021年,基于划船的企业级开发工具库数量增加,内容丰富,参加划船生态社区的用户增加。具有先发优势的百度,现在在AI基础设施领域更远,更稳定。
精彩评论