硬核科普|深度学习主流开发框架解读和比较(中篇)
专题推荐:金博士AI技术干货分享
【资料图】
文章推荐:硬核科普|深度学习主流开发框架解读和比较
本文的知识点
通过本文,读者可以从中学习和掌握的关键知识点,包括:
1. 深度学习框架:了解不同的深度学习框架,如PyTorch、TensorFlow和Keras,并理解每个框架的特定优势和使用场景。
2. 每个框架的技术细节:了解每个框架的技术规格,如所用的编程语言、操作的API级别,以及架构类型
3. 性能比较:理解这些框架在性能上的差异,如速度和处理大数据集的能力,例如Keras适合较小的数据集,而PyTorch和TensorFlow适合处理大数据集并提供高性能。
4. 如何选择合适自己或行业的框架:学习在选择深度学习框架时应考虑的因素,如数据集的大小和类型、可用性的模型集,社区支持以及部署相关的流程和工具等。
大应用对开发框架的要求
PyTorch 和 TensorFlow 都有其独特的开发历程和复杂的设计决策历史。之前,这使得比较两者变得是一个关于它们当前特点和未来特点的复杂技术讨论。鉴于两个框架自从创立以来都已迅速成熟,许多这些技术差异现在已经不再重要。
幸运的是,对于那些不希望听得昏昏欲睡的人来说,当前的 PyTorch 与 TensorFlow 的争论主要围绕三方面实践所需考虑的因素:
1. 模型可用性:随着深度学习领域的逐年扩大和模型相应地变得更大,从零开始训练最先进的模型已经不再可行。幸运的是,现在有许多最先进的模型公开可用,使用它们在可能的地方很重要。
2. 部署基础设施:如果训练出的性能良好的模型不能被利用,那训练它们就没有意义。降低部署时间至关重要,尤其是随着微服务业务模型越来越受欢迎;高效的部署有可能决定许多以机器学习为中心的业务的成败。
3. 生态系统:深度学习不再只是在高度控制的环境中的特定用例。AI正在为众多行业注入新的能量,因此,一个位于更大生态系统中的框架,可以为移动设备、本地和服务器应用程序提供开发支持变得很重要。此外,专用机器学习硬件的出现,如 Google 的 Edge TPU,意味着成功的实践者需要使用能够与这种硬件很好地集成的框架。
我们将依次探讨这三个实际考虑因素,然后提供我们对在不同领域使用哪个框架的建议。
模型可用性比较
从零开始实现一个成功的深度学习模型可能是一项非常棘手的任务,特别是对于如 NLP 这样的应用,其中工程和优化都很困难。SOTA(State-of-the-Art,最新的、最先进的)模型日益复杂,这对于小规模企业来,模型训练和微调都不太实际,甚至近乎不可能。初创公司和研究人员都没有计算资源来自己利用和探索这样的模型,因此,能够使用预训练模型进行迁移学习、微调或开箱即用的推理就显得非常宝贵了。
在模型可用性方面,PyTorch 和 TensorFlow 有着明显的差异。PyTorch 和 TensorFlow 都有自己的官方模型仓库,我们将在下面的生态系统部分探讨,但实践者可能希望使用其他来源的模型。
我们下面从三个维度来比较模型可用性:1)在 HuggingFace 上公开的模型所支持的框架类型数量, 2)出版的科研论文其研究所基于的框架类型, 3)基于网站 Paper-with-Code,对提供代码的论文所采用的框架类型进行统计分析。
HuggingFace
HuggingFace 是一家领先的人工智能公司,致力于开发和提供一流的自然语言处理(NLP)技术。它是名为Transformers库的开发者,该库是一个开源项目,提供了各种最新的深度学习模型,如BERT、GPT-2、GPT-3和T5等,供研究人员和开发者使用。这些模型广泛应用于文本分类、信息抽取、语义理解、自然语言生成等任务。
HuggingFace的Transformers库是NLP领域的一个重要资源,提供了丰富的预训练模型和相关工具,帮助开发者和研究人员简化开发过程,快速实现各类NLP任务。此外,Transformers库也是一个活跃的社区,研究者和开发者可以在其中相互学习,分享知识和经验。
除了Transformers库,HuggingFace还提供了一个在线模型库,用户可以在其中找到、分享和使用各种预训练模型。此外,HuggingFace还开发了一些其他工具,如Datasets库,这是一个开源的数据集库,用于处理和加载各种NLP数据集。总的来说,HuggingFace是推动当前NLP领域发展的重要力量,为研究和应用提供了极大的便利。
HuggingFace可以让你只用几行代码就将训练有素、调整优化过的 SOTA 模型纳入你的开发流程中。
当我们比较 HuggingFace 对 PyTorch 和 TensorFlow 模型的可用性时,结果有点令人惊讶。下面我们看到的是在 HuggingFace 上可用的模型总数的图表,这些模型要么仅限于 PyTorch 或 TensorFlow,要么适用于两种框架。可以看到,只能在 PyTorch 中使用的模型数量绝对压倒了竞争对手。几乎有92% 的模型仅支持 PyTorch,比2022 年的 85% 还要多。相反,只有大约 8% 的模型仅支持 TensorFlow,所有可用模型中只有大约 14% 支持 TensorFlow ,比2022年的 16%还要少。此外,2022 年新增了超过4.5 万个仅支持 PyTorch 的模型,而只增加了约 4 千个仅支持 TensorFlow 的模型。
图 1 HuggingFace 上的模型数量
如果我们把注意力集中在 HuggingFace 最受欢迎的 30 个模型上,我们会看到有趣的结果。所有模型都可在 PyTorch 中使用,和去年一样,没有任何模型只支持 TensorFlow。不过同时支持两种框架的模型数量已经从 19 增加到 23。
图 2 HuggingFace 上排名前 30 的模型
研究论文
关键词:
相关阅读
-
硬核科普|深度学习主流开发框架解读和比...
专题推荐:金博士AI技术干货分享文章推荐:硬核科普|深度学习主流开发 -
三大运营商半年报出炉
8月10日,随着中国移动(600941 SH)盘后发布半年报,三大运营商上半年 -
高效完成为生命“续费”:中信银行南京...
未来,中信银行南京分行将继续践行有温度的服务理念,切实解决客户... -
深交所向安达维尔发出关注函
深交所向安达维尔发出关注函 -
14位交易者的感悟:做商品不要追行情!...
交易者要想应对市场的波动,在市场取得生存之本,就要像汽车一样,要遵 -
华大智造2023年上半年测序业务收入同比...
8月10日晚间,华大智造披露2023年中期业绩。根据财报,华大智造上半年 -
人民币换韩币汇率差价怎么计算-人民币换...
今天佳肖财经网就给我们广大朋友来聊聊人民币换韩币汇率差价怎么计算, -
郑东新区豫兴路办事处开展流浪犬专项整...
中原网讯(记者刘梦琳通讯员张震冉文涛)为深入推进流浪犬专项整治行动, -
迪士尼第三财季营收223亿美元,Disney+...
“在线视频业务的亏损从上年同期的逾10亿美元大幅降至5 12亿美元。” -
深交所:持续优化拓展互联互通机制 助...
2023年8月11日,中国证券监督管理委员会、香港证券及期货事务监察委员 -
锚定东非优质金矿项目,透视希尔威(SVM...
步入矿业资产多国别配置、产业板块多元化、利润弹性逐步释放的新阶段 -
女子盗窃海口16家便利店,只偷这个东西→
8月10日,海南省公安厅港航公安局海口港码头派出所抓获一名盗窃中国体 -
贷款到期还不上续贷怎么办
贷款到期还不上续贷的处理办法是在能力范围内尽早偿还逾期欠款,若是当 -
大族封测即将亮相智博会 引领半导体...
随着新一轮科技革命和产业变革的蓬勃兴起,制造业不断呈现出新的转型升 -
焦点丨金融支持科技创新要与防风险统筹兼顾
焦点丨金融支持科技创新要与防风险统筹兼顾,金融,融资,信贷,科创,防风 -
废铁回收价(废铁回收价格今日价)
废铁回收价废铁回收价怎么这么低了,很多人想知道这是什么原因,下面我 -
金房能源:公司控股子公司以自身供冷节...
金房能源(001210)08月11日在投资者关系平台上答复了投资者关心的问题。 -
天孚通信:截至2023年08月10日收盘,公...
天孚通信(300394)08月11日在投资者关系平台上答复了投资者关心的问题。 -
三镇和申花一决雌雄!高畠勉切换双中卫...
总之,球队会根据自己节奏走,打出自己应有的东西,我个人需要动脑子更 -
有点惨!FPX无畏契约分部 今年国际赛全...
今日无畏契约全球冠军赛小组赛上,FPX惨遭T1横扫淘汰一轮游出局。至此F