-
神经网络推理加速之模型量化
· 赵鹏, 陈新宇, 秦臻南, 叶军 翻译: 包怡欣 (INTEL MLT TEAM)1. 引言 在深度学习中,推理是指将一个预先训练好的神经网络模型部署到实际业务场景中,如图像分类、物体检测、在线翻译等。由于推理直接面向用户,因此推理性能至关重要,尤其对于企业级产品而言更是如此。 衡量推理性能的重要指标包括延迟(latency)和吞吐量(throughput)。延迟是指完成一次预测所需的时间,吞吐量是指单位时间内处理数据的数量。低延迟和高吞吐量能够保证良好的用户体验和工...
-
预知未来——Gluon时间序列工具包(GluonTS)
· GluonTS团队 Amazon AI我们很高兴地在此宣布Gluon Time Series(GluonTS)正式开源了!GluonTS是一个由亚马逊的科学家们开发的,用于构建、评估以及比较基于深度学习的时间序列模型的python工具包。GluonTS基于Apache MXNet的Gluon接口,为搭建时间序列模型提供更简洁高效的组件。本文将介绍GluonTS工具包的关键功能,并演示如何应用GluonTS来解决时间序列预测问题。...
-
GluonCV v0.4:更多更快
· 张帜 Amazon Applied ScientistGluonCV 0.3 版提供大量超越原论文精度的模型。0.4 版在此基础上引入了: 新应用:全新的人体关键点检测模型 更快的部署:新增 Int8 部署和经济适用型的删减版 ResNet(Pruned ResNet)系列 更强的预训练模型:ResNext, SE_ResNext 模型系列(各种 80%~81+% 准确度的 ImageNet 预训练模型) 支持 FPN 的 ...
-
GluonNLP v0.6:让可复现的BERT模型走到你身边
· 林海滨 Amazon Software Development Engineer 翻译: 金颢 Amazon Software Development EngineerBERT 模型正在自然语言处理领域大杀特杀!例如,BERT 模型在包含9种任务的 GLUE 基准测试上将得分从 72.7 提高到了 80.5 ——这是最新的重大突破 [6]。 虽然 BERT 模型很好很强大,GluonNLP 小分队却没有找到任何开源代码能够同时: 提供可扩展的GPU预训练 复现各种任务上的结果 支持模型输出和部署 为了解决以上所有的痛点,GluonNLP...
-
GluonCV复现Wasserstein GAN
· 陈晓辰 Tencent Applied Researcher简介 本篇博客将讨论GluonCV 0.3版本中新加入了Wasserstein GAN,包含了Wgan的一些实现细节和我踩到的一些坑。 Wgan介绍 Wgan是在Dcgan的基础上,使用wasserstein距离替代KL距离。 使用wasserstein距离的好处是,即使当两个概率分布是没有重合的时候,同样能衡量出一个距离,而这种情况下,dcgan中使用的KL距离是会为0,导致梯度消失...
-
GluonCV 0.3: 超越经典
· 张帜 Amazon Applied Scientist半年前我们开始了 GluonCV 项目,希望提供一个可靠的可以重复各个论文结果的深度学习计算机视觉库。过去几个月里小伙伴们挖掘了大量论文和实现中的隐藏细节,并对模型训练的各个细节进行了大量的实验。我们兴奋地发现,我们不仅仅能重复结果,而且能超越它们。 现在,我们高兴地宣布 GluonCV 的新的0.3版。在这个版本里我们加入了5个新算法和38个新训练好的模型。并且对28个0.2版的模型进行...
-
GluonNLP 0.3.3 新功能及重现报告
· 查晟 Amazon Applied Scientist谨以此文纪念为 GluonNLP 的模型重现赴汤蹈火,积极踩坑的小哥们。 GluonNLP 第一弹中炼丹师小A的遭遇和深度学习那些坑扎了许多朋友的心,比如知乎网友RickZ评论称 “正在被中文数据预处理教做人🙃”。在第一弹发布后,我们 GluonNLP 的小哥们马上又投入到紧张的论文复 (cai) 现 (keng) 工作中。今天,我们新发布的 GluonNLP 0.3.3 为大家带来了...
-
MXNet Gluon 上实现跨卡同步 Batch Normalization
· 张航 Amazon AI Applied Scientist很多用户在论坛上,GitHub 上,甚至是不同的深度学习平台上,都要求提供跨卡同步(Cross-GPU Synchronized) Batch Normalization 或称为同步BN (SyncBN)。 我们团队率先提供了 MXNet 的实现。 写在前面:为什么要跨卡同步 Batch Normalization 现有的标准 Batch Normalization 因为使用数据并行(Da...