阿里巴巴机器智能团队的三年工作总结

发布时间：2019-05-23 20:17:13 所属栏目：建站来源：汪思颖

导读：副标题#e# 本文转自雷锋网，如需转载请至雷锋网官网申请授权。从 2016 年至今，阿里巴巴机器智能实验室线下智能团队开始涉足线下智能领域。探索至今，算法方面，他们提出了自主研发的模型压缩方法，新型模型结构和目标检测框架；工程方面，他们研发出一套

对检测模型做全量化处理。

阿里巴巴机器智能实验室线下智能团队三年工作总结

如上表所示，相同 backbone 网络的情况下，我们提出的 LRSSD 在减少 SSD HEAD 计算量的同时，mAP 可以稳定提升3%-4% 。从另一个角度来看，在保证检测精度不变的情况下，我们的方法可以将模型复杂度减少到原来的 50% 左右。如果再考虑到量化带来的速度加成，在相同精度下，相比原有全精度模型，我们可以获得共约 2-3 倍的真实速度提升。

小结

上文给出了我们近 2 年内在线下智能—模型压缩领域所做的一些技术积累。归纳起来如下：

量化方面：我们可以做到 3-bit 量化几乎无损压缩！

稀疏方面：对于传统网络结构，我们可以做到 90% 稀疏度下的几乎无损压缩！

软硬件协同设计方面：我们联合服务器研发团队，达到 0.174ms/张的 resnet18 极限推理速度，目前已知业内最佳效果！

轻量级网络设计方面：我们在 40MFlops 计算量下，相对目前业内最好结构，在 ImageNet 数据集上绝对提升 2%！

端上目标检测方面，我们在保证精度不变的情况下，速度提升约 2-3 倍！

在技术探索的同时，我们也在积极的将上述技术应用到实际的业务中。在这一过程中我们发现了下列几个问题：

易用性：业务场景往往需要快速的迭代能力和灵活方便的部署能力，因此非标准化的方案很难被广泛应用。

理论速度 vs 真实速度：除了算法和硬件以外，真实的模型推理速度是需要一个高效的工程实现作为支撑的。

集成化：线下智能需要同时考验团队在硬件和软件两方面的实力，这对业务而言往往太过沉重。

在本文后半部分，我们首先会针对上述的几个问题介绍我们已经做过的尝试和沉淀出的解决方案。最后，我们列出了一些实例，展示如何在具体的业务场景中应用线下智能技术，希望可以给各位同学一个更直观的认识。

训练工具

在实际业务推广过程中，我们遇到的第一个问题是易用性问题：

不同业务往往使用的深度学习库多种多样，例如 Caffe, Tensorflow, Mxnet 等等；

不同业务使用的基础技术差异比较大，有分类识别、检测、分割、语音等等；

不同业务的数据安全级别差异比较大，有些可以公开，有些则需要完全物理隔离；

（编辑：网站开发网_马鞍山站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/4

首页

尾页

认清友情链接购买渠道	撰写高质量原创内容的
万词霸屏服务之所以受	技术性seo知识分享相