Accelerating Deep Learning Inference via Freezing.

作者： Shivaram Venkataraman , Aditya Akella , Adarsh Kumar , Arjun Balasubramanian

DOI:

关键词:

摘要: … caching at each intermediate layer and we discuss techniques to reduce the cache size and improve the cache … we see that the cache requires a mere 12.5MB of memory for ResNet-18. …

uni-trier.de 本地加速

usenix.org 本地加速

usenix.org PDF 下载加速

参考文章(0)

Accelerating Deep Learning Inference via Freezing.

来源期刊

我的账户

Accelerating Deep Learning Inference via Freezing.

来源期刊

相似文章 1

Accelerating Deep Learning Inference via Learned Caches.

我的账户