AI顶会ICLR优秀论文出炉!MIT“彩票假设”论文让神经网络参数瘦身90%

智东西(公众号:zhidxcom)erc每天发布大量与生活相关的资讯平台

编 | 王erc每天发布大量与生活相关的资讯平台

智东西5月7日消息,ICLR在其官网公布了ICLR大会2019的两篇最佳论文,这两篇论文在ICLR大会共收到的大约1600份论文中脱颖而出,它们分别是,加拿大蒙特利尔算法学习研究院MILA发表的NLP深度学习模型论文和麻省理工学院计算机科学与AI实验室CSAIL发表的神经网络压缩技术论文。erc每天发布大量与生活相关的资讯平台

CSAIL的研究论文“彩票假设:寻找稀疏、可训练的神经网络”清楚的向我们展示了深度神经网络如何以更小的规模、更快的速度创建模型。erc每天发布大量与生活相关的资讯平台

erc每天发布大量与生活相关的资讯平台

这篇论文的研究成果计划在5月6日~9日新奥尔良举行的国际学习代表大会ICLR上展示。erc每天发布大量与生活相关的资讯平台

研究论文表明,深度神经网络能够将训练网络的参数个数减少90%以上,降低存储要求,提高推理的计算性能。虽然网络规模大幅减小,但它们能够被训练做出同样精确的预测,在某些情况下甚至比原始网络更快。erc每天发布大量与生活相关的资讯平台

那么到底什么是深度神经网络?这种网络构建的模型又能起到什么作用呢?接下来,请通过下文了解深度神经网络。erc每天发布大量与生活相关的资讯平台

一、什么是深度神经网络? erc每天发布大量与生活相关的资讯平台

深度神经网络,以生物神经元为模型的数学函数层,是一种多功能的AI体系结构,能够执行从自然语言处理到计算机视觉的各种任务。erc每天发布大量与生活相关的资讯平台

深度神经网络通常非常大,需要相应的大型语料库,即使是最昂贵的专用硬件,对它们进行训练也可能需要数天时间。erc每天发布大量与生活相关的资讯平台

如果初始网络不需要那么大,为什么不能在一开始就创建一个大小合适的网络呢?针对这个疑问,论文合著者Jonathan Frankle博士表示,通过神经网络,可以随机初始化这个大型网络结构,并在进行大量数据进行训练之后开始工作。erc每天发布大量与生活相关的资讯平台

Jonathan Frankle说:“这种大型结构就像买了一堆彩票,即使只有很少的几张彩票能让你变得富有,但我们仍然需要一种技术,在没有看到中奖号码的情况下找到获奖者。”erc每天发布大量与生活相关的资讯平台

二、深度神经网络如缩小规模? erc每天发布大量与生活相关的资讯平台

erc每天发布大量与生活相关的资讯平台

研究人员缩小神经网络规模的方法包括消除这些功能(或神经元)之间不必要的连接,以使其适应功能较低的设备,这一过程通常称为剪枝。(他们特别选择了具有最低“权重”的连接,这表明它们是最不重要的。)erc每天发布大量与生活相关的资讯平台

接下来,他们在不对连接进行剪枝的情况下训练网络并重置权重,在修剪其他连接后,他们确定了有多少连接可以被删除而不影响模型的预测能力。erc每天发布大量与生活相关的资讯平台

虽然剪枝后的系数架构会使训练过程变得更难,但这也带来一个好处,通过训练难度的增加提高性能。erc每天发布大量与生活相关的资讯平台

Michael Carbin和Jonathan Frankle在论文中表示,标准的剪枝技术可以自然地揭示子网络的初始化使它们能够有效地训练。erc每天发布大量与生活相关的资讯平台

在一系列条件限制下,通过不同的网络重复这一修剪过程数万次之后,他们报告称,他们发现的AI模型的规模不到完全连接的父网络的10%至20%。erc每天发布大量与生活相关的资讯平台

三、没有最好只有更好的深度神经网络 erc每天发布大量与生活相关的资讯平台

论文合著者兼助理教授Michael Carbin表示,重新设置一个表现良好的网络通常会带来更好的结果,这表明无论我们第一次做什么,都不是最佳选择,这些模型还有改进的空间,可以学习如何改进自己。erc每天发布大量与生活相关的资讯平台

Michael Carbin和Jonathan Frankle指出,他们在较小的数据集上进行以视觉为中心的分类任务,把探索为什么某些子网络特别擅长学习和快速识别这些子网络的方法留给了未来的工作。erc每天发布大量与生活相关的资讯平台

他们认为,深层神经网络的研究结果可能对迁移学习产生影响,迁移学习是一种为一项任务训练的网络适应另一项任务的技术。erc每天发布大量与生活相关的资讯平台

结语:深度神经网络已与现代应用深度融合 erc每天发布大量与生活相关的资讯平台

深度神经网络能够提取更多的数据特征,获取更好的学习效果。目前,深度神经网络已经成为许多AI应用的基础,这项技术已经应用于语音识别、图像识别、自然语言处理等领域。erc每天发布大量与生活相关的资讯平台

借助AI模型解决复杂问题是现在研究领域的重点工作内容,深度神经网络能够大幅缩小这些模型的规模,将为AI技术带来更方便、更快速的精准运算。erc每天发布大量与生活相关的资讯平台

论文链接:https://arxiv.org/abs/1803.03635erc每天发布大量与生活相关的资讯平台

原文来自:VentureBeaterc每天发布大量与生活相关的资讯平台

也许你还喜欢

steam图片加载不出来 steam创意工

steam图片加载不出来 解决方法一:检查网络环境 如果您遇到了Steam加载不出图片的问

steam无法添加好友怎么做 steam添

steam无法添加好友怎么做,steam添加好友不符合此功能要求怎么办,steam帐户恢复尝试次数

steamdeck价格是怎样 Steam Deck能

steamdeck价格是怎样,Steam Deck能玩什么游戏,新版steam设置启动项不见了,steam手机版怎

windows7安装教程和操作步骤 win7

windows7安装教程和操作步骤,win7系统版本详细介绍,安装Windows7最低配置要求,如何满足Wi

steam关闭开机自启 steam手机版换

steam关闭开机自启,steam手机版换手机了怎么登录,steam游戏闪退解决方法,steam平台上下载

steam手机版打不开解决方法 steam

steam手机版打不开解决方法,steam客户端打不开商店怎么办,steam打开出错怎么办,steam手机

steam怎么关闭开机自启 Steam新界

steam怎么关闭开机自启,Steam新界面如何设置,steam启动游戏几秒自动关闭,steam游戏自动关

steam为什么不能加好友 steam添加

steam为什么不能加好友,steam添加好友的具体操作方法,steam家庭共享可以一起玩吗,steam游

steam重复次数过多要等多久 怎么解

steam重复次数过多要等多久以及解决办法,steam退款到账时间要多久,steam跳转微信/支付宝

steam怎么改手机号 steam手机令牌

steam怎么改手机号,steam手机令牌怎么移除,steam账号注册规则,steam密码怎么填写,相信大家