了解“预训练-微调”,看这一篇就够了

了解“预训练-微调”,看这一篇就够了

预训练-微调方法指的是首先在大数据集上训练得到一个具有强泛化能力的模型(预训练模型),然后在下游任务上进行微调的过程。
预训练-微调方法属于基于模型的迁移方法(Parameter/Model-basedTransferLearning)。
该大类方法旨在从源域和目标域中找到它们之间共享的参数信息以实现迁移。
此迁移方式要求的假设条件是:源域中的数据与目标域中的数据可以共享一些模型的参数。
下图形象地表示了基于模型的迁移学习方法的基本思想。
预训练-微调的模式为何重要
因为其他任务上训练好的模型可能并不完全适用于自己的任务:可能上游训练数据与下游数据不服从同一个分布;可能已有的预训练网络较复杂、而我们的任务比较简单,等等。
例如,对训练一个猫狗图像二分类的神经网络最有参考价值的便是在CIFAR-100上训练好的神经网络。
然而,CIFAR-100有100个类别,此任务只需2个类别。此时便需要针对自己的任务固定原始网络的相关层且修改网络的输出层,以使结果更符合我们的需要。
综上,微调具有如下优势:
一些学者着眼于重新思考预训练模型的有效性。何恺明等人发表于ICCV2019的工作就对计算机视觉领域的ImageNet预训练进行了大量的实验。他们通过实验得到结论:在相同的任务上,预训练模型与从头开始训练(Trainfromscratch)相比,大大缩短了训练时间且加快了训练的收敛速度。在结果的提升上,他们的结论是,预训练模型只会对最终的结果有着微小的提升。
另一项工作则深入思考了预训练模型对于迁移任务的作用并得出以下结论:
另一些学者则在模型的鲁棒性等方面继续探索预训练模型带来的提升。Usingpre-trainingcanimprovemodelrobustnessanduncertainty做了一系列预训练模型的实验,最终认为预训练模型可以在以下场景中提高模型的鲁棒性:
预训练-微调的应用
预训练模型已经在计算机视觉、自然语言处理和语音识别等任务上得到了广泛的应用。
预训练模型可以获得大量任务的通用表现特征,那么能否直接将预训练模型作为特征提取器,从新任务中提取特征从而可以进行后续的迁移学习呢?
这种方法类似于从一个强大的模型中提取特征表达嵌入(Embedding),继而利用这些特征开展进一步的工作。
例如,计算机视觉中著名的DeCAF方法就为视觉任务提供了一种从预训练模型中提取高级特征的通用方法。在小样本学习中,特征嵌入+模型构建的两阶段方法在近年来取得了不错的效果。
这促使我们重新思考预训练模型的使用方法:如果将从源域数据中学到的模型在目标域上直接提取特征,然后利用源域和目标域的特征构建模型,能否取得更好的效果?
令人惊奇的是,通过深度网络提取的特征配合传统机器学习方法在领域自适应任务上竟然可以取得比端到端的深度迁移学习更好的结果。
Wang等人提出了一种叫做EasyTL(EasyTransferLearning)的迁移方法。该方法首先利用在有标记源域数据上微调的预训练模型分别在源域和目标域上提取有表现力的高阶特征,然后基于这些提取好的特征进行后续的特征变换和简单的分类器构建。
令人欣喜的是,尽管EasyTL方法并未涉及相对重量级的深度迁移策略,却在当时取得了很好的效果。例如,EasyTL方法采用基于ImageNet数据集预训练的ResNet-50网络进行特征提取,取得了比绝大多数基于ResNet进行深度迁移的方法更好的效果,如下图所示。
我们给出深度学习中可能的预训练模型的应用方法:
以上内容出自《迁移学习导论(第2版)》,更多相关内容欢迎阅读此书。
本书第1版一经上市便引起极大反响,好评如潮。
在第2版中,作者们基于初版读者的反馈对初版进行了大刀阔斧的修改:添加了新的内容、调整了内容结构使其更易阅读、加入了新的应用实践代码使其更易上手、重新整理修改了所有代码从而保证了可复现性。
新版升级了哪些内容?
首先,第2版包含了第1版的所有内容。
其次,在此基础上,经过众多读者火眼金睛的审视,作者听取建议、不断修改,打磨出了更好的结构、更多的升级内容。
因此,第2版可以完全取代第1版。

主题测试文章,只做测试使用。发布者:最新稳定辅助网,转转请注明出处:https://www.744broad.com/44715.html

(0)
上一篇 2023年5月6日 上午10:19
下一篇 2023年5月6日 上午10:31

相关推荐

  • 地平线4做大逃杀模式,绝地求生出竞速地图,就差百人自走棋了?

    地平线4做大逃杀模式,绝地求生出竞速地图,就差百人自走棋了? 随着大逃杀(吃鸡)的火热,无数游戏厂商开始推出具有相关玩法的游戏,而被玩家们称为史上最强赛车游戏(画质和手感方面)的《极限竞速:地平线4》(地平线)就在游戏中加入了大逃杀模式“TheEliminator”。地平线官方宣称这个模式最多支持72位玩家共同游玩,参与者可通过各种方式去摧毁对手车辆,且最终…

  • 炒房癫狂东亚人,被资本算计的命门

    炒房癫狂东亚人,被资本算计的命门 这是黑阳公爵的第16篇原创名侦探黑阳系列第6篇今天这案够硬!甚至可以说本系列到目前为止最硬。人类任何行为潜意识都离不开动物本能,本质内核趋利避害!天地万物很多东西需要一层层剥,一条条捋,才找到最终归因。比如今天这个案子!①首先让我们所有人来思考一个,几乎都曾经面对过,或正在面对的问题!不公平!当你在一家企业、一家公司、一家单…

  • 《使命召唤手游》国服上线时间改到7月31日?网友:台服它不香吗

    《使命召唤手游》国服上线时间改到7月31日?网友:台服它不香吗 《使命召唤》手机版国服什么时候公测?《使命召唤》这款FPS射击手游自去年国庆节上线海外之后取得不错的成绩。即使已经上线一段时间了,也还能在2020年一月位居海外手游下载量排行第三,仅次于《脑洞大师》跟《PUBGMobile》。不俗的口碑也让国内玩家更期待国服的上线,毕竟无论是台服、欧服、还是其他…

  • 被称赞为腾讯最良心的一款游戏,最终逃不过被停服的命运

    被称赞为腾讯最良心的一款游戏,最终逃不过被停服的命运 十个游戏九个氪金,九个氪金八个来自鹅厂。我们都知道腾讯游戏一直都很氪金,而且小学生是真的多。但是,大家可能不知道在2011年代理了一款游戏,被誉为良心的一款游戏,氪金少,无论是画质还是游戏情节放在现在也是中高端的就别说四年前的了。里面的枪械道具是通过自己升级解锁的,但就是这么一款良心的游戏也逃脱不了被腾讯…

  • 江山如此多娇小型张与红楼梦小型张第五组的优势对比

    江山如此多娇小型张与红楼梦小型张第五组的优势对比 #头条创作挑战赛#“江山如此多娇”与“红楼梦”第五组,两个小型张都是次新邮里面各具特色的两个不同品种,一个是国画里面的山水画题材兼红色题材,另一个是传统的古典文学名著体裁,从大众化的普遍认知来讲,学子们和家长可能更偏向于红楼梦题材,毕竟四大名著在老百姓心中根深蒂固,妇孺皆知,只有书画艺术爱好者和红藏人士更倾向…

  • 不良人第5季很刺激,官方透漏李星云将觉醒,李嗣源会有“情戏”

    不良人第5季很刺激,官方透漏李星云将觉醒,李嗣源会有“情戏” 对于《画江湖之不良人》系列,不少人是不是觉得永远不够看?第三季时不良帅的下线,一度让人觉得难以接受,随着第四季的开播,那抑扬顿挫的剧情环环相扣,虐得死去活来下,提起了粉丝们的心,官方趁着热度更是提前发了第五季的预告片段。如今相隔不久,官方再度放出了这个预告,比上一次内容多了一些小细节,让粉丝把猜测…

  • 落地八大城市,2021年使命召唤手游城市巡回赛上海站正式启动

    落地八大城市,2021年使命召唤手游城市巡回赛上海站正式启动 自使命召唤手游在中国上线以来,受到了许多中国玩家的青睐和支持,目前正在举办的2021年使命召唤手游大师赛和即将举办的TGA腾讯电竞运动会使命召唤手游邀请赛(以下简称TGA)都在玩家群体中获得热烈反响。为给大众玩家提供登上电竞舞台的机会,2021年第一届使命召唤手游城市巡回赛应运而生。为热爱而战,为…

  • 深圳探索“生态融合型共享创新”新模式

    深圳探索“生态融合型共享创新”新模式 在这里,一批跨地域、跨领域的综合性国家科学平台先后落成;一批全球高精尖人才、顶级科学家在此汇聚;腾讯等一批龙头企业开放资源,与上下游企业协同发展,形成茂密雨林……为实现高水平科技自立自强、加快实施创新驱动发展战略,深圳正在探索一条“共享创新要素、构建生态融合型创新”的新路子。“与大国角力,不能单靠一个个‘指头’,更要握指…

  • 2022年游戏行业究竟有多惨?哀鸿遍野一地鸡毛

    2022年游戏行业究竟有多惨?哀鸿遍野一地鸡毛 对于游戏行业来说,2022年注定是一个难忘的年份。如果仅看半年数据,2022年上半年游戏市场总销售收入为1477.89亿元,仅比去年同期下降1.8%;但如果看季度数据,游戏市场总销售额已经连续三季度下降,并且在今年三季度降到了597.03亿元,直接梦回2年前。数据来源:中国游戏产业研究院&伽马数据(CN…

  • 干货还是噱头?国产游戏剑三引入光追技术后玩家真实感受

    干货还是噱头?国产游戏剑三引入光追技术后玩家真实感受   前些日子一个许久没有联系的一个女同学突然给我来了一串的信息轰炸。秋叶不由得一惊,无事不登三宝殿,毕业都好多年了现在找上门来莫不是求我办什么事情。三言两语的寒暄过后,同学终于表达了真实目的——“现在的电脑太卡了?想要我推荐电脑硬件?”在秋叶的印象中,她应该是那种和电脑硬件绝缘的性格才对。我还记得当时的她…

关注微信