两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全

发布日期:2024-11-13 13:21

来源类型:毒舌小红帽 | 作者:Saloni

阅读提醒: 【新智元导读】上海大学本科生研发的新框架能有效应对知识图谱补全中的灾难性遗忘和少样本学习难题,提升模型在动态环境和数据稀缺场景下的应用能力。这项研究不仅推动了领域发展,也为实际应用提供了宝贵参考。 ...
【2024新澳天天资料免费大全】 【2024新奥免费资料】 【澳门最精准免费资料大全旅游团】 【2024年新澳门天天彩开彩结果】 【2024澳门天天六开奖彩免费】 【新澳门正版资料大全精准】 【新澳新澳门正版资料】 【澳门正版全年资料期期准】 【澳门单双期期准】 【2024年澳门精准免费大全】 【2024新澳精准资料大全】 【2024新奥资料免费精准175】 【2024新澳门天天六开好彩大全】

【新智元导读】上海大学本科生研发的新框架能有效应对知识图谱补全中的灾难性遗忘和少样本学习难题,提升模型在动态环境和数据稀缺场景下的应用能力。这项研究不仅推动了领域发展,也为实际应用提供了宝贵参考。

知识图谱(Knowledge Graphs)是一种结构化的,用于展示和管理信息,组织现实世界知识的形式。其通常被表达为三元组形式(<头实体,关系,尾实体>)。KGs 为问答系统、推荐系统和搜索引擎等各种实际应用提供了极其重要支持。

然而现有知识图谱的显著不完整性严重限制了其在实际应用中的有效性。

同时,在现实实际应用中,知识图谱中的关系呈现长尾分布,即大多数关系只有少量相关的三元组。这种稀缺导致了模型对于长尾关系的泛化能力不足,从而使得知识图谱补全模型的整体效果较差 (Few-shot Learning) 。

进一步,随着时间的推演,越来越多的新关系被添加到关系集中,并在不同时间点集成到知识图谱中。这意味着模型不仅需要学习当前阶段的知识更需要记住在之前阶段学习过的知识 (Continual Learning) 。

最近,上海大学的本科生李卓风、张灏翔(第一作者以及共同第一作者)在信息检索和数据挖掘领域顶级学术会议CIKM 2024上发表了一篇文章,首次提出了在持续学习 (Continual Learning) 和少样本 (Few-shot) 的场景下对知识图谱进行补全,提供了一套全面且有效的框架来处理这一问题。

论文标题:Learning from Novel Knowledge: Continual Few-shot Knowledge Graph Completion

论文链接:https://dl.acm.org/doi/10.1145/3627673.3679734

代码链接:https://github.com/cfkgc-paper/CFKGC-paper/tree/main

该研究的发表将有助于提高知识图谱补全(KGC)模型在实际应用中的泛化能力,使其能够更好地适应动态环境和数据稀缺的场景,从而推动相关领域的应用发展。

通过提供有效的解决方案,本研究为后续研究奠定了基础,同时也为实际应用提供了重要的参考。

研究背景

目前在持续学习 (Continual Learning) 和少样本 (Few-shot) 的场景下对知识图谱进行补全面临两大挑战:

1. 灾难性遗忘问题,即模型在不断学习新关系时,对之前学到的关系的推理性能下降。这会导致模型退化和对稀有关系的推断能力大幅减弱。

2. 新关系的稀缺导致模型在稀有关系上的泛化能力不足。

为解决这些挑战,该研究提出了一个完整且有效的知识图谱补全框架,以适应不断出现的少量的关系。

1. 为了解决灾难性遗忘问题,研究人员从数据和模型两个维度入手。

在数据层面,通过特定的指标评估每个三元组在知识图谱中的重要性,包括拓扑感知和关系异质感知系数;利用这些重要性得分,可以识别出并存储来自最重要的三元组;这些缓存的三元组可以在优化过程中重放,以应对新关系的出现,确保模型回忆起最重要的知识。

在模型层面,研究人员实施了一种参数冻结的策略。在每个阶段,模型会识别与当前任务相关的一个模型子网络,并将其冻结,从而有效减轻遗忘问题。

2. 为了解决关系的稀缺导致模型在稀有关系上的泛化能力不足的问题,研究人员引入了一种多视角关系增强技术。该方法通过自监督学习提升模型的泛化能力。

技术方法

三元组的记忆回放

为了缓解灾难性遗忘问题,研究人员从数据和模型两个层面提出了解决方案。在数据层面,通过特别设计的指标来评估每个实体的重要性,并在内存中存储最重要的三元组。

这些缓存的三元组可以在新关系出现时进行重播,以确保模型能够回忆起最重要的知识。

具体来说,从两个角度评估实体的重要程度:

1. 拓扑感知重要度。在知识图谱中,一个实体的重要性应当由与其相连的其他实体的重要性共同决定。

其中du表示实体u的出边数量,N(v)表示实体v在Gr中的邻居集合。

是实体v的最终拓扑感知重要性得分。

2. 除了拓扑结构外,还考虑了实体参与关系的多样性,即关系异质性感知重要度:

其中|Rv|表示实体v连接的不同关系数量。

最终,可以计算三元组的重要性分数:

元学习器的调制

文中进一步在模型层面实施了参数调制策略来保存最重要的参数。

具体来说,首先使用权重分数s来衡量网络参数的重要性:

然后,通过下面的优化公式来更新模型参数:

θ是元学习器参数,Qr代表关系集,

是学习率,

表示之前会话中识别的子网络掩码的并集。

通过这种参数调制机制,可以在学习新任务时保护已获得的重要知识,从而有效缓解灾难性遗忘问题。

增强少样本和自监督学习

通过引入基于自监督的多视图关系增强技术来增强模型的泛化能力,通过两种扰动方式生成关系的不同视图。

1. 元学习器参数扰动:

2. 输入实体嵌入扰动:

然后通过对比学习损失来优化:

其中τ是温度参数,

一个 Batch 之内的关系集。

分别代表经过1或者2扰动之后生成的关系。

实验结果

研究人员在 NELL-ONE 和 Wiki-ONE 两个数据集上对模型进行持续学习以及小样本学习的全面验证。

持续学习能力

该框架在持续学习方面的表现,与基线模型相比,能够显著减轻灾难性遗忘,且该模型不仅能有效保留先前会话的知识,还在后续会话中表现出更好的性能。该框架相对于基线模型,在减轻灾难性遗忘方面显示出显著优势。

例如,在NELL-One数据集中,方法在后续任务(Task1至Task7)中,平均比第二佳的基线方法改进了+13.3%,而在Wiki-One数据集中,平均改进为+27.0%。这表明该模型不仅有效地保留了之前学习会话的知识,还在随后的学习任务中展示了更优越的性能。

少样本学习能力

在快速适应新的学习进程中的未见关系时,模型能够维持稳定或增强的少样本学习性能。

相反,基线模型由于每个新会话中元任务数量有限,表现出明显的性能下降。这进一步证明了提出的多视角关系增强策略在解决与元任务稀缺相关的过拟合问题中的有效性。

模型在少样本学习方面显示了出色的性能,特别是在快速适应未见关系的新学习环境中。

以NELL-One数据集为例,MRR指标相较于第一个task(11.1%),模型在最后一个任务中表现出11.35%的性能,期间最高达到12.55%。

在Wiki-One数据集中,从基线的38.9%提高到了最后一个任务的40.05%,相对于其他的方法——随着更新的知识的学习,小样本性能也在下降,模型实现了对于更好的小样本学习性能的保持。

结果验证了所提出的多视角关系增强策略在缓解元任务稀缺导致的过拟合问题上的高效性。

结果表明模型不仅可以充分记住先前阶段的知识同时还可以有效学习新的知识。

消融实验

总结

本篇文章探讨了在持续学习以及少量样本的场景下对知识图谱补全的问题,提出了一种全面且有效的框架,旨在应对灾难性遗忘以及少样本带来的挑战。

该方案包括三元组重演策略,模型参数调制策略,多视角关系增强策略。该研究的发表将有助于提高知识图谱补全(KGC)模型在实际应用中的泛化能力,使其能够更好地适应动态环境和数据稀缺的场景,从而推动相关领域的应用发展。

通过提供有效的解决方案,本研究为后续研究奠定了基础,同时也为实际应用提供了重要的参考。

参考资料:

https://dl.acm.org/doi/10.1145/3627673.3679734

【澳门正版资料大全】 【2024新澳资料大全】 【新澳天天彩免费资料大全特色】 【新澳2024年精准特马资料】 【新澳免费资料大全正版资料下载】 【7777788888王中王中特】 【二四六管家婆期期准资料】 【7777788888新澳门】 【2024新奥正版资料】 【7777788888新澳】 【新澳好彩免费资料大全】 【2024年资料免费大全】 【新澳门精准全年资料免费】 【2024全年资料免费大全】
【新澳2024最新资料大全】 【600图库大全免费资料图2024】 【2024新澳免费资料大全浏览器】 【澳门正版资料大全免费网】 【新澳门六开彩开奖结果2024年】 【新澳2024最新资料】 【新澳天天开奖资料大全】 【新澳门免费原料网大全】 【2024正板资料免费公开】 【新澳最精准免费资料大全】 【2024全年免费资料大全】 【新澳天天开奖资料大全旅游攻略】 【澳门今晚开特马+开奖结果走势图】 【2024新澳最快最新资料】

下载中心

视频封面

视频名称:他山之石 海南省海口市:文明实践志愿服务让爱更有力量

大小: 3.2GB 下载:(515664) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:黑龙江老师把8岁学生打成偏瘫,掏40万私了遭拒,法院判决申正义美国版东鹏特饮:年入300亿,却被中国正主暴揍!

大小: 1.2GB 下载:(741960) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:净利同比增近八成!五大上市险企前三季度业绩报喜

大小: 1.7GB 下载:(853229) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:《再见爱人》画师澄清:未给黄圣依画痣

大小: 5.3GB 下载:(141903) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:黑神话悟空发售日期什么时候?你所期待的终于要来了。

大小: 7.2GB 下载:(751225) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:3种食物,或许会让胃越来越“虚弱”,不少人都在吃

大小: 3.4GB 下载:(389141) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:王鹤棣若演将门毒后?网友:还是先去“进修”演技吧!?

大小: 8.4GB 下载:(562260) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:科思创全球高级副总裁雷焕丽:进博会是一个开放包容的“超级平台”

大小: 3.9GB 下载:(519320) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:一天5瓜,叶柯退网,刘宇宁赵露思合体营业引热议,都是大瓜拉低行业档次?理发师晓华爆火后回应

大小: 2.9GB 下载:(184133) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:螃蟹+柿子=中毒?误区!这4个部位才真的不建议你吃邓颖超读书时的一张罕见照片,戴着眼镜,气质不凡

大小: 8.3GB 下载:(728951) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:太可惜了!郑钦文总决赛1-2不敌高芙,屈居亚军,不过已经很棒了

大小: 3.8GB 下载:(577561) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:“中方对此强烈不满和坚决反对,并已向英方提出严正交涉”

大小: 6.3GB 下载:(262517) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:消费早参|喜茶跨界合作草间弥生;霸王茶姬上海首家高校店开业;幸运咖门店突破4000家

大小: 6.5GB 下载:(600836) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:再见爱人4于不想离婚的中年夫妻李行亮、麦琳来说是场奢侈的旅游

大小: 5.5GB 下载:(444596) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:邓超孙俪一家四口同框,网友直呼:颜值逆天,羡慕嫉妒哭晕在厕所

大小: 9.6GB 下载:(959692) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:沈月林一主演的《失笑》将袭,男主冷漠女主搞笑,能成爆款吗?

大小: 5.1GB 下载:(391973) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:一起针对美国最高法院大法官的谋杀

大小: 7.3GB 下载:(150787) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:社保基金武建力:养老金对权益市场投资比例为10%,远低于国际水平

大小: 5.8GB 下载:(546928) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:买智能马桶必看的9个要点和9个误区,真实经验分享朱小伟首次晒5个月儿子正脸照,简直就是他的缩小版,评论区沦陷

大小: 7.2GB 下载:(636964) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:“两弹一星”元勋孙家栋:核心技术是买不来的,必须依靠自己

大小: 1.4GB 下载:(250801) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:潍坊青州:巧手剪龙 剪出“龙”年好兆头

大小: 3.4GB 下载:(312884) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:不捧不踩,《再见爱人》里的3对夫妻,最最核心的问题就3个

大小: 9.2GB 下载:(152073) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中国共产党百年法治思想的主要内容、特点与经验

大小: 4.4GB 下载:(892764) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:今冬将成俄乌冲突分水岭? 特朗普胜选后俄乌加速“抢地盘”,东线一天内107起冲突

大小: 1.1GB 下载:(398304) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:直接安排10万亿元,地方化债担子轻了!

大小: 3.6GB 下载:(499676) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:Kliu|乌克兰:如果特朗普撂摊子怎么办?

大小: 1.4GB 下载:(974727) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:披荆斩棘4最新消息:赛制曝光,一口气看完初舞台和个人秀歌单3年前,宁夏7岁小女孩一笑走红,后拒百万签约,如今怎么样了?

大小: 7.6GB 下载:(224221) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:开封向夜间骑行大学生喊话:要激情更要平安举全社会之力的后勤保

大小: 1.8GB 下载:(352418) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:深度加码肿瘤放射治疗,百洋医药与全球放疗引领者ZAP达成深度合作

大小: 7.1GB 下载:(611544) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:奥迪发布新品牌AUDI 概念车E concept发布

大小: 4.3GB 下载:(885797) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:东盟观察丨美联储利率“两连降”后亚太股市震荡企稳,泰国和菲律宾料将降息刺激经济85岁马玉琴嫁给小32岁丈夫,身穿破棉衣,李玉成却穿貂开豪车

大小: 8.6GB 下载:(572795) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)

评论

打开APP查看57条评论

常玲

6秒前

该研究的发表将有助于提高知识图谱补全(KGC)模型在实际应用中的泛化能力,使其能够更好地适应动态环境和数据稀缺的场景,从而推动相关领域的应用发展。

蔡升晏

2分钟前

这种稀缺导致了模型对于长尾关系的泛化能力不足,从而使得知识图谱补全模型的整体效果较差 (Few-shot Learning) 。

多罗泰·热玛

9天前

表示之前会话中识别的子网络掩码的并集。

发表您的评论: