KnowGL——一个可以将文本转换成结构化数据的强大模型

标签:文本生成 时间:2022-11-26 21:29:46.482 发布者:小木

论文名:KnowGL: Knowledge Generation and Linking from Text
发布时间:2022-10
论文地址:https://arxiv.org/abs/2210.13952
代码地址:https://huggingface.co/ibm/knowgl-large

原文摘要:我们提出了KnowGL,这是一个可以将文本转换为结构化的关系数据的工具,该数据表示为一组符合给定知识图谱(KG)的TBox断言,如维基数据。我们通过利用预先训练好的序列到序列的语言模型,如BART,将这个问题作为一个序列生成任务来解决。给定一个句子,我们对这些模型进行微调,以检测成对的实体提及,并共同生成一组事实,其中包括KG的全套语义注释,如实体标签、实体类型及其关系。为了展示我们的工具的能力,我们建立了一个由一组用户界面部件组成的网络应用程序,帮助用户浏览从特定输入文本中提取的语义数据。我们在这个https URL上提供了KnowGL模型。