数据学习
AI博客
原创AI博客
大模型技术博客
期刊会议
学术世界
期刊出版社
领域期刊
SCI/SCIE/SSCI/EI简介
期刊列表
会议列表
所有期刊分区
学术期刊信息检索
JCR期刊分区查询
CiteScore期刊分区查询
中科院期刊分区查询
管理 - UTD24期刊列表
管理 - AJG(ABS)期刊星级查询
管理 - FMS推荐期刊列表
计算机 - CCF推荐期刊会议列表
南大核心(CSSCI)
合工大小核心
合工大大核心
AI资源仓库
AI领域与任务
AI研究机构
AI学术期刊
AI论文快讯
AI数据集
AI开源工具
数据推荐
AI大模型
国产AI大模型生态全览
AI模型概览图
AI模型月报
AI基础大模型
AI大模型排行榜
大模型综合能力排行榜
大模型编程能力排行榜
LMSys ChatBot Arena排行榜
Berkeley大模型工具使用能力排行榜
OpenLLMLeaderboard中国站
AI大模型大全
大模型部署教程
在线聊天大模型列表
2023年度AI产品总结
Discovering Coherent Topics Using General Knowledge
小木
CIKM
2013-09
1837
2017/02/06 09:56:15
基于知识的主题模型依赖于领域知识,并假设其依赖的领域知识是正确的。然而,这种方法的一个主要的缺点是它需要用户对领域知识很了解,并能够提供相关的知识经验,这在实际中很难。在这篇文章中,作者提出了一个框架,利用了独立的领域知识。具体来说,作者使用的是一般性的知识,如单词的字典语义关系,如近义词、同义词、反义词和形容词属性等来提升主题的一致性。然而,这项工作一个最主要的困难时单词可能拥有不止一种含义。错误的知识会导致低质量的主题。为了处理这些错误的知识,作者提出了一种GK-LDA的方法,可以利用字典中的关系。GK-LDA是第一种引入独立的领域知识的模型。 基于知识的主题模型已经有很多了。这些模型主要是利用了专家领域知识来提高主题的质量。比如,DF-LDA使用了must-links和cannot-links两种知识。先验知识在这些模型中通常都是领域依赖的。对于不同的应用,需要有不同的领域知识。他们都假设在实际中用户对领域知识了解比较多。然而这显然不实际。这篇文章中,作者主要使用了同义词、反义词和形容词属性来加强模型的效果。这里形容词属性是指一个形容某个名词的形容词,比如expensive通常是形容price的形容词。 首先作者说明了他们是如何表达这些字典关系的。作者是以集合的形式表达如:同义词:{expensive,pricey},反义词:{expensive,cheap},形容词属性:{expensive,price}。在作者的系统中,同义词和反义词是从wordnet中抽取的,形容词属性则是从在线词典中获得的。在此之前,作者提过了一种叫MDK-LDA的模型来处理多领域的知识,然而这种模型却不能处理错误的知识。在这个模型中,作者使用了一个经过人工验证的LR集合(一般知识的集合),作者在LDA中加了一个隐变量s来确保模型可以选择正确的LR集合。作者的这篇文章主要基于MDK-LDA工作的进一步深化。
赏
支付宝扫码打赏
如果文章对您有帮助,欢迎打赏鼓励作者
Back to Top