科研数据共享列表

这里,我们将推荐一些数据及提供数据的网站。如果您也有好的网站或者资料愿意分享,欢迎注册登录之后与大家一起分享。感谢您的参与!

如果您有数据的需求,我们也提供有偿爬虫的服务。请发送邮件至datalearner at aliyun.com 咨询。

注:数据来源个人用户分享,本站不提供数据下载,下载地址来源于第三方。数据仅限于科研使用,请不要将数据用于违反法律、法规和社会道德的地方。

数据名称 数据描述 下载地址
1000个微博用户信息及其发表的微博 这是来自新浪微博的1000个用户的基本信息以及他们发表的微博内容。个人信息包括性别、地域、标签、关注数量、粉丝数量等等。微博内容则包括内容、转发数、评论数等。 请登录
IMDB1994-2015年电影数据(包括评价、票房信息等) IMDB1994-2015年电影数据(包括评价、票房信息等) 请登录
新浪微博分类数据集 此数据集为新浪微博中的100名用户在2012年1月13日至2012年1月20日期间所看到的微博。作者对每个用户发表的微博打了标签,所以这是一个带标签的微博数据集。 请登录
Event-based Social Networks数据集 meetup.com事件数据,有用户信息,参与的事件信息,事件发生的地点信息 请登录
用户意图数据 这是一个包含了用户意图的数据,它是用户查询siri等助手的数据,包含了用户的查询和用户的真实意图等。 请登录
LastFM的歌手标签数据 这是LastFM的用户对歌手打的标签数据集。 请登录
LastFM用户听歌信息 LastFM用户信息,包含了用户听的歌曲,听的专辑,关注粉丝列表等信息。 请登录
带标签的热门微博数据 这是从热门微博上爬到的数据,一个文件,两列,第一列表示热门微博的官方分类,第二个是热门微博的内容 请登录