SIGKDD(KDD) 2011论文列表 - Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego, CA, USA, August 21-24, 2011.| 数据学习 (DataLearner)

SIGKDD(KDD) 2011 论文列表

Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego, CA, USA, August 21-24, 2011.

Web information extraction using markov logic networks.

Sandeepkumar Satpal Sahely Bhadra Sundararajan Sellamanickam Rajeev Rastogi Prithviraj Sen

User-level sentiment analysis incorporating social networks.

Chenhao Tan Lillian Lee Jie Tang Long Jiang Ming Zhou Ping Li

User-click modeling for understanding and predicting search-behavior.

Yuchen Zhang Weizhu Chen Dong Wang Qiang Yang

Towards bounding sequential patterns.

Chedy Raïssi Jian Pei

ThermoCast: a cyber-physical forecasting model for datacenters.

Lei Li Chieh-Jan Mike Liang Jie Liu Suman Nath Andreas Terzis Christos Faloutsos

Temporal multi-hierarchy smoothing for estimating rates of rare events.

Nagaraj Kota Deepak Agarwal

Spatially regularized logistic regression for disease mapping on large moving populations.

Vuk Malbasa Slobodan Vucetic

Serendipitous learning: learning beyond the predefined label space.

Dan Zhang Yan Liu Luo Si

Scalable kNN search on vertically stored time series.

Shrikant Kashyap Panagiotis Karras

Sampling hidden objects using nearest-neighbor oracles.

Nilesh N. Dalvi Ravi Kumar Ashwin Machanavajjhala Vibhor Rastogi

Revisiting sequential pattern hiding to enhance utility.

Aris Gkoulalas-Divanis Grigorios Loukides

Real-time bidding algorithms for performance-based display ad allocation.

Ye Chen Pavel Berkhin Bo Anderson Nikhil R. Devanur

Ranking-based classification of heterogeneous information networks.

Ming Ji Jiawei Han Marina Danilevsky

Protecting location privacy using location semantics.

Byoungyoung Lee Jinoh Oh Hwanjo Yu Jong Kim

Prominent streak discovery in sequence data.

Xiao Jiang Chengkai Li Ping Luo Min Wang Yong Yu

Probabilistic topic models with biased propagation on heterogeneous information networks.

Hongbo Deng Jiawei Han Bo Zhao Yintao Yu Cindy Xide Lin

Privacy-preserving social network publication against friendship attacks.

Chih-Hua Tai Philip S. Yu De-Nian Yang Ming-Syan Chen

Personal privacy vs population privacy: learning to attack anonymization.

Graham Cormode

Ontology enhancement and concept granularity learning: keeping yourself current and adaptive.

Shan Jiang Lidong Bing Bai Sun Yan Zhang Wai Lam

On the privacy of anonymized networks.

Pedram Pedarsani Matthias Grossglauser

On dynamic data-driven selection of sensor streams.

Charu C. Aggarwal Yan Xie Philip S. Yu

MultiRank: co-ranking for objects and relations in multi-relational data.

Michael Kwok-Po Ng Xutao Li Yunming Ye

Multi-view transfer learning with a large margin approach.

Dan Zhang Jingrui He Yan Liu Luo Si Richard D. Lawrence

Mining partially annotated images.

Zhongang Qi Ming Yang Zhongfei (Mark) Zhang Zhengyou Zhang

Mining mobility user profiles for car pooling.

Roberto Trasarti Fabio Pinelli Mirco Nanni Fosca Giannotti

Mining mobility data to minimise travellers' spending on public transport.

Neal Lathia Licia Capra

Mining closed episodes with simultaneous events.

Nikolaj Tatti Boris Cule

Meta optimization and its application to portfolio selection.

Puja Das Arindam Banerjee

Logical-shapelets: an expressive primitive for time series classification.

Abdullah Mueen Eamonn J. Keogh Neal E. Young

Latent graphical models for quantifying and predicting patent quality.

Yan Liu Pei-yun Hseuh Rick Lawrence Steve Meliksetian Claudia Perlich Alejandro Veen

Incorporating SAT solvers into hierarchical clustering algorithms: an efficient and flexible approach.

Sean Gilpin Ian N. Davidson

INCONCO: interpretable clustering of numerical and categorical objects.

Claudia Plant Christian Böhm

Improving predictions using aggregate information.

Amit Dhurandhar

I want to answer; who has a question?: Yahoo! answers recommender system.

Gideon Dror Yehuda Koren Yoelle Maarek Idan Szpektor

Human mobility, social ties, and link prediction.

Dashun Wang Dino Pedreschi Chaoming Song Fosca Giannotti Albert-László Barabási

GBASE: a scalable and general graph management system.

U Kang Hanghang Tong Jimeng Sun Ching-Yung Lin Christos Faloutsos

Friendship and mobility: user movement in location-based social networks.

Eunjoon Cho Seth A. Myers Jure Leskovec

Fast locality-sensitive hashing.

Anirban Dasgupta Ravi Kumar Tamás Sarlós

Fast coordinate descent methods with variable selection for non-negative matrix factorization.

Cho-Jui Hsieh Inderjit S. Dhillon

Fast approximate similarity search based on degree-reduced neighborhood graphs.

Kazuo Aoyama Kazumi Saito Hiroshi Sawada Naonori Ueda

Exploiting place features in link prediction on location-based social networks.

Salvatore Scellato Anastasios Noulas Cecilia Mascolo

Entity disambiguation with hierarchical topic models.

Saurabh Kataria Krishnan S. Kumar Rajeev Rastogi Prithviraj Sen Srinivasan H. Sengamedu

Diversified ranking on large graphs: an optimization viewpoint.

Hanghang Tong Jingrui He Zhen Wen Ravi B. Konuru Ching-Yung Lin

Display advertising impact: search lift and social influence.

Panagiotis Papadimitriou Hector Garcia-Molina Prabhakar Krishnamurthy Randall A. Lewis David H. Reiley

Discovering spatio-temporal causal interactions in traffic data streams.

Wei Liu Yu Zheng Sanjay Chawla Jing Yuan Xing Xie

Discovering shakers from evolving entities via cascading graph inference.

Xiaoxiao Shi Wei Fan Jianping Zhang Philip S. Yu

Discovering highly reliable subgraphs in uncertain graphs.

Ruoming Jin Lin Liu Charu C. Aggarwal

Cost-aware travel tour recommendation.

Yong Ge Qi Liu Hui Xiong Alexander Tuzhilin Jian Chen

Content-driven trust propagation framework.

V. G. Vinod Vydiswaran ChengXiang Zhai Dan Roth

Compression of weighted graphs.

Hannu Toivonen Fang Zhou Aleksi Hartikainen Atte Hinkka

Common component analysis for multiple covariance matrices.

Huahua Wang Arindam Banerjee Daniel Boley

Clustering with relative constraints.

Eric Yi Liu Zhaojun Zhang Wei Wang

Classification of functional magnetic resonance imaging data using informative pattern features.

Francisco Pereira Matthew Botvinick

Brain effective connectivity modeling for alzheimer's disease by sparse gaussian bayesian network.

Shuai Huang Jing Li Jieping Ye Adam Fleisher Kewei Chen Teresa Wu Eric Reiman

Axiomatic ranking of network role similarity.

Ruoming Jin Victor E. Lee Hui Hong

Automatically tagging email by leveraging other users' folders.

Yehuda Koren Edo Liberty Yoelle Maarek Roman Sandler

Ask me better questions: active learning queries based on rule induction.

Parisa Rashidi Diane J. Cook

Approximate kernel k-means: solution to large scale kernel clustering.

Radha Chitta Rong Jin Timothy C. Havens Anil K. Jain

Anomaly localization for network data streams with graph joint sparse PCA.

Ruoyi Jiang Hongliang Fei Jun Huan

An iterated graph laplacian approach for ranking on manifolds.

Xueyuan Zhou Mikhail Belkin Nathan Srebro

An effective evaluation measure for clustering on evolving data streams.

Hardy Kremer Philipp Kranen Timm Jansen Thomas Seidl Albert Bifet Geoff Holmes Bernhard Pfahringer

Algorithms for speeding up distance-based outlier detection.

Kanishka Bhaduri Bryan L. Matthews Chris Giannella

Active learning using on-line algorithms.

Chris Mesterharm Michael J. Pazzani

Active learning for node classification in assortative and disassortative networks.

Cristopher Moore Xiaoran Yan Yaojia Zhu Jean-Baptiste Rouquier Terran Lane

A time-dependent topic model for multiple text streams.

Liangjie Hong Byron Dom Siva Gurumurthy Kostas Tsioutsiouliklis

A simple statistical model and association rule filtering for classification.

György J. Simon Vipin Kumar Peter W. Li

A multi-task learning formulation for predicting disease progression.

Jiayu Zhou Lei Yuan Jun Liu Jieping Ye

A GPU-tailored approach for training kernelized SVMs.

Andrew Cotter Nathan Srebro Joseph Keshet

A game theoretic framework for heterogenous information network clustering.

Faris Alqadah Raj Bhatnagar

2D-interval predictions for time series.

Luís Torgo Orlando Ohashi

Thriving as a data miner in the real world.

John F. Elder IV

The practitioner's viewpoint to data mining: key lessons learned in the trenches and case studies.

Richard Boire

The power of analysis and data.

David Norton

Real-time risk control system for CNP (card not present).

Tai Hsu

Operational security analytics: doing more with less.

Colleen McCue

Knowledge discovery and data mining in pharmaceutical cancer research.

Paul A. Rejto

Broad scale predictive modeling and marketing optimization in retail sales.

Dan Steinberg Felipe Fernandez Martinez

Applications of data mining and machine learning in online customer care.

Ravi Vijayaraghavan P. V. Kannan

Accelerating large-scale data mining using in-database analytics.

Mario E. Inchiosa

"Which half Is wasted?": controlled experiments to measure online-advertising effectiveness.

David H. Reiley

Video analytics solution for tracking customer locations in retail shopping malls.

Harikrishna G. N. Rai Kishore Jonna P. Radha Krishna

Topic-level social network search.

Jie Tang Sen Wu Bo Gao Yang Wan

Social flocks: a crowd simulation framework for social network generation, community detection, and collective behavior modeling.

Cheng-Te Li Shou-De Lin

SIGKDD demo: sensors and software to allow computational entomology, an emerging application of data mining.

Gustavo E. A. P. A. Batista Eamonn J. Keogh Agenor Mafra-Neto Edgar Rowton

MIME: a framework for interactive visual pattern mining.

Bart Goethals Sandy Moens Jilles Vreeken

LikeMiner: a system for mining the power of 'like' in social media networks.

Xin Jin Chi Wang Jiebo Luo Xiao Yu Jiawei Han

Frontex real-time news event extraction framework.

Jakub Piskorski Martin Atkinson

Data intensive analysis on the gordon high performance data and compute system.

Robert S. Sinkovits Pietro Cicotti Shawn Strande Mahidhar Tatineni Paul Rodríguez Nicole Wolter Natasha Balac

Article clipper: a system for web article extraction.

Jian Fan Ping Luo Suk Hwan Lim Sam Liu Joshi Parag Jerry Liu

Apolo: interactive large graph sensemaking by combining machine learning and visualization.

Duen Horng Chau Aniket Kittur Jason I. Hong Christos Faloutsos

A taxi business intelligence system.

Yong Ge Chuanren Liu Hui Xiong Jian Chen

Two-locus association mapping in subquadratic time.

Panagiotis Achlioptas Bernhard Schölkopf Karsten M. Borgwardt

Multi-source domain adaptation and its application to early detection of fatigue.

Rita Chattopadhyay Jieping Ye Sethuraman Panchanathan Wei Fan Ian Davidson

Bounded coordinate-descent for biological sequence classification in high dimensional predictor space.

Georgiana Ifrim Carsten Wiuf

Selective block minimization for faster convergence of limited memory large-scale linear models.

Kai-Wei Chang Dan Roth

Clustering very large multi-dimensional datasets with MapReduce.

Robson Leonardo Ferreira Cordeiro Caetano Traina Jr. Agma Juci Machado Traina Julio César López-Hernández U Kang Christos Faloutsos

Fast clustering using MapReduce.

Alina Ene Sungjin Im Benjamin Moseley

Triangle listing in massive networks and its applications.

Shumo Chu James Cheng

It's who you know: graph mining using recursive structural features.

Keith Henderson Brian Gallagher Lei Li Leman Akoglu Tina Eliassi-Rad Hanghang Tong Christos Faloutsos

Dual active feature and sample selection for graph classification.

Xiangnan Kong Wei Fan Philip S. Yu

Online heterogeneous mixture modeling with marginal and copula selection.

Ryohei Fujimaki Yasuhiro Sogawa Satoshi Morinaga

Unsupervised clustering of multidimensional distributions using earth mover distance.

David L. Applegate Tamraparni Dasu Shankar Krishnan Simon Urbanek

Density estimation trees.

Parikshit Ram Alexander G. Gray

Latent aspect rating analysis without aspect keyword supervision.

Hongning Wang Yue Lu ChengXiang Zhai

Localized factor models for multi-context recommendation.

Deepak Agarwal Bee-Chung Chen Bo Long

Latent topic feedback for information retrieval.

David Andrzejewski David Buttler

Mining frequent closed graphs on evolving data streams.

Albert Bifet Geoff Holmes Bernhard Pfahringer Ricard Gavaldà

Direct local pattern sampling by efficient two-step random procedures.

Mario Boley Claudio Lucchese Daniel Paurat Thomas Gärtner

Tell me what i need to know: succinctly summarizing data with itemsets.

Michael Mampaey Nikolaj Tatti Jilles Vreeken

An information theoretic framework for data mining.

Tijl De Bie

Leakage in data mining: formulation, detection, and avoidance.

Shachar Kaufman Saharon Rosset Claudia Perlich

Stackelberg games for adversarial prediction problems.

Michael Brückner Tobias Scheffer

Leveraging collaborative tagging for web item design.

Mahashweta Das Gautam Das Vagelis Hristidis

Sparsification of influence networks.

Michael Mathioudakis Francesco Bonchi Carlos Castillo Aristides Gionis Antti Ukkonen

On the semantic annotation of places in location-based social networks.

Mao Ye Dong Shou Wang-Chien Lee Peifeng Yin Krzysztof Janowicz

Exploiting vulnerability to secure user privacy on a social networking site.

Pritam Gundecha Geoffrey Barbier Huan Liu

k-NN as an implementation of situation testing for discrimination discovery and prevention.

Binh Luong Thanh Salvatore Ruggieri Franco Turini

Differentially private data release for data mining.

Noman Mohammed Rui Chen Benjamin C. M. Fung Philip S. Yu

Tracking trends: incorporating term volume into temporal topic models.

Liangjie Hong Dawei Yin Jian Guo Brian D. Davison

Conditional topical coding: an efficient topic model conditioned on rich features.

Jun Zhu Ni Lao Ning Chen Eric P. Xing

Refining causality: who copied from whom?

Tristan Mark Snowsill Nick Fyson Tijl De Bie Nello Cristianini

Partially labeled topic models for interpretable text mining.

Daniel Ramage Christopher D. Manning Susan T. Dumais

Collaborative topic modeling for recommending scientific articles.

Chong Wang David M. Blei

Beyond keyword search: discovering relevant scientific literature.

Khalid El-Arini Carlos Guestrin

Democrats, republicans and starbucks afficionados: user classification in twitter.

Marco Pennacchiotti Ana-Maria Popescu

Smoothing techniques for adaptive online language models: topic tracking in tweet streams.

Jimmy Lin Rion Snow William Morgan

Predictive client-side profiles for personalized advertising.

Mikhail Bilenko Matthew Richardson

Matching unstructured product offers to structured product specifications.

Anitha Kannan Inmar E. Givoni Rakesh Agrawal Ariel Fuxman

Toward personalized care management of patients at risk: the diabetes case study.

Hani Neuvirth Michal Ozery-Flato Jianying Hu Jonathan Laserson Martin S. Kohn Shahram Ebadollahi Michal Rosen-Zvi

Detecting bots via incremental LS-SVM learning with dynamic feature adaptation.

Feilong Chen Supranamaya Ranjan Pang-Ning Tan

A case study in a recommender system based on purchase data.

Bruno Pradel Savaneary Sean Julien Delporte Sébastien Guérif Céline Rouveirol Nicolas Usunier Françoise Fogelman-Soulié Frédéric Dufau-Joël

Understanding atrophy trajectories in alzheimer's disease using association rules on MRI images.

György J. Simon Peter W. Li Clifford R. Jack Jr. Prashanthi Vemuri

Experiences with mining temporal event sequences from electronic medical records: initial successes and some challenges.

Debprakash Patnaik Patrick Butler Naren Ramakrishnan Laxmi Parida Benjamin J. Keller David A. Hanauer

Ameliorating buyer's remorse.

Rakesh Agrawal Samuel Ieong Raja Velu

Classification of proxy labeled examples for marketing segment generation.

Dean Cerrato Rosie Jones Avinash Gupta

NIMBLE: a toolkit for the implementation of parallel data mining and machine learning algorithms on mapreduce.

Amol Ghoting Prabhanjan Kambadur Edwin P. D. Pednault Ramakrishnan Kannan

Interactive learning for efficiently detecting errors in insurance claims.

Rayid Ghani Mohit Kumar

Driving with knowledge from the physical world.

Jing Yuan Yu Zheng Xing Xie Guangzhong Sun

A pattern discovery approach to retail fraud detection.

Prasad Gabbur Sharath Pankanti Quanfu Fan Hoang Trinh

From market baskets to mole rats: using data mining techniques to analyze RFID data describing laboratory animal behavior.

Daniel P. McCloskey Michael E. Kress Susan P. Imberman Igor Kushnir Susan Briffa-Mirabella

Enhancing investment decisions in P2P lending: an investor composition perspective.

Chunyu Luo Hui Xiong Wenjun Zhou Yanhong Guo Guishi Deng

Applying data mining techniques to address disaster information management challenges on mobile devices.

Li Zheng Chao Shen Liang Tang Tao Li Steven Luis Shu-Ching Chen

Detecting adversarial advertisements in the wild.

D. Sculley Matthew Eric Otey Michael Pohl Bridget Spitznagel John Hainsworth Yunkai Zhou

Bid landscape forecasting in online ad exchange marketplace.

Ying Cui Ruofei Zhang Wei Li Jianchang Mao

Data-driven multi-touch attribution models.

Xuhui Shao Lexin Li

Estimating the number of users behind ip addresses for combating abusive traffic.

Ahmed Metwally Matt Paduano

Activity analysis based on low sample rate smart meters.

Feng Chen Jing Dai Bingsheng Wang Sambit Sahu Milind R. Naphade Chang-Tien Lu

High-precision phrase-based document classification on a modern scale.

Ron Bekkerman Matan Gavish

Combining file content and file relations for cloud based malware detection.

Yanfang Ye Tao Li Shenghuo Zhu Weiwei Zhuang Egemen Tas Umesh Gupta Melih Abdulhayoglu

Linear scale semantic mining algorithms in microsoft SQL server's semantic platform.

Kunal Mukerjee Todd Porter Sorin Gherman

Learning to trade off between exploration and exploitation in multiclass bandit prediction.

Hamed Valizadegan Rong Jin Shijun Wang

Unbiased online active learning in data streams.

Wei Chu Martin Zinkevich Lihong Li Achint Thomas Belle L. Tseng

Online active inference and learning.

Josh Attenberg Foster J. Provost

Enabling fast prediction for ensemble models on data streams.

Peng Zhang Jun Li Peng Wang Byron J. Gao Xingquan Zhu Li Guo

Selecting a comprehensive set of reviews.

Panayiotis Tsaparas Alexandros Ntoulas Evimaria Terzi

User reputation in a comment rating environment.

Bee-Chung Chen Jian Guo Belle L. Tseng Jie Yang

From bias to opinion: a transfer-learning approach to real-time sentiment analysis.

Pedro Henrique Calais Guerra Adriano Veloso Wagner Meira Jr. Virgílio A. F. Almeida

Response prediction using collaborative filtering with hierarchies and side-information.

Aditya Krishna Menon Krishna Prasad Chitrapura Sachin Garg Deepak Agarwal Nagaraj Kota

Click shaping to optimize multiple objectives.

Deepak Agarwal Bee-Chung Chen Pradheep Elango Xuanhui Wang

Multiple domain user personalization.

Yucheng Low Deepak Agarwal Alexander J. Smola

Scalable distributed inference of dynamic user interests for behavioral targeting.

Amr Ahmed Yucheng Low Mohamed Aly Vanja Josifovski Alexander J. Smola

Benefits of bias: towards better characterization of network sampling.

Arun S. Maiya Tanya Y. Berger-Wolf

Semi-supervised ranking on very large graphs with rich metadata.

Bin Gao Tie-Yan Liu Wei Wei Taifeng Wang Hang Li

Collective graph identification.

Galileo Namata Stanley Kok Lise Getoor

Diversity in ranking via resistive graph centers.

Avinava Dubey Soumen Chakrabarti Chiranjib Bhattacharyya

Large-scale matrix factorization with distributed stochastic gradient descent.

Rainer Gemulla Erik Nijkamp Peter J. Haas Yannis Sismanis

Rank aggregation via nuclear norm minimization.

David F. Gleich Lek-Heng Lim

Model order selection for boolean matrix factorization.

Pauli Miettinen Jilles Vreeken

Integrating low-rank and group-sparse structures for robust multi-task learning.

Jianhui Chen Jiayu Zhou Jieping Ye

An improved GLMNET for l1-regularized logistic regression.

Guo-Xun Yuan Chia-Hua Ho Chih-Jen Lin

Trading representability for scalability: adaptive multi-hyperplane machine for nonlinear classification.

Zhuang Wang Nemanja Djuric Koby Crammer Slobodan Vucetic

Supervised learning for provenance-similarity of binaries.

Sagar Chaki Cory F. Cohen Arie Gurfinkel

CHIRP: a new classifier based on composite hypercubes on iterated random projections.

Leland Wilkinson Anushka Anand Dang Tuan Nhon

The mathematics of causal inference.

Judea Pearl

Cancer genomics.

David Haussler

Internet scale data analysis.

Peter Norvig

Convex optimization: from embedded real-time to large-scale distributed.

Stephen P. Boyd