SIGKDD(KDD) 2014论文列表 - The 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD '14, New York, NY, USA - August 24

SIGKDD(KDD) 2014 论文列表

The 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD '14, New York, NY, USA - August 24 - 27, 2014.

Recommendation in social media: recent advances and new frontiers.

Jiliang Tang Jie Tang Huan Liu

Statistically sound pattern discovery.

Wilhelmiina Hämäläinen Geoffrey I. Webb

Sampling for big data: a tutorial.

Graham Cormode Nick G. Duffield

Network mining and analysis for social applications.

Feida Zhu Huan Sun Xifeng Yan

Deep learning.

Ruslan Salakhutdinov

Correlation clustering: from theory to practice.

Francesco Bonchi David García-Soriano Edo Liberty

The recommender problem revisited: morning tutorial.

Xavier Amatriain Bamshad Mobasher

Management and analytic of biomedical big data with cloud-based in-memory database and dynamic querying: a hands-on experience with real-world data.

Mengling Feng Mohammad M. Ghassemi Thomas Brennan John Ellenberger Ishrar Hussain Roger G. Mark

Computational epidemiology.

Madhav V. Marathe Anil Kumar S. Vullikanti

Bringing structure to text: mining phrases, entities, topics, and hierarchies.

Jiawei Han Chi Wang Ahmed El-Kishky

Constructing and mining web-scale knowledge graphs: KDD 2014 tutorial.

Antoine Bordes Evgeniy Gabrilovich

Scaling up deep learning.

Yoshua Bengio

Does social good justify risking personal privacy?

Raghu Ramakrishnan Geoffrey I. Webb

Filling context-ad vocabulary gaps with click logs.

Yukihiro Tagami Toru Hotta Yusuke Tanaka Shingo Ono Koji Tsukamoto Akira Tajima

Modeling professional similarity by mining professional career trajectories.

Ye Xu Zang Li Abhishek Gupta Ahmet Bugdayci Anmol Bhasin

We know what you want to buy: a demographic-based system for product recommendation on microblogs.

Wayne Xin Zhao Yanwei Guo Yulan He Han Jiang Yuexin Wu Xiaoming Li

Large scale visual recommendations from street fashion images.

Vignesh Jagadeesh Robinson Piramuthu Anurag Bhardwaj Wei Di Neel Sundaresan

Large-scale high-precision topic modeling on twitter.

Shuang-Hong Yang Alek Kolcz Andy Schlaikjer Pankaj Gupta

An empirical study of reserve price optimisation in real-time bidding.

Shuai Yuan Jun Wang Bowei Chen Peter Mason Sam Seljan

A system to grade computer programming skills using machine learning.

Shashank Srikant Varun Aggarwal

Automated hypothesis generation based on mining scientific literature.

W. Scott Spangler Angela D. Wilkins Benjamin J. Bachman Meena Nagarajan Tajhal Dayaram Peter J. Haas Sam Regenbogen Curtis R. Pickering Austin Comer Jeffrey N. Myers Ioana Stanoi Linda Kato Ana Lelescu Jacques J. Labrie Neha Parikh Andreas Martin Lisewski Lawrence A. Donehower Ying Chen Olivier Lichtarge

Log-based predictive maintenance.

Ruben Sipos Dmitriy Fradkin Fabian Mörchen Zhuang Wang

Seven rules of thumb for web site experimenters.

Ron Kohavi Alex Deng Roger Longbotham Ya Xu

ISIS: a networked-epidemiology based pervasive web app for infectious disease pandemic planning and response.

Richard J. Beckman Keith R. Bisset Jiangzhuo Chen Bryan L. Lewis Madhav V. Marathe Paula Elaine Stretz

Modeling impression discounting in large-scale recommender systems.

Pei Lee Laks V. S. Lakshmanan Mitul Tiwari Sam Shah

Reducing gang violence through network influence based targeting of social programs.

Paulo Shakarian Joseph Salmento William R. Pulleyblank John Bertetto

New algorithms for parking demand management and a city-scale deployment.

Onno Zoeter Christopher R. Dance Stéphane Clinchant Jean-Marc Andreoli

LASTA: large scale topic assignment on multiple social networks.

Nemanja Spasojevic Jinyun Yan Adithya Rao Prantik Bhattacharyya

'Beating the news' with EMBERS: forecasting civil unrest using open source indicators.

Naren Ramakrishnan Patrick Butler Sathappan Muthiah Nathan Self Rupinder Paul Khandpur Parang Saraf Wei Wang Jose Cadena Anil Vullikanti Gizem Korkmaz Chris J. Kuhlman Achla Marathe Liang Zhao Ting Hua Feng Chen Chang-Tien Lu Bert Huang Aravind Srinivasan Khoa Trinh Lise Getoor Graham Katz Andy Doyle Chris Ackermann Ilya Zavorin Jim Ford Kristen Maria Summers Youssef Fayed Jaime Arredondo Dipak Gupta David Mares

Spatially embedded co-offence prediction using supervised learning.

Mohammad A. Tayebi Martin Ester Uwe Glässer Patricia L. Brantingham

Identifying tourists from public transport commuters.

Mingqiang Xue Huayu Wu Wei Chen Wee Siong Ng Gin Howe Goh

Up next: retrieval methods for large scale related video suggestion.

Michael Bendersky Lluis Garcia Pueyo Jeremiah J. Harmsen Vanja Josifovski Dima Lepikhin

Knock it off: profiling the online storefronts of counterfeit merchandise.

Matthew F. Der Lawrence K. Saul Stefan Savage Geoffrey M. Voelker

EARS (earthquake alert and report system): a real time decision support system for earthquake crisis management.

Marco Avvenuti Stefano Cresci Andrea Marchetti Carlo Meletti Maurizio Tesconi

Applying data mining techniques to address critical process optimization needs in advanced manufacturing.

Li Zheng Chunqiu Zeng Lei Li Yexi Jiang Wei Xue Jingxuan Li Chao Shen Wubai Zhou Hongtai Li Liang Tang Tao Li Bing Duan Ming Lei Pengnian Wang

Predicting employee expertise for talent management in the enterprise.

Kush R. Varshney Vijil Chenthamarakshan Scott W. Fancher Jun Wang DongPing Fang Aleksandra Mojsilovic

A hazard based approach to user return time prediction.

Komal Kapoor Mingxuan Sun Jaideep Srivastava Tao Ye

FoodSIS: a text mining system to improve the state of food safety in singapore.

Kiran Kate Sneha Chaudhari Andy Prapanca Jayant Kalagnanam

Improving management of aquatic invasions by integrating shipping network, ecological, and environmental data: data mining for social good.

Jian Xu Thanuka L. Wickramarathne Nitesh V. Chawla Erin K. Grey Karsten Steinhaeuser Reuben P. Keller John M. Drake David M. Lodge

Scalable near real-time failure localization of data center networks.

Herodotos Herodotou Bolin Ding Shobana Balakrishnan Geoff Outhred Percy Fitter

A case study: privacy preserving release of spatio-temporal density in paris.

Gergely Ács Claude Castelluccia

Shallow semantic parsing of product offering titles (for better automatic hyperlink insertion).

Gabor Melli

Modeling mass protest adoption in social network communities using geometric brownian motion.

Fang Jin Rupinder Paul Khandpur Nathan Self Edward R. Dougherty Sheng Guo Feng Chen B. Aditya Prakash Naren Ramakrishnan

Corporate residence fraud detection.

Enric Junqué de Fortuny Marija Stankova Julie Moeyersoms Bart Minnaert Foster J. Provost David Martens

Style in the long tail: discovering unique interests with latent variable models in large scale social E-commerce.

Diane J. Hu Rob Hall Josh Attenberg

Unveiling clusters of events for alert and incident management in large-scale enterprise it.

Derek Lin Rashmi Raghu Vivek Ramamurthy Jin Yu Regunathan Radhakrishnan Joseph Fernandez

Large scale predictive modeling for micro-simulation of 3G air interface load.

Dejan Radosavljevik Peter van der Putten

Budget pacing for targeted online advertisements at LinkedIn.

Deepak Agarwal Souvik Ghosh Kai Wei Siyu You

Activity ranking in LinkedIn feed.

Deepak Agarwal Bee-Chung Chen Rupesh Gupta Joshua Hartman Qi He Anand Iyer Sumanth Kolar Yiming Ma Pannagadatta Shivaswamy Ajit Singh Liang Zhang

Proactive workflow modeling by stochastic processes with application to healthcare operation and management.

Chuanren Liu Yong Ge Hui Xiong Keli Xiao Wei Geng Matt Perkins

Correlating events with time series for incident diagnosis.

Chen Luo Jian-Guang Lou Qingwei Lin Qiang Fu Rui Ding Dongmei Zhang Zhe Wang

Scalable hands-free transfer learning for online advertising.

Brian Dalessandro Daizhuo Chen Troy Raeder Claudia Perlich Melinda Han Williams Foster J. Provost

Targeting direct cash transfers to the extremely poor.

Brian Abelson Kush R. Varshney Joy Sun

Novel geospatial interpolation analytics for general meteorological measurements.

Bingsheng Wang Jinjun Xiong

Predicting student risks through longitudinal analysis.

Ashay Tamhane Shajith Ikbal Bikram Sengupta Mayuri Duggirala James Appleton

Mining text snippets for images on the web.

Anitha Kannan Simon Baker Krishnan Ramnath Juliet Fiss Dahua Lin Lucy Vanderwende Rizwan Ansary Ashish Kapoor Qifa Ke Matt Uyttendaele Xin-Jing Wang Lei Zhang

Guilt by association: large scale malware detection by mining file-relation graphs.

Acar Tamersoy Kevin A. Roundy Duen Horng Chau

Bringing data science to the speakers of every language.

Robert Munro

Big data for social good.

Nathan Eagle

Information environment security.

Rand Waltzman

Data science through the lens of social science.

Drew Conway

Algorithms for interpretable machine learning.

Cynthia Rudin

Medicine in the age of electronic health records.

Nigam Shah

Predictive modeling in practice: a case study from sprint.

Tracy De Poalo Jeremy Howard

Frontiers in E-commerce personalization.

Sri Subramaniam

Who are experts specializing in landscape photography?: analyzing topic-specific authority on content sharing services.

Bin Bi Ben Kao Chang Wan Junghoo Cho

Predicting long-term impact of CQA posts: a comprehensive viewpoint.

Yuan Yao Hanghang Tong Feng Xu Jian Lu

Analyzing expert behaviors in collaborative networks.

Huan Sun Mudhakar Srivatsa Shulong Tan Yang Li Lance M. Kaplan Shu Tao Xifeng Yan

Network structural analysis via core-tree-decomposition Publication of this article pending inquiry.

Takuya Akiba Takanori Maehara Ken-ichi Kawarabayashi

Using strong triadic closure to characterize ties in social networks.

Stavros Sintos Panayiotis Tsaparas

Balanced graph edge partition.

Florian Bourse Marc Lelarge Milan Vojnovic

Graph sample and hold: a framework for big-graph analytics.

Nesreen K. Ahmed Nick G. Duffield Jennifer Neville Ramana Rao Kompella

FAST-PPR: scaling personalized pagerank estimation for large graphs.

Peter Lofgren Siddhartha Banerjee Ashish Goel Seshadhri Comandur

Efficient SimRank computation via linearizationPublication of this article pending inquiry.

Takanori Maehara Mitsuru Kusumoto Ken-ichi Kawarabayashi

Almost linear-time algorithms for adaptive betweenness centrality using hypergraph sketches.

Yuichi Yoshida

The interplay between dynamics and networks: centrality, communities, and cheeger inequality.

Rumi Ghosh Shang-Hua Teng Kristina Lerman Xiaoran Yan

On the permanence of vertices in network communities.

Tanmoy Chakraborty Sriram Srinivasan Niloy Ganguly Animesh Mukherjee Sanjukta Bhowmick

Heat kernel based community detection.

Kyle Kloster David F. Gleich

Community detection in graphs through correlation.

Lian Duan William Nick Street Yanchi Liu Haibing Lu

Community membership identification from small seed sets.

Isabel M. Kloumann Jon M. Kleinberg

Inside the atoms: ranking on a network of networks.

Jingchao Ni Hanghang Tong Wei Fan Xiang Zhang

Focused clustering and outlier detection in large attributed graphs.

Bryan Perozzi Leman Akoglu Patricia Iglesias Sánchez Emmanuel Müller

Temporal skeletonization on sequential data: patterns, categorization, and visualization.

Chuanren Liu Kai Zhang Hui Xiong Geoff Jiang Qiang Yang

Learning multifractal structure in large networks.

Austin R. Benson Carlos Riquelme Sven Schmit

Core decomposition of uncertain graphs.

Francesco Bonchi Francesco Gullo Andreas Kaltenbrunner Yana Volkovich

Minimizing seed set selection with probabilistic coverage guarantee in a social network.

Peng Zhang Wei Chen Xiaoming Sun Yajun Wang Jialin Zhang

Fast influence-based coarsening for large networks.

Manish Purohit B. Aditya Prakash Chanhyun Kang Yao Zhang V. S. Subrahmanian

Meta-path based multi-network collective link prediction.

Jiawei Zhang Philip S. Yu Zhi-Hua Zhou

Activity-edge centric multi-label classification for mining heterogeneous information networks.

Yang Zhou Ling Liu

Who to follow and why: link prediction with explanations.

Nicola Barbieri Francesco Bonchi Giuseppe Manco

Stability of influence maximization.

Xinran He David Kempe

MMRate: inferring multi-aspect diffusion networks with multi-pattern cascades.

Senzhang Wang Xia Hu Philip S. Yu Zhoujun Li

Probabilistic latent network visualization: inferring and embedding diffusion networks.

Takeshi Kurashima Tomoharu Iwata Noriko Takaya Hiroshi Sawada

Scalable diffusion-aware optimization of network topology.

Elias Boutros Khalil Bistra Dilkina Le Song

A bayesian framework for estimating properties of network diffusions.

Varun R. Embar Rama Kumar Pasumarthi Indrajit Bhattacharya

On social event organization.

Keqian Li Wei Lu Smriti Bhagat Laks V. S. Lakshmanan Cong Yu

Profit-maximizing cluster hires.

Behzad Golshan Theodoros Lappas Evimaria Terzi

FEMA: flexible evolutionary multi-faceted analysis for dynamic behavioral pattern discovery.

Meng Jiang Peng Cui Fei Wang Xinran Xu Wenwu Zhu Shiqiang Yang

Event detection in activity networks.

Polina Rozenshtein Aris Anagnostopoulos Aristides Gionis Nikolaj Tatti

Non-parametric scan statistics for event detection and forecasting in heterogeneous social media graphs.

Feng Chen Daniel B. Neill

Open question answering over curated and extracted knowledge bases.

Anthony Fader Luke Zettlemoyer Oren Etzioni

Entity profiling with varying source reliabilities.

Furong Li Mong-Li Lee Wynne Hsu

Sentiment expression conditioned by affective transitions and social forces.

Moritz Sudhof Andrés Goméz Emilsson Andrew L. Maas Christopher Potts

Integrating spreadsheet data via accurate and low-effort extraction.

Zhe Chen Michael J. Cafarella

Mining topics in documents: standing on the shoulders of big data.

Zhiyuan Chen Bing Liu

Networked bandits with disjoint linear payoffs.

Meng Fang Dacheng Tao

Modeling delayed feedback in display advertising.

Olivier Chapelle

Quantifying herding effects in crowd wisdom.

Ting Wang Dashun Wang Fei Wang

Optimal real-time bidding for display advertising.

Weinan Zhang Shuai Yuan Jun Wang

From labor to trader: opinion elicitation via online crowds as a market.

Caleb Chen Cao Lei Chen H. V. Jagadish

Towards scalable critical alert mining.

Bo Zong Yinghui Wu Jie Song Ambuj K. Singh Hasan Çam Jiawei Han Xifeng Yan

Exploiting geographic dependencies for real estate appraisal: a mutual perspective of ranking and clustering.

Yanjie Fu Hui Xiong Yong Ge Zijun Yao Yu Zheng Zhi-Hua Zhou

Methods for ordinal peer grading.

Karthik Raman Thorsten Joachims

Inferring gas consumption and pollution emission of vehicles throughout a city.

Jingbo Shang Yu Zheng Wenzhu Tong Eric Chang Yong Yu

Grouping students in educational settings.

Rakesh Agrawal Behzad Golshan Evimaria Terzi

Semantic visualization for spherical representation.

Tuan M. V. Le Hady Wirawan Lauw

Provable deterministic leverage score sampling.

Dimitris S. Papailiopoulos Anastasios Kyrillidis Christos Boutsidis

LWI-SVD: low-rank, windowed, incremental singular value decompositions on time-evolving data sets.

Xilun Chen K. Selçuk Candan

Clustering and projected clustering with adaptive neighbors.

Feiping Nie Xiaoqian Wang Heng Huang

Fast DTT: a near linear algorithm for decomposing a tensor into factor tensors.

Xiaomin Fang Rong Pan

Mobile app recommendations with security and privacy awareness.

Hengshu Zhu Hui Xiong Yong Ge Enhong Chen

CatchSync: catching synchronized behavior in large directed graphs.

Meng Jiang Peng Cui Alex Beutel Christos Faloutsos Shiqiang Yang

Top-k frequent itemsets via differentially private FP-trees.

Jaewoo Lee Christopher W. Clifton

Exponential random graph estimation under differential privacy.

Wentian Lu Gerome Miklau

Differentially private network data release via structural inference.

Qian Xiao Rui Chen Kian-Lee Tan

Dynamics of news events and social media reaction.

Mikalai Tsytsarau Themis Palpanas Malú Castellanos

Reducing the sampling complexity of topic models.

Aaron Q. Li Amr Ahmed Sujith Ravi Alexander J. Smola

Experiments with non-parametric topic models.

Wray L. Buntine Swapnil Mishra

SigniTrend: scalable detection of emerging topics in textual streams by hashed significance thresholds.

Erich Schubert Michael Weiler Hans-Peter Kriegel

TCS: efficient topic discovery over crowd-oriented service data.

Yongxin Tong Caleb Chen Cao Lei Chen

Product selection problem: improve market share by learning consumer behavior.

Silei Xu John Chi-Shing Lui

Detecting anomalies in dynamic rating data: a robust probabilistic model for rating evolution.

Stephan Günnemann Nikou Günnemann Christos Faloutsos

GeoMF: joint geographical modeling and matrix factorization for point-of-interest recommendation.

Defu Lian Cong Zhao Xing Xie Guangzhong Sun Enhong Chen Yong Rui

ClusCite: effective citation recommendation by information network-based clustering.

Xiang Ren Jialu Liu Xiao Yu Urvashi Khandelwal Quanquan Gu Lidan Wang Jiawei Han

Optimal recommendations under attraction, aversion, and social influence.

Wei Lu Stratis Ioannidis Smriti Bhagat Laks V. S. Lakshmanan

Matching users and items across domains to improve the recommendation quality.

Chung-Yi Li Shou-De Lin

Scalable heterogeneous translated hashing.

Ying Wei Yangqiu Song Yi Zhen Bo Liu Qiang Yang

Unifying learning to rank and domain adaptation: enabling cross-task document scoring.

Mianwei Zhou Kevin Chen-Chuan Chang

Multi-task copula by sparse graph regression.

Tianyi Zhou Dacheng Tao

Efficient multi-task feature learning with calibration.

Pinghua Gong Jiayu Zhou Wei Fan Jieping Ye

Personalized search result diversification via structured learning.

Shangsong Liang Zhaochun Ren Maarten de Rijke

LaSEWeb: automating search strategies over semi-structured web data.

Oleksandr Polozov Sumit Gulwani

Identifying and labeling search tasks via query-based hawkes processes.

Liangda Li Hongbo Deng Anlei Dong Yi Chang Hongyuan Zha

Crowdsourced time-sync video tagging using temporal and personalized topic modeling.

Bin Wu Erheng Zhong Ben Tan Andrew Horner Qiang Yang

Open-domain quantity queries on web tables: annotation, response, and consensus models.

Sunita Sarawagi Soumen Chakrabarti

DeepWalk: online learning of social representations.

Bryan Perozzi Rami Al-Rfou Steven Skiena

Improved testing of low rank matrices.

Yi Li Zhengyu Wang David P. Woodruff

Distance queries from sampled data: accurate and efficient.

Edith Cohen

Streaming submodular maximization: massive data summarization on the fly.

Ashwinkumar Badanidiyuru Baharan Mirzasoleiman Amin Karbasi Andreas Krause

Efficient mini-batch training for stochastic optimization.

Mu Li Tong Zhang Yuqiang Chen Alexander J. Smola

Scaling out big data missing value imputations: pythia vs. godzilla.

Christos Anagnostopoulos Peter Triantafillou

Correlation clustering in MapReduce.

Flavio Chierichetti Nilesh N. Dalvi Ravi Kumar

Scalable histograms on large probabilistic data.

Mingwang Tang Feifei Li

Fast flux discriminant for large-scale sparse nonlinear classification.

Wenlin Chen Yixin Chen Kilian Q. Weinberger

Improving the modified nyström method using spectral shifting.

Shusen Wang Chao Zhang Hui Qian Zhihua Zhang

Knowledge vault: a web-scale approach to probabilistic knowledge fusion.

Xin Dong Evgeniy Gabrilovich Geremy Heitz Wilko Horn Ni Lao Kevin Murphy Thomas Strohmann Shaohua Sun Wei Zhang

Online chinese restaurant process.

Chien-Liang Liu Tsung-Hsun Tsai Chia-Hoang Lee

Learning with dual heterogeneity: a nonparametric bayes model.

Hongxia Yang Jingrui He

Empirical glitch explanations.

Tamraparni Dasu Ji Meng Loh Divesh Srivastava

Parallel gibbs sampling for hierarchical dirichlet processes via gamma processes equivalence.

Dehua Cheng Yan Liu

Factorized sparse learning models with interpretable high order feature interactions.

Sanjay Purushotham Martin Renqiang Min C.-C. Jay Kuo Rachel Ostroff

Safe and efficient screening for sparse support vector machine.

Zheng Zhao Jun Liu James Cox

Simultaneous feature and feature group selection through hard thresholding.

Shuo Xiang Tao Yang Jieping Ye

Gradient boosted feature selection.

Zhixiang Eddie Xu Gao Huang Kilian Q. Weinberger Alice X. Zheng

Effective global approaches for mutual information based feature selection.

Xuan Vinh Nguyen Jeffrey Chan Simone Romano James Bailey

Active collaborative permutation learning.

Jialei Wang Nathan Srebro James Evans

Active semi-supervised learning using sampling theory for graph signals.

Akshay Gadde Aamir Anis Antonio Ortega

Large-scale adaptive semi-supervised learning via unified inductive and transductive model.

De Wang Feiping Nie Heng Huang

Active learning for sparse bayesian multilabel classification.

Deepak Vasisht Andreas C. Damianou Manik Varma Ashish Kapoor

Active-transductive learning with label-adapted kernels.

Dan Kushnir

Time-varying learning and content analytics via sparse factor analysis.

Andrew S. Lan Christoph Studer Richard G. Baraniuk

Streamed approximate counting of distinct elements: beating optimal batch methods.

Daniel Ting

The setwise stream classification problem.

Charu C. Aggarwal

Detecting moving object outliers in massive-scale trajectory streams.

Yanwei Yu Lei Cao Elke A. Rundensteiner Qin Wang

Prototype-based learning on concept-drifting data streams.

Junming Shao Zahra Ahmadi Stefan Kramer

Utilizing temporal patterns for estimating uncertainty in interpretable early decision making.

Mohamed F. Ghalwash Vladan Radosavljevic Zoran Obradovic

Learning time-series shapelets.

Josif Grabocka Nicolas Schilling Martin Wistuba Lars Schmidt-Thieme

FBLG: a simple and effective approach for temporal dependence discovery from time series data.

Dehua Cheng Mohammad Taha Bahadori Yan Liu

GLAD: group anomaly detection in social media analysis.

Qi Rose Yu Xinran He Yan Liu

Sleep analytics and online selective anomaly detection.

Tahereh Babaie Sanjay Chawla Romesh G. Abeysuriya

Supervised deep learning with auxiliary networks.

Junbo Zhang Guangjian Tian Yadong Mu Wei Fan

Incremental and decremental training for linear classification.

Cheng-Hao Tsai Chieh-Yen Lin Chih-Jen Lin

Box drawings for learning with imbalanced data.

Siong Thye Goh Cynthia Rudin

Distance metric learning using dropout: a structured regularization approach.

Qi Qian Juhua Hu Rong Jin Jian Pei Shenghuo Zhu

Large margin distribution machine.

Teng Zhang Zhi-Hua Zhou

Class-distribution regularized consensus maximization for alleviating overfitting in model combination.

Sihong Xie Jing Gao Wei Fan Deepak S. Turaga Philip S. Yu

Online multiple kernel regression.

Doyen Sahoo Steven C. H. Hoi Bin Li

An efficient algorithm for weak hierarchical lasso.

Yashu Liu Jie Wang Jieping Ye

A multi-class boosting method with direct optimization.

Shaodan Zhai Tian Xia Shaojun Wang

FastXML: a fast, accurate and stable tree-classifier for extreme multi-label learning.

Yashoteja Prabhu Manik Varma

SMVC: semi-supervised multi-view clustering in subspace projections.

Stephan Günnemann Ines Färber Matthias Sebastian Rüdiger Thomas Seidl

Representative clustering of uncertain data.

Andreas Züfle Tobias Emrich Klaus Arthur Schmid Nikos Mamoulis Arthur Zimek Matthias Renz

A dirichlet multinomial mixture model-based approach for short text clustering.

Jianhua Yin Jianyong Wang

Batch discovery of recurring rare classes toward identifying anomalous samples.

Murat Dundar Halid Ziya Yerebakan Bartek Rajwa

Relevant overlapping subspace clusters on categorical data.

Xiao He Jing Feng Bettina Konte Son T. Mai Claudia Plant

User effort minimization through adaptive diversification.

Mahbub Hasan Abhijith Kashyap Vagelis Hristidis Vassilis J. Tsotras

Jointly modeling aspects, ratings and sentiments for movie recommendation (JMARS).

Qiming Diao Minghui Qiu Chao-Yuan Wu Alexander J. Smola Jing Jiang Chong Wang

Topic-factorized ideal point estimation model for legislative voting network.

Yupeng Gu Yizhou Sun Ning Jiang Bingyu Wang Ting Chen

Leveraging user libraries to bootstrap collaborative filtering.

Laurent Charlin Richard S. Zemel Hugo Larochelle

COM: a generative model for group recommendation.

Quan Yuan Gao Cong Chin-Yew Lin

Dual beta process priors for latent cluster discovery in chronic obstructive pulmonary disease.

James C. Ross Peter J. Castaldi Michael H. Cho Jennifer G. Dy

Clinical risk prediction with multilinear sparse logistic regression.

Fei Wang Ping Zhang Buyue Qian Xiang Wang Ian Davidson

From micro to macro: data driven phenotyping by densification of longitudinal electronic medical records.

Jiayu Zhou Fei Wang Jianying Hu Jieping Ye

Scalable noise mining in long-term electrocardiographic time-series to predict death following heart attacks.

Chih-Chun Chia Zeeshan Syed

Marble: high-throughput phenotyping from electronic health records via sparse nonnegative tensor factorization.

Joyce C. Ho Joydeep Ghosh Jimeng Sun

FUNNEL: automatic mining of spatially coevolving epidemics.

Yasuko Matsubara Yasushi Sakurai Willem G. van Panhuis Christos Faloutsos

Good-enough brain model: challenges, algorithms and discoveries in multi-subject experiments.

Evangelos E. Papalexakis Alona Fyshe Nicholas D. Sidiropoulos Partha Pratim Talukdar Tom M. Mitchell Christos Faloutsos

Unsupervised learning of disease progression models.

Xiang Wang David A. Sontag Fei Wang

Unfolding physiological state: mortality modelling in intensive care units.

Marzyeh Ghassemi Tristan Naumann Finale Doshi-Velez Nicole Brimmer Rohit Joshi Anna Rumshisky Peter Szolovits

People on drugs: credibility of user statements in health communities.

Subhabrata Mukherjee Gerhard Weikum Cristian Danescu-Niculescu-Mizil

LUDIA: an aggregate-constrained low-rank reconstruction algorithm to leverage publicly released health data.

Yubin Park Joydeep Ghosh

A cost-effective recommender system for taxi drivers.

Meng Qu Hengshu Zhu Junming Liu Guannan Liu Hui Xiong

Modeling human location data with mixtures of kernel densities.

Moshe Lichman Padhraic Smyth

Travel time estimation of a path using sparse trajectories.

Yilun Wang Yu Zheng Yexiang Xue

Inferring user demographics and social strategies in mobile social networks.

Yuxiao Dong Yang Yang Jie Tang Yang Yang Nitesh V. Chawla

Prediction of human emergency behavior and their mobility following large-scale disaster.

Xuan Song Quanshi Zhang Yoshihide Sekimoto Ryosuke Shibasaki

Bugbears or legitimate threats?: (social) scientists' criticisms of machine learning?

Sendhil Mullainathan

A data driven approach to diagnosing and treating disease.

Eric E. Schadt

Data, predictions, and decisions in support of people and society.

Eric Horvitz

The battle for the future of data mining.

Oren Etzioni