SIGKDD(KDD) 2008论文列表 - Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Las Vegas, Nevada, USA, August 24-27, 2008.| 数据学习 (DataLearner)

SIGKDD(KDD) 2008 论文列表

Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Las Vegas, Nevada, USA, August 24-27, 2008.

Pictor: an interactive system for importing data from a website.

Shuyi Zheng Matthew R. Scott Ruihua Song Ji-Rong Wen

A software system for buzz-based recommendations.

Hill Nguyen Nish Parikh Neel Sundaresan

Morpheus: interactive exploration of subspace clustering.

Emmanuel Müller Ira Assent Ralph Krieger Timm Jansen Thomas Seidl

CRO: a system for online review structurization.

Hongyan Liu Hui Yang Wenbo Li Wei Wei Jun He Xiaoyong Du

Pattern-Miner: integrated management and mining over data mining models.

Evangelos E. Kotsifakos Irene Ntoutsi Yannis Vrahoritis Yannis Theodoridis

DiMaC: a disguised missing data cleaning tool.

Ming Hua Jian Pei

An integrated system for automatic customer satisfaction analysis in the services industry.

Shantanu Godbole Shourya Roy

Using tagflake for condensing navigable tag hierarchies from tag clouds.

Luigi Di Caro K. Selçuk Candan Maria Luisa Sapino

Febrl -: an open source data cleaning, deduplication and record linkage system with a graphical user interface.

Peter Christen

An inductive database prototype based on virtual mining views.

Hendrik Blockeel Toon Calders Élisa Fromont Bart Goethals Adriana Prado Céline Robardet

Social networks: looking ahead.

Ravi Kumar Alexander Tuzhilin Christos Faloutsos David D. Jensen Gueorgi Kossinets Jure Leskovec Andrew Tomkins

Learning from multi-topic web documents for contextual advertisement.

Yi Zhang Arun C. Surendran John C. Platt Mukund Narasimhan

Using predictive analysis to improve invoice-to-cash collection.

Sai Zeng Prem Melville Christian A. Lang Ioana M. Boier-Martin Conrad Murphy

Privacy-preserving cox regression for survival analysis.

Shipeng Yu Glenn Fung Rómer Rosales Sriram Krishnan R. Bharat Rao Cary Dehing-Oberije Philippe Lambin

Heterogeneous data fusion for alzheimer's disease study.

Jieping Ye Kewei Chen Teresa Wu Jing Li Zheng Zhao Rinkal Patel Min Bae Ravi Janardan Huan Liu Gene E. Alexander Eric Reiman

A visual-analytic toolkit for dynamic interaction graphs.

Xintian Yang Sitaram Asur Srinivasan Parthasarathy Sameep Mehta

Experimental comparison of scalable online ad serving.

Gang Wu Brendan Kitts

Tagmark: reliable estimations of RFID tags for business processes.

Leonardo Weiss Ferreira Chaves Erik Buchmann Klemens Böhm

ArnetMiner: extraction and mining of academic social networks.

Jie Tang Jing Zhang Limin Yao Juanzi Li Li Zhang Zhong Su

Identifying domain expertise of developers from source code.

Renuka Sindhgatta

Scalable and near real-time burst detection from eCommerce queries.

Nish Parikh Neel Sundaresan

Temporal pattern discovery for trends and transient effects: its application to patient records.

G. Niklas Norén Andrew Bate Johan Hopstadius Kristina Star I. Ralph Edwards

Anticipating annotations and emerging trends in biomedical literature.

Fabian Mörchen Mathäus Dejori Dmitriy Fradkin Julien Etienne Bernd Wachmann Markus Bundschus

Customer targeting models using actively-selected web content.

Prem Melville Saharon Rosset Richard D. Lawrence

Spotting out emerging artists using geo-aware analysis of P2P query strings.

Noam Koenigstein Yuval Shavitt Tomer Tankel

Automated cyclone discovery and tracking using knowledge sharing in multiple heterogeneous satellite data.

Shen-Shyang Ho Ashit Talukder

Data mining using high performance data clouds: experimental studies using sector and sphere.

Robert L. Grossman Yunhong Gu

Text classification, business intelligence, and interactivity: automating C-Sat analysis for services industry.

Shantanu Godbole Shourya Roy

Learning methods for lung tumor markerless gating in image-guided radiotherapy.

Ying Cui Jennifer G. Dy Gregory C. Sharp Brian M. Alexander Steve B. Jiang

Detecting privacy leaks using corpus-based association rules.

Richard Chow Philippe Golle Jessica Staddon

The persuasive phase of visualization.

Christine H. Chih Douglas Stott Parker Jr.

Context-aware query suggestion by mining click-through and session data.

Huanhuan Cao Daxin Jiang Jian Pei Qi He Zhen Liao Enhong Chen Hang Li

Identifying authoritative actors in question-answering forums: the case of Yahoo! answers.

Mohamed Bouguessa Benoît Dumoulin Shengrui Wang

Land cover change detection: a case study.

Shyam Boriah Vipin Kumar Michael S. Steinbach Christopher Potter Steven A. Klooster

Volatile correlation computation: a checkpoint view.

Wenjun Zhou Hui Xiong

Identifying biologically relevant genes via multiple heterogeneous data sources.

Zheng Zhao Jiangxin Wang Huan Liu Jieping Ye Yung Chang

Cuts3vm: a fast semi-supervised svm algorithm.

Bin Zhao Fei Wang Changshui Zhang

Fastanova: an efficient algorithm for genome-wide association study.

Xiang Zhang Fei Zou Wei Wang

Categorizing and mining concept drifting data streams.

Peng Zhang Xingquan Zhu Yong Shi

Stable feature selection via dense feature groups.

Lei Yu Chris H. Q. Ding Steven Loscalzo

Training structural svms with kernels using sampled cuts.

Chun-Nam John Yu Thorsten Joachims

A family of dissimilarity measures between nodes generalizing both the shortest-path and the commute-time distances.

Luh Yen Marco Saerens Amin Mantrach Masashi Shimbo

Local peculiarity factor and its application in outlier detection.

Jian Yang Ning Zhong Yiyu Yao Jue Wang

Anonymizing transaction databases for publication.

Yabo Xu Ke Wang Ada Wai-Chee Fu Philip S. Yu

Succinct summarization of transactional databases: an overlapped hyperrectangle scheme.

Yang Xiang Ruoming Jin David Fuhry Feodor F. Dragan

Asymmetric support vector machines: low false-positive learning under the user tolerance.

Shan-Hung Wu Keng-Pei Lin Chung-Min Chen Ming-Syan Chen

SAIL: summation-based incremental learning for information-theoretic clustering.

Junjie Wu Hui Xiong Jian Chen

Information extraction from Wikipedia: moving down the long tail.

Fei Wu Raphael Hoffmann Daniel S. Weld

A unified approach for schema matching, coreference and canonicalization.

Michael L. Wick Khashayar Rohanimanesh Karl Schultz Andrew McCallum

Building semantic kernels for text classification using wikipedia.

Pu Wang Carlotta Domeniconi

Model-based document clustering with a collapsed gibbs sampler.

Daniel David Walker Eric K. Ringger

Can complex network metrics predict the behavior of NBA teams?

Pedro O. S. Vaz de Melo Virgílio A. F. Almeida Antonio Alfredo Ferreira Loureiro

Colibri: fast mining of large static and dynamic graphs.

Hanghang Tong Spiros Papadimitriou Jimeng Sun Philip S. Yu Christos Faloutsos

Community evolution in dynamic multi-mode networks.

Lei Tang Huan Liu Jianping Zhang Zohreh Nazeri

Hypergraph spectral learning for multi-label classification.

Liang Sun Shuiwang Ji Jieping Ye

A bayesian mixture model with linear regression mixing proportions.

Xiuyao Song Chris Jermaine Sanjay Ranka John Gums

Relational learning via collective matrix factorization.

Ajit Paul Singh Geoffrey J. Gordon

Semi-supervised approach to rapid and reliable labeling of large data sets.

György J. Simon Vipin Kumar Zhi-Li Zhang

Efficient computation of personal aggregate queries on blogs.

Ka Cheung Sia Junghoo Cho Yun Chi Belle L. Tseng

iSAX: indexing and mining terabyte sized time series.

Jin Shieh Eamonn J. Keogh

Get another label? improving data quality and data mining using multiple, noisy labelers.

Victor S. Sheng Foster J. Provost Panagiotis G. Ipeirotis

Efficient ticket routing by resolution sequence mining.

Qihong Shao Yi Chen Shu Tao Xifeng Yan Nikos Anerousis

Mobile call graphs: beyond power-law and lognormal distributions.

Mukund Seshadri Sridhar Machiraju Ashwin Sridharan Jean Bolot Christos Faloutsos Jure Leskovec

Knowledge discovery of semantic relationships between words using nonparametric bayesian graph model.

Issei Sato Minoru Yoshida Hiroshi Nakagawa

Partial least squares regression for graph mining.

Hiroto Saigo Nicole Krämer Koji Tsuda

Fast collapsed gibbs sampling for latent dirichlet allocation.

Ian Porteous David Newman Alexander T. Ihler Arthur U. Asuncion Padhraic Smyth Max Welling

Discrimination-aware data mining.

Dino Pedreschi Salvatore Ruggieri Franco Turini

Classification with partial labels.

Nam Nguyen Rich Caruana

Joint latent topic models for text and citations.

Ramesh Nallapati Amr Ahmed Eric P. Xing William W. Cohen

Finding non-redundant, statistically significant regions in high dimensional data: a novel approach to projected and subspace clustering.

Gabriela Moise Jörg Sander

Weighted graphs and disconnected components: patterns and a generator.

Mary McGlohon Leman Akoglu Christos Faloutsos

On updates that constrain the features' connections during learning.

Omid Madani Jian Huang

Multi-class cost-sensitive boosting with p-norm loss functions.

Aurelie C. Lozano Naoki Abe

Mining multi-faceted overviews of arbitrary topics in a text collection.

Xu Ling Qiaozhu Mei ChengXiang Zhai Bruce R. Schatz

Spectral domain-transfer learning.

Xiao Ling Wenyuan Dai Gui-Rong Xue Qiang Yang Yong Yu

Active learning with direct query construction.

Charles X. Ling Jun Du

Cut-and-stitch: efficient parallel learning of linear dynamical systems on smps.

Lei Li Wenjie Fu Fan Guo Todd C. Mowry Christos Faloutsos

Microscopic evolution of social networks.

Jure Leskovec Lars Backstrom Ravi Kumar Andrew Tomkins

Stream prediction using a generative model based on frequent episodes in event sequences.

Srivatsan Laxman Vikram Tankasali Ryen W. White

Angle-based outlier detection in high-dimensional data.

Hans-Peter Kriegel Matthias Schubert Arthur Zimek

The structure of information pathways in a social communication network.

Gueorgi Kossinets Jon M. Kleinberg Duncan J. Watts

Factorization meets the neighborhood: a multifaceted collaborative filtering model.

Yehuda Koren

Constructing comprehensive summaries of large event sequences.

Jerry Kiernan Evimaria Terzi

A sequential dual method for large scale multi-class linear svms.

S. Sathiya Keerthi S. Sundararajan Kai-Wei Chang Cho-Jui Hsieh Chih-Jen Lin

Effective and efficient itemset pattern summarization: regression-based approaches.

Ruoming Jin Muad Abu-Ata Yang Xiang Ning Ruan

Mining preferences from superior and inferior examples.

Bin Jiang Jian Pei Xuemin Lin David W. Cheung Jiawei Han

Extracting shared subspace for multi-label classification.

Shuiwang Ji Lei Tang Shipeng Yu Jieping Ye

Automatic identification of quasi-experimental designs for discovering causal knowledge.

David D. Jensen Andrew S. Fast Brian J. Taylor Marc E. Maier

Probabilistic latent semantic visualization: topic model for visualizing documents.

Tomoharu Iwata Takeshi Yamada Naonori Ueda

Fast logistic regression for text categorization with variable-length n-grams.

Georgiana Ifrim Gökhan H. Bakir Gerhard Weikum

Interpretable nonnegative matrix decompositions.

Saara Hyvönen Pauli Miettinen Evimaria Terzi

Bridging centrality: graph mining from element level to group level.

Woochang Hwang Taehyong Kim Murali Ramanathan Aidong Zhang

Simultaneous tensor subspace selection and clustering: the equivalence of high order svd and k-means clustering.

Heng Huang Chris H. Q. Ding Dijun Luo Tao Li

Permu-pattern: discovery of mutable permutation patterns with proximity constraint.

Meng Hu Jiong Yang Wei Su

Unsupervised deduplication using cross-field dependencies.

Robert J. Hall Charles Sutton Andrew McCallum

Quantitative evaluation of approximate frequent pattern mining algorithms.

Rohit Gupta Gang Fang Blayne Field Michael S. Steinbach Vipin Kumar

Banded structure in binary matrices.

Gemma C. Garriga Esa Junttila Heikki Mannila

Knowledge transfer via multiple model local structure mapping.

Jing Gao Wei Fan Jing Jiang Jiawei Han

Entity categorization over large document collections.

Venkatesh Ganti Arnd Christian König Rares Vernica

Composition attacks and auxiliary information in data privacy.

Srivatsava Ranjit Ganta Shiva Prasad Kasiviswanathan Adam D. Smith

Using ghost edges for classification in sparsely labeled networks.

Brian Gallagher Hanghang Tong Tina Eliassi-Rad Christos Faloutsos

SPIRAL: efficient and exact model identification for hidden Markov models.

Yasuhiro Fujiwara Yasushi Sakurai Masashi Yamamuro

Scaling up text classification for large file systems.

George Forman Shyamsundar Rajaram

Direct mining of discriminative and essential frequent patterns via model-based search tree.

Wei Fan Kun Zhang Hong Cheng Jing Gao Xifeng Yan Jiawei Han Philip S. Yu Olivier Verscheure

Locality sensitive hash functions based on concomitant rank order statistics.

Kave Eshghi Shyamsundar Rajaram

Learning classifiers from only positive and unlabeled data.

Charles Elkan Keith Noto

Constraint programming for itemset mining.

Luc De Raedt Tias Guns Siegfried Nijssen

Structured metric learning for high dimensional problems.

Jason V. Davis Inderjit S. Dhillon

De-duping URLs via rewrite rules.

Anirban Dasgupta Ravi Kumar Amit Sasturkar

Bypass rates: reducing query abandonment using negative inferences.

Atish Das Sarma Sreenivas Gollapudi Samuel Ieong

Anomaly pattern detection in categorical datasets.

Kaustav Das Jeff G. Schneider Daniel B. Neill

Feedback effects between similarity and social influence in online communities.

David J. Crandall Dan Cosley Daniel P. Huttenlocher Jon M. Kleinberg Siddharth Suri

Automatic record linkage using seeded nearest neighbour and support vector machine classification.

Peter Christen

Reconstructing chemical reaction networks: data mining meets system identification.

Yong Ju Cho Naren Ramakrishnan Yang Cao

Semi-supervised learning with data calibration for long-term time series forecasting.

Haibin Cheng Pang-Ning Tan

FAST: a roc-based feature selection metric for small samples and imbalanced data classification problems.

Xue-wen Chen Michael Wasikowski

Combinational collaborative filtering for personalized community recommendation.

WenYen Chen Dong Zhang Edward Y. Chang

Learning subspace kernels for classification.

Jianhui Chen Shuiwang Ji Betul Ceran Qi Li Mingrui Wu Jieping Ye

Partitioned logistic regression for spam filtering.

Ming-Wei Chang Wen-tau Yih Christopher Meek

Structured learning for non-smooth ranking losses.

Soumen Chakrabarti Rajiv Khanna Uma Sawant Chiru Bhattacharyya

Generating succinct titles for web URLs.

Deepayan Chakrabarti Ravi Kumar Kunal Punera

The cost of privacy: destruction of data-mining utility in anonymized data publishing.

Justin Brickell Vitaly Shmatikov

Unsupervised feature selection for principal components analysis.

Christos Boutsidis Michael W. Mahoney Petros Drineas

Topical query decomposition.

Francesco Bonchi Carlos Castillo Debora Donato Aristides Gionis

Effective label acquisition for collective classification.

Mustafa Bilgic Lise Getoor

Mining adaptively frequent closed unlabeled rooted trees in data streams.

Albert Bifet Ricard Gavaldà

Structured entity identification and document categorization: two tasks with one joint model.

Indrajit Bhattacharya Shantanu Godbole Sachindra Joshi

Efficient semi-streaming algorithms for local triangle counting in massive graphs.

Luca Becchetti Paolo Boldi Carlos Castillo Aristides Gionis

Influence and correlation in social networks.

Aris Anagnostopoulos Ravi Kumar Mohammad Mahdian

Genesis of postal address reading, current state and future prospects: thirty years of pattern recognition on duty of postal services.

Udo Miletzki

The future of image search.

Jitendra Malik

Regularization paths and coordinate descent.

Trevor Hastie Jerome H. Friedman Robert Tibshirani

Large scale data analysis and modelling in online services and advertising.

Thore Graepel Ralf Herbrich

Internet advertising and optimal auction design.

Benjamin Edelman Michael Schwarz