SIGKDD(KDD) 2004论文列表 - Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, Washington, USA, August 22-25, 2004.| 数据学习 (DataLearner)

SIGKDD(KDD) 2004 论文列表

Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, Washington, USA, August 22-25, 2004.

Analytical view of business data.

Adam Yeh Jonathan Tang Youxuan Jin Sam Skrivan

1-dimensional splines as building blocks for improving accuracy of risk outcomes models.

David S. Vogel Morgan C. Wang

Learning a complex metabolomic dataset using random forests and support vector machines.

Young Truong Xiaodong Lin Chris Beecher

Document preprocessing for naive Bayes classification and clustering with mixture of multinomials.

Dmitry Pavlov Ramnath Balasubramanyan Byron Dom Shyam Kapur Jignashu Parikh

Programming the K-means clustering algorithm in SQL.

Carlos Ordonez

Mining traffic data from probe-car system for travel time prediction.

Takayuki Nakata Jun'ichi Takeuchi

Tracking dynamics of topic trends using a finite mixture model.

Satoshi Morinaga Kenji Yamanishi

A system for automated mapping of bill-of-materials part numbers.

Jayant Kalagnanam Moninder Singh Sudhir Verma Michael Patek Yuk Wah Wong

ANN quality diagnostic models for packaging manufacturing: an industrial data mining case study.

Nicolás de Abajo Alberto B. Diez Vanesa Lobato Sergio R. Cuesta

A general approach to incorporate data quality matrices into data mining algorithms.

Ian Davidson Ashish Grover Ashwin Satyanarayana Giri Kumar Tayi

Feature selection in scientific applications.

Erick Cantú-Paz Shawn D. Newsam Chandrika Kamath

Exploring the community structure of newsgroups.

Christian Borgs Jennifer T. Chayes Mohammad Mahdian Amin Saberi

Interactive training of advanced classifiers for mining remote sensing image archives.

Selim Aksoy Krzysztof Koperski Carsten Tusk Giovanni B. Marchisio

Cross channel optimized marketing by reinforcement learning.

Naoki Abe Naval K. Verma Chidanand Apté Robert Schroko

Optimal randomization for privacy preserving data mining.

Michael Yu Zhu Lei Liu

A DEA approach for model combination.

Zhiqiang (Eric) Zheng Balaji Padmanabhan Haoqiang Zheng

A data mining approach to modeling relationships among categories in image collection.

Ruofei Zhang Zhongfei (Mark) Zhang Sandeep Khanzode

A cross-collection mixture model for comparative text mining.

ChengXiang Zhai Atulya Velivelli Bei Yu

Redundancy based feature selection for microarray data.

Lei Yu Huan Liu

2PXMiner: an efficient two pass mining of frequent XML query patterns.

Liang Huai Yang Mong-Li Lee Wynne Hsu Xinyu Guo

IMMC: incremental maximum margin criterion.

Jun Yan Benyu Zhang Shuicheng Yan Qiang Yang Hua Li Zheng Chen Wensi Xi Weiguo Fan Wei-Ying Ma QianSheng Cheng

Mining scale-free networks using geodesic clustering.

Andrew Y. Wu Michael Garland Jiawei Han

Privacy-preserving Bayesian network structure computation on distributed heterogeneous data.

Rebecca N. Wright Zhiqiang Yang

Rotation invariant distance measures for trajectories.

Michail Vlachos Dimitrios Gunopulos Gautam Das

A generative probabilistic approach to visualizing sets of symbolic sequences.

Peter Tiño Ata Kabán Yi Sun

Ordering patterns by combining opinions from multiple sources.

Pang-Ning Tan Rong Jin

Generalizing the notion of support.

Michael S. Steinbach Pang-Ning Tan Hui Xiong Vipin Kumar

Dense itemsets.

Jouni K. Seppänen Heikki Mannila

Privacy preserving regression modelling via distributed computation.

Ashish P. Sanil Alan F. Karr Xiaodong Lin Jerome P. Reiter

Identifying early buyers from purchase data.

Paat Rusmevichientong Shenghuo Zhu David Selinger

Cluster-based concept invention for statistical relational learning.

Alexandrin Popescul Lyle H. Ungar

Estimating the size of the telephone universe: a Bayesian Mark-recapture approach.

David Poole

Automatic multimedia cross-modal correlation discovery.

Jia-Yu Pan Hyung-Jeong Yang Christos Faloutsos Pinar Duygulu

A quickstart in frequent structure mining can make a difference.

Siegfried Nijssen Joost N. Kok

Semantic representation: search and mining of multimedia content.

Apostol Natsev Milind R. Naphade John R. Smith

Sleeved coclustering.

Avraham A. Melkman Eran Shaham

The IOC algorithm: efficient many-class non-parametric classification for high-dimensional data.

Ting Liu Ke Yang Andrew W. Moore

A framework for ontology-driven subspace clustering.

Jinze Liu Wei Wang Jiong Yang

Clustering moving objects.

Yifan Li Jiawei Han Jiong Yang

Learning spatially variant dissimilarity (SVaD) measures.

Krishna Kummamuru Raghu Krishnapuram Rakesh Agrawal

Improved robustness of signature-based near-replica detection via lexicon randomization.

Aleksander Kolcz Abdur Chowdhury Joshua Alspector

When do data mining results violate privacy?

Murat Kantarcioglu Jiashun Jin Chris Clifton

Why collective inference improves relational classification.

David D. Jensen Jennifer Neville Brian Gallagher

On detecting space-time clusters.

Vijay S. Iyengar

SPIN: mining maximal frequent subgraphs from graph databases.

Jun Huan Wei Wang Jan F. Prins Jiong Yang

Discovering additive structure in black box functions.

Giles Hooker

Diagnosing extrapolation: tree-based density estimation.

Giles Hooker

k-TTP: a new privacy model for large-scale distributed environments.

Bobi Gilburd Assaf Schuster Ran Wolff

A microeconomic data mining problem: customer-oriented catalog segmentation.

Martin Ester Rong Ge Wen Jin Zengjian Hu

Kernel k-means: spectral clustering and normalized cuts.

Inderjit S. Dhillon Yuqiang Guan Brian Kulis

Locating secret messages in images.

Ian Davidson Goutam Paul

Belief state approaches to signaling alarms in surveillance systems.

Kaustav Das Andrew W. Moore Jeff G. Schneider

Parallel computation of high dimensional robust correlation and covariance matrices.

James Chilson Raymond T. Ng Alan Wagner Ruben H. Zamar

IncSpan: incremental mining of sequential patterns in large database.

Hong Cheng Xifeng Yan Jiawei Han

Column-generation boosting methods for mixture of kernels.

Jinbo Bi Tong Zhang Kristin P. Bennett

An objective evaluation criterion for clustering.

Arindam Banerjee John Langford

A generalized maximum entropy approach to bregman co-clustering and matrix approximation.

Arindam Banerjee Inderjit S. Dhillon Joydeep Ghosh Srujana Merugu Dharmendra S. Modha

On demand classification of data streams.

Charu C. Aggarwal Jiawei Han Jianyong Wang Philip S. Yu

V-Miner: using enhanced parallel coordinates to mine product design and test data.

Kaidi Zhao Bing Liu Thomas M. Tirpak Andreas Schaller

Density-based spam detector.

Kenichi Yoshida Fuminori Adachi Takashi Washio Hiroshi Motoda Teruaki Homma Akihiro Nakashima Hiromitsu Fujikawa Katsuyuki Yamazaki

Predicting prostate cancer recurrence via maximizing the concordance index.

Lian Yan David Verbel Olivier Saidi

Learning to detect malicious executables in the wild.

Jeremy Z. Kolter Marcus A. Maloof

Visually mining and monitoring massive time series.

Jessica Lin Eamonn J. Keogh Stefano Lonardi Jeffrey P. Lankford Donna M. Nystrom

Effective localized regression for damage detection in large complex mechanical structures.

Aleksandar Lazarevic Ramdev Kanapady Chandrika Kamath

Eigenspace-based anomaly detection in computer systems.

Tsuyoshi Idé Hisashi Kashima

Mining coherent gene clusters from gene-sample-time microarray data.

Daxin Jiang Jian Pei Murali Ramanathan Chun Tang Aidong Zhang

Early detection of insider trading in option markets.

Steve Donoho

A rank sum test method for informative gene discovery.

Lin Deng Jian Pei Jinwen Ma Dik Lun Lee

Predicting customer shopping lists from point-of-sale purchase data.

Chad M. Cumby Andrew E. Fano Rayid Ghani Marko Krema

TiVo: making show recommendations using a distributed collaborative filtering architecture.

Kamal Ali Wijnand van Stam

Fast mining of spatial collocations.

Xin Zhang Nikos Mamoulis David W. Cheung Yutao Shou

On the discovery of significant statistical quantitative rules.

Hong Zhang Balaji Padmanabhan Alexander Tuzhilin

IDR/QR: an incremental dimension reduction algorithm via QR decomposition.

Jieping Ye Qi Li Hui Xiong Haesun Park Ravi Janardan Vipin Kumar

GPCA: an efficient dimension reduction scheme for image compression and retrieval.

Jieping Ye Ravi Janardan Qi Li

The complexity of mining maximal frequent itemsets and maximal frequent patterns.

Guizhen Yang

Exploiting a support-based upper bound of Pearson's correlation coefficient for efficiently identifying strongly correlated pairs.

Hui Xiong Shashi Shekhar Pang-Ning Tan Vipin Kumar

Incorporating prior knowledge with weighted margin support vector machines.

Xiaoyun Wu Rohini K. Srihari

Scalable mining of large disk-based graph databases.

Chen Wang Wei Wang Jian Pei Yongtai Zhu Baile Shi

Probabilistic author-topic models for information discovery.

Mark Steyvers Padhraic Smyth Michal Rosen-Zvi Thomas L. Griffiths

Support envelopes: a technique for exploring the structure of association patterns.

Michael S. Steinbach Pang-Ning Tan Vipin Kumar

A Bayesian network framework for reject inference.

Andrew T. Smith Charles Elkan

Selection, combination, and evaluation of effective software sensors for detecting abnormal computer usage.

Jude W. Shavlik Mark Shavlik

Turning CARTwheels: an alternating algorithm for mining redescriptions.

Naren Ramakrishnan Deept Kumar Bud Mishra Malcolm Potts Richard F. Helm

Rapid detection of significant spatial clusters.

Daniel B. Neill Andrew W. Moore

Machine learning for online query relaxation.

Ion Muslea

Mining, indexing, and querying historical spatiotemporal data.

Nikos Mamoulis Huiping Cao George Kollios Marios Hadjieleftheriou Yufei Tao David W. Cheung

Incremental maintenance of quotient cube for median.

Cuiping Li Gao Cong Anthony K. H. Tung Shan Wang

A graph-theoretic approach to extract storylines from search results.

Ravi Kumar Uma Mahadevan D. Sivakumar

Towards parameter-free data mining.

Eamonn J. Keogh Stefano Lonardi Chotirat (Ann) Ratanamahatana

Web usage mining based on probabilistic latent semantic analysis.

Xin Jin Yanzan Zhou Bamshad Mobasher

Mining the space of graph properties.

Glen Jeh Jennifer Widom

Interestingness of frequent itemsets using Bayesian networks as background knowledge.

Szymon Jaroszewicz Dan A. Simovici

Mining and summarizing customer reviews.

Minqing Hu Bing Liu

Cyclic pattern kernels for predictive graph mining.

Tamás Horváth Thomas Gärtner Stefan Wrobel

Discovering complex matchings across web query interfaces: a correlation mining approach.

Bin He Kevin Chen-Chuan Chang Jiawei Han

Efficient closed pattern mining in the presence of tough block constraints.

Krishna Gade Jianyong Wang George Karypis

Systematic data selection to mine concept-drifting data streams.

Wei Fan

Fast discovery of connection subgraphs.

Christos Faloutsos Kevin S. McCurley Andrew Tomkins

Regularized multi--task learning.

Theodoros Evgeniou Massimiliano Pontil

Adversarial classification.

Nilesh N. Dalvi Pedro M. Domingos Mausam Sumit K. Sanghai Deepak Verma

Exploiting dictionaries in named entity extraction: combining semi-Markov extraction processes and data integration methods.

William W. Cohen Sunita Sarawagi

Fully automatic cross-associations.

Deepayan Chakrabarti Spiros Papadimitriou Dharmendra S. Modha Christos Faloutsos

Data mining in metric space: an empirical analysis of supervised learning performance criteria.

Rich Caruana Alexandru Niculescu-Mizil

A probabilistic framework for semi-supervised clustering.

Sugato Basu Mikhail Bilenko Raymond J. Mooney

Clustering time series from ARMA models with clipped data.

Anthony J. Bagnall Gareth J. Janacek

Fast nonlinear regression via eigenimages applied to galactic morphology.

Brigham S. Anderson Andrew W. Moore Andrew J. Connolly Robert Nichol

Recovering latent time-series from their observed sums: network tomography with particle filters.

Edoardo M. Airoldi Christos Faloutsos

Mining reference tables for automatic text segmentation.

Eugene Agichtein Venkatesh Ganti

Approximating a collection of frequent sets.

Foto N. Afrati Aristides Gionis Heikki Mannila

An iterative method for multi-class cost-sensitive learning.

Naoki Abe Bianca Zadrozny John Langford

Graphical models for data mining.

David Heckerman

User-centered design for KDD.

Eric Haseltine