SIGKDD(KDD) 2002论文列表 - Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, July 23-26, 2002, Edmonton, Alberta, Canada.| 数据学习 (DataLearner)

SIGKDD(KDD) 2002 论文列表

Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, July 23-26, 2002, Edmonton, Alberta, Canada.

Transforming classifier scores into accurate multiclass probability estimates.

Bianca Zadrozny Charles Elkan

Topic-conditioned novelty detection.

Yiming Yang Jian Zhang Jaime G. Carbonell Chun Jin

CLOPE: a fast and effective clustering algorithm for transactional data.

Yiling Yang Xudong Guan Jinyuan You

A unifying framework for detecting outliers and change points from non-stationary time series data.

Kenji Yamanishi Jun'ichi Takeuchi

B-EM: a classifier incorporating bootstrap with EM approach for data mining.

Xintao Wu Jianping Fan Kalpathi R. Subramanian

Making every bit count: fast nonlinear axis scaling.

Leejay Wu Christos Faloutsos

Discovery net: towards a grid of knowledge discovery.

Vasa Curcin Moustafa Ghanem Yike Guo Martin Köhler Anthony Rowe Jameel Syed Patrick Wendel

Item selection by "hub-authority" profit ranking.

Ke Wang Ming-Yen Thomas Su

Non-linear dimensionality reduction techniques for classification and visualization.

Michail Vlachos Carlotta Domeniconi Dimitrios Gunopulos George Kollios Nick Koudas

Privacy preserving association rule mining in vertically partitioned data.

Jaideep Vaidya Chris Clifton

What's the code?: automatic classification of source code archives.

Secil Ugurel Robert Krovetz C. Lee Giles

Single-shot detection of multiple categories of text using parametric mixture models.

Naonori Ueda Kazumi Saito

Combining clustering and co-training to enhance text classification using unlabelled data.

Bhavani Raskutti Herman L. Ferrá Adam Kowalczyk

Discovering word senses from text.

Patrick Pantel Dekang Lin

Evaluating classifiers' performance in a constrained environment.

Anna Olecka

Incremental context mining for adaptive document classification.

Rey-Long Liu Yun-Ling Lu

Collusion in the U.S. crop insurance program: applied data mining.

Bertis B. Little Walter L. Johnston Ashley C. Lovell Roderick M. Rejesus Steve A. Steed

Discovering informative content blocks from Web documents.

Shian-Hua Lin Jan-Ming Ho

A robust and efficient clustering algorithm based on cohesion self-merging.

Cheng-Ru Lin Ming-Syan Chen

Distributed data mining in a chain store database of short transactions.

Cheng-Ru Lin Chang-Hung Lee Ming-Syan Chen Philip S. Yu

Instability of decision tree classification algorithms.

Ruey-Hsia Li Geneva G. Belford

Construct robust rule sets for classification.

Jiuyong Li Rodney W. Topor Hong Shen

Clustering seasonality patterns in the presence of errors.

Mahesh Kumar Nitin R. Patel Jonathan Woo

Finding surprising patterns in a time series database in linear time and space.

Eamonn J. Keogh Stefano Lonardi Bill Yuan-chi Chiu

Similarity measure based on partial information of time series.

Xiaoming Jin Yuchang Lu Chunyi Shi

SimRank: a measure of structural-context similarity.

Glen Jeh Jennifer Widom

A model for discovering customer value for E-content.

Srinivasan Jagannathan Jayanth Nayak Kevin C. Almeroth Markus Hofmann

Mining complex models from arbitrarily large databases in constant time.

Geoff Hulten Pedro M. Domingos

Visualization support for a user-centered KDD process.

Tu Bao Ho Trong Dung Nguyen DucDung Nguyen

Scaling multi-class support vector machines using inter-class confusion.

Shantanu Godbole Sunita Sarawagi Soumen Chakrabarti

SyMP: an efficient clustering approach to identify clusters of arbitrary shapes in large data sets.

Hichem Frigui

Integrating feature and instance selection for text classification.

Dimitris Fragoudis Dimitris Meretakis Spiros Likothanassis

Tumor cell identification using features rules.

Bin Fang Wynne Hsu Mong-Li Lee

Tina Eliassi-Rad, Terence Critchlow, Ghaleb Abdulla.

Tina Eliassi-Rad Terence Critchlow Ghaleb Abdulla

SECRET: a scalable linear regression tree algorithm.

Alin Dobra Johannes Gehrke

Learning to match and cluster large high-dimensional data sets for data integration.

William W. Cohen Jacob Richman

CVS: a Correlation-Verification based Smoothing technique on information retrieval and term clustering.

Christina Yip Chung Bin Chen

A new two-phase sampling based algorithm for discovering association rules.

Bin Chen Peter J. Haas Peter Scheuermann

Extracting decision trees from trained neural networks.

Olcay Boz

Topics in 0--1 data.

Ella Bingham Heikki Mannila Jouni K. Seppänen

A theoretical framework for learning from a pool of disparate data sources.

Shai Ben-David Johannes Gehrke Reba Schuller

Frequent term-based text clustering.

Florian Beil Martin Ester Xiaowei Xu

Sequential PAttern mining using a bitmap representation.

Jay Ayres Jason Flannick Johannes Gehrke Tomi Yiu

Collaborative crawling: mining user experiences for topical resource discovery.

Charu C. Aggarwal

Mining heterogeneous gene expression data with time lagged recurrent neural networks.

Yulan Liang Arpad Kelemen

On the potential of domain literature for clustering and Bayesian network learning.

Peter Antal Patrick Glenisson Geert Fannes

Handling very large numbers of association rules in the analysis of microarray data.

Alexander Tuzhilin Gediminas Adomavicius

ADMIT: anomaly-based data mining for intrusions.

Karlton Sequeira Mohammed Javeed Zaki

Learning nonstationary models of normal network traffic for detecting novel attacks.

Matthew V. Mahoney Philip K. Chan

Mining intrusion detection alarms for actionable knowledge.

Klaus Julisch Marc Dacier

A system for real-time competitive market intelligence.

Sholom M. Weiss Naval K. Verma

Learning domain-independent string transformation weights for high accuracy object identification.

Sheila Tejada Craig A. Knoblock Steven Minton

Mining product reputations on the Web.

Satoshi Morinaga Kenji Yamanishi Kenji Tateishi Toshikazu Fukushima

Customer lifetime value modeling and its use for customer retention planning.

Saharon Rosset Einat Neumann Uri Eick Nurit Vatnik Yizhak Idan

Exploiting response models: optimizing cross-sell and up-sell opportunities in banking.

Andrew Storey Marc-David Cohen

From run-time behavior to usage scenarios: an interaction-pattern mining approach.

Mohammad El-Ramly Eleni Stroulia Paul G. Sorenson

Efficient handling of high-dimensional feature spaces by randomized classifier ensembles.

Aleksander Kolcz Xiaomei Sun Jugal K. Kalita

Predicting rare classes: can boosting make any weak learner strong?

Mahesh V. Joshi Ramesh C. Agarwal Vipin Kumar

Exploiting unlabeled data in ensemble methods.

Kristin P. Bennett Ayhan Demiriz Richard Maclin

Transforming data to satisfy privacy constraints.

Vijay S. Iyengar

Interactive deduplication using active learning.

Sunita Sarawagi Anuradha Bhamidipaty

Sequential cost-sensitive decision making with reinforcement learning.

Edwin P. D. Pednault Naoki Abe Bianca Zadrozny

Web site mining: a new way to spot competitors, customers and suppliers in the world wide web.

Martin Ester Hans-Peter Kriegel Matthias Schubert

PEBL: positive example based learning for Web page classification using SVM.

Hwanjo Yu Jiawei Han Kevin Chen-Chuan Chang

Mining frequent item sets by opportunistic projection.

Junqiang Liu Yunhe Pan Ke Wang Jiawei Han

Privacy preserving mining of association rules.

Alexandre V. Evfimievski Ramakrishnan Srikant Rakesh Agrawal Johannes Gehrke

A refinement approach to handling model misfit in text categorization.

Haoran Wu Tong-Heng Phang Bing Liu Xiaoli Li

A parallel learning algorithm for text classification.

Canasai Kruengkrai Chuleerat Jaruskulchai

Enhanced word clustering for hierarchical text classification.

Inderjit S. Dhillon Subramanyam Mallela Rahul Kumar

Hierarchical model-based clustering of large datasets through fractionation and refractionation.

Jeremy Tantrum Alejandro Murua Werner Stuetzle

Shrinkage estimator generalizations of Proximal Support Vector Machines.

Deepak K. Agarwal

On effective classification of strings with wavelets.

Charu C. Aggarwal

Pattern discovery in sequences under a Markov assumption.

Darya Chudova Padhraic Smyth

Relational Markov models and their application to adaptive web navigation.

Corin R. Anderson Pedro M. Domingos Daniel S. Weld

Optimizing search engines using clickthrough data.

Thorsten Joachims

On interactive visualization of high-dimensional data using the hyperbolic plane.

Jörg A. Walter Helge J. Ritter

Query, analysis, and visualization of hierarchically structured data using Polaris.

Chris Stolte Diane Tang Pat Hanrahan

On the need for time series data mining benchmarks: a survey and empirical demonstration.

Eamonn J. Keogh Shruti Kasetty

Bursty and hierarchical structure in streams.

Jon M. Kleinberg

ANF: a fast and scalable tool for data mining in massive graphs.

Christopher R. Palmer Phillip B. Gibbons Christos Faloutsos

Efficiently mining frequent trees in a forest.

Mohammed Javeed Zaki

Mining knowledge-sharing sites for viral marketing.

Matthew Richardson Pedro M. Domingos

Querying multiple sets of discovered rules.

Alexander Tuzhilin Bing Liu

DualMiner: a dual-pruning algorithm for itemsets with constraints.

Cristian Bucila Johannes Gehrke Daniel Kifer Walker M. White

Selecting the right interestingness measure for association patterns.

Pang-Ning Tan Vipin Kumar Jaideep Srivastava

MARK: a boosting algorithm for heterogeneous kernel models.

Kristin P. Bennett Michinari Momma Mark J. Embrechts

Scalable robust covariance and correlation estimates for data mining.

Fatemah A. Alqallaf Kjell P. Konis R. Douglas Martin Ruben H. Zamar

Bayesian analysis of massive datasets via particle filters.

Greg Ridgeway David Madigan