Scikit-Learn

Scikit-learn是一个开源的机器学习库,支持有监督和无监督的学习。它还提供各种工具,用于模型拟合、数据预处理、模型选择、模型评估和其他许多实用工具。

Python
Google Summer of Code
机器学习
初始发布时间:2007年6月
工具描述

Scikit-learn(原名scikits.learn,又名sklearn)是一个用于Python编程语言的免费软件机器学习库。它具有各种分类、回归和聚类算法,包括支持向量机、随机森林、梯度提升、k-means和DBSCAN,并被设计为与Python数值和科学库NumPy和SciPy互操作。Scikit-learn是一个由NumFOCUS财政资助的项目。


scikit-learn项目始于scikits.learn,是法国数据科学家David Cournapeau的Google Summer of Code项目。它的名字源于它是一个 "SciKit"(SciPy工具包)的概念,它是SciPy的一个单独开发和分发的第三方扩展。原始代码库后来被其他开发者重写。2010年,Fabian Pedregosa、Gael Varoquaux、Alexandre Gramfort和Vincent Michel(他们都来自法国Rocquencourt的法国计算机科学与自动化研究所)领导了这个项目,并在2010年2月1日首次公开发布。在各种scikits中,scikit-learn以及scikit-image在2012年11月被描述为 "维护良好且受欢迎"。


Scikit-learn主要由Python编写,并广泛使用NumPy进行高性能的线性代数和阵列操作。此外,一些核心算法是用Cython编写的,以提高性能。支持向量机由LIBSVM周围的Cython包装器实现;逻辑回归和线性支持向量机由LIBLINEAR的类似包装器实现。在这种情况下,用Python扩展这些方法可能是不可能的。


Scikit-learn与许多其他的Python库整合得很好,比如用于绘图的Matplotlib和plotly,用于数组矢量化的NumPy,Pandas数据帧,SciPy,等等。

是否开源:

许可协议: BSD-3-Clause license

官方地址: https://scikit-learn.org/stable/index.html

GitHub地址: https://github.com/scikit-learn/scikit-learn

初始贡献者: David Cournapeau

最佳实践指南

官方文档:https://scikit-learn.org/stable/user_guide.html

Google Summer of Code-logo
pytorch-logo
推荐工具

TensorFlow - 深度学习

MindSpore - 深度学习