DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
  1. 首页/
  2. 博客列表/
  3. 博客详情

人工神经网络(Artificial Neural Network)算法简介

2017/04/10 17:09:09
10,775 阅读
人工智能人工神经网络机器学习神经网络

人工神经网络,简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或者计算模型。其实是一种与贝叶斯网络很像的一种算法。之前看过一些内容始终云里雾里,这次决定写一篇博客。弄懂这个基本原理,毕竟现在深度学习太火了。

神经网络是一种方法,既可以用来做有监督的任务,如分类、视觉识别等,也可以用作无监督的任务。首先,我们看一个简单的例子。如下图所示(这个图网上有很多人引用了,但我找不到出处,欢迎指正),如果我们想训练一个算法可以使其识别出是猫还是狗,这是很简单的一个分类任务,我们可以找一条线(模型),在这个二元坐标中进行“一刀切”,把这两组数据分开。我们知道,在解析几何中,这条直线可以用如下的公式表达:

y = w_1 \cdot x_1 + w_2 \cdot x_2 + w_0
**图1 猫狗数据**
**图2 一个简单的神经网络**

这里的$w_1$和$w_2$就是两个坐标轴上的系数,可以称为权重。$w_0$可以称作截距,也叫做偏移。新来一个数据点,也就是一组输入值$(x_1,x_2)$,如果在这条线的左边,那么它就是一只狗,如果在右边就是一只猫了。这就可以用一个简单的神经网络来表示。如图2所示,$x_1$和$x_2$分别是输入值,Y是输出值,两条边的权重分别是$w_1$和$w_2$。这是一个最简单的神经网络了。这就是使用神经网络定义了一个线性分类器了。这里的一个圆形的节点就是一个神经元。我们也可以采用另一种方式,即在输入输出之间加一个中间节点S,然后增加一个输出层,包括两个节点$Y_1$和$Y_2$,分别对应猫和狗,最后哪个输出节点的值大,那么这个数据就属于哪个类别(猫或者狗)。

对于简单的二分类问题这就可以解决了。但在实际情况中,有很多问题无法简单的使用“一刀切”的方式解决,如图3所示,假设猫和狗的数据分布如下图,那么这就无法用“一刀切”的方式来解决了,但是我们可以切两刀,横竖各一刀,然后把相同的“块”联合起来,这样就解决了比较复杂的分类问题了。也有些问题,需要用曲线来分割。在这种情况下,我们就需要比较复杂一点的神经网络了。以曲线为例,我们可以设计出一个三层的神经网络。这就是用神经网络设计的一个非线性分类器。理论上讲,如何一个分类器都可以设计一个神经网络来表征,也就是说,不管实际图形如何,我们都可以设计一个神经网络来拟合。到这里,可能有人问,每个节点的这个函数要如何选择?根据吴军老师《数学之美》第二版中的说法,为了提供人工神经网络的通用性,我们一般规定每个神经元的函数只能针对其输入的变量做一次非线性的变换。举个例子说就是假如某个神经元$Y$的输入值是$x_1,x_2,\ldots,x_n$,它们的边的权重分别为$w_1,w_2,\ldots,w_n$,那么计算Y节点的值分两步进行,第一步是计算来自输入值的线性组合:

G=w_0 + x_1 \cdot w_1 + x_2 \cdot w_2 + \ldots + x_n \cdot w_n

第二步是计算$y=f(G)$,这里的$f(\cdot)$可以使非线性的,但因为里面的参数是一个具体的值,所以不会很复杂。这两个步骤的结合使得人工神经网络既灵活又不至于太复杂。这里的$f(\cdot)$就是激活函数。线性模型的表达能力不够,它的作用就是来增强模型的表示能力。人工神经网络可以很多层连接在一起,因此在人工神经网络中,主要的工作就是设计结构(基层网络,每层几个节点等)和激活函数。我们常用的激活函数包括Sigmoid函数、ReLU函数、Tanh函数等等。如下图所示,这是几种简单的激活函数的示意图(https://ypwhs.gitbooks.io/nnplayground/content/Activation.html )

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • 2022年全球最大的10家数据处理相关的创业公司
  • 斯坦福2022年度AI指数报告简介及下载链接
  • 内容生成方向的人工智能企业
  • 吴恩达的LandingAI究竟是一家什么样的创业公司
  • 人工智能初创企业Hugging Face是什么样的企业——HuggingFace简介
  • 构建人工智能应用的开发者指南
  • 工业蒸汽量预测-特征工程
  • 一张图看全深度学习中下层软硬件体系结构

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署