1.神经网络常用组件

神经网络是一种模拟人脑神经元工作方式的人工智能模型。它由多层神经元组成，每一层都由多个神经元节点组成。每个节点接收来自上一层节点的输入，并将经过权重加权和偏置处理后的结果传递给下一层。下面是一个典型的神经网络结构：

输入层（Input Layer）：接受来自数据源的输入数据。
隐藏层（Hidden Layers）：位于输入层和输出层之间的层。每个隐藏层由多个神经元组成。隐藏层的数量和每层的神经元数量是可以调整的超参数。
全连接层（Fully Connected Layers）：也称为密集连接层或仿射层，每个节点都与前一层的所有节点相连。全连接层进行线性变换，其参数包括权重和偏置。线性变换的输出通常会经过一个激活函数。
激活函数层（Activation Layer）：激活函数引入非线性特性，常见的激活函数包括：
- Sigmoid 函数：将输入映射到 (0, 1) 区间，适用于二分类问题。
- Tanh 函数：将输入映射到 (-1, 1) 区间，也适用于二分类问题。
- ReLU 函数（Rectified Linear Unit）：当输入大于零时返回输入值，否则返回零。ReLU函数在深度学习中广泛应用。
- GELU 函数（Gaussian Error Linear Unit）：一种平滑的非线性激活函数，在某些任务上效果良好。
输出层（Output Layer）：输出层通常用于输出预测结果。输出层的结构取决于具体的任务类型。例如：
- 对于分类任务，可以使用softmax函数输出每个类别的概率分布。
- 对于回归任务，可以直接输出预测值。
损失函数层（Loss Function Layer）：损失函数用于衡量模型输出与真实标签之间的差异，常见的损失函数包括：
- 均方误差（Mean Squared Error，MSE）：适用于回归任务。
- 交叉熵损失（Cross Entropy Loss）：适用于分类任务，特别是多分类任务。

在训练过程中，神经网络通过反向传播算法不断调整参数，使得损失函数达到最小值，从而提高模型的预测能力。

菜单

分享

1.神经网络常用组件

评论

三战微调大模型

命名实体识别的评估指标

微调大模型

nlp笔记

Topic Modelling tutorial

kaggel:宇宙飞船泰坦尼克号（随机决策树）

读懂Transformer

深度学习处理文本分类

day21 回溯法

4.RNN中文分词