阅读全文 机器学习 2019-05-12 阅读 线性回归:从数学原理到代码实现 线性回归:从数学原理到代码实现线性回归是最基础的机器学习算法,也是理解更复杂模型的基石。本文将从数学原理出发,逐步实现线性回归。 数学原理线性回归假设目标变量与特征之间存在线性关系: $$\hat{y} = w_1x_1 + w_2x_2 + \cdots + w_nx_n + b &#x...
阅读全文 深度学习 2019-04-25 阅读 梯度下降优化算法演进:从SGD到Adam 梯度下降优化算法演进:从SGD到Adam优化算法是深度学习训练的核心,从最基础的梯度下降到自适应学习率方法,优化算法经历了持续演进。 批量梯度下降(BGD)BGD使用全部训练数据计算梯度: 12345678910111213141516171819import numpy as npdef batc...
阅读全文 深度学习 2019-04-08 阅读 损失函数全面指南:从MSE到CrossEntropy 损失函数全面指南:从MSE到CrossEntropy损失函数是衡量模型预测与真实标签之间差异的函数,是模型优化的核心。选择合适的损失函数对训练效果至关重要。 回归损失函数均方误差(MSE)MSE是最常用的回归损失函数: $$L_{MSE} = \frac{1}{n}\sum_{i=...
阅读全文 深度学习 2019-03-20 阅读 激活函数深度解析:从Sigmoid到Swish 激活函数深度解析:从Sigmoid到Swish激活函数是神经网络中引入非线性的关键组件,选择合适的激活函数对模型性能有着重要影响。 为什么需要激活函数如果没有激活函数,无论神经网络有多少层,其输出仅仅是输入的线性组合,无法学习复杂的非线性映射: 1234567891011import numpy a...
阅读全文 深度学习 2019-03-05 阅读 RNN循环神经网络与序列建模 RNN循环神经网络与序列建模循环神经网络(Recurrent Neural Network,RNN)是一类专门处理序列数据的神经网络,在自然语言处理、时间序列预测等领域有着广泛应用。 RNN基本原理RNN的核心思想是在处理序列数据时,利用隐藏状态(hidden state)保存历史信息: 12345...
阅读全文 深度学习 2019-02-10 阅读 CNN卷积神经网络原理详解 CNN卷积神经网络原理详解卷积神经网络(Convolutional Neural Network,CNN)是深度学习中最成功的架构之一,尤其在计算机视觉领域取得了突破性的成果。 卷积操作卷积是CNN的核心操作,通过卷积核在输入特征图上滑动,提取局部特征: 1234567891011121314151...
阅读全文 深度学习 2019-01-15 阅读 深度学习入门:从感知机到神经网络 从感知机到神经网络深度学习是当今人工智能领域最热门的技术之一,而理解深度学习的第一步就是从感知机开始,逐步理解神经网络的基本原理。 感知机(Perceptron)感知机是最简单的神经网络模型,由Frank Rosenblatt于1957年提出。它是一个二分类的线性分类模型: 123456789101...