阅读全文 计算机视觉 2020-03-15 阅读 ViT视觉Transformer论文解读与实践 引言Vision Transformer (ViT) 将Transformer架构成功应用于计算机视觉任务。 核心思想将图像划分为patch,每个patch作为一个”token”输入Transformer。 graph TB A[输入图像] --> B[划分为Patches] B -...
阅读全文 自然语言处理 2020-02-28 阅读 GPT-2文本生成原理与实战 GPT-2概述GPT-2是OpenAI开发的大型语言模型,以其强大的文本生成能力闻名。 模型架构GPT-2基于Transformer decoder: 1234from transformers import GPT2LMHeadModel, GPT2Tokenizertokenizer = GPT...
阅读全文 自然语言处理 2020-02-15 阅读 BERT预训练模型实战微调指南 BERT概述BERT(Bidirectional Encoder Representations from Transformers)是NLP领域的里程碑模型。 模型结构graph TB A[输入] --> B[Token Embedding] A --> C[Segment Emb...
阅读全文 深度学习 2020-01-25 阅读 TensorFlow 2.0新特性与实战指南 TensorFlow 2.0重大更新TensorFlow 2.0是TF史上最重要的升级,带来了诸多革命性变化。 核心改进1. Keras集成2.0将Keras作为官方高级API: 123456789101112131415import tensorflow as tfmodel = tf.keras...
阅读全文 深度学习 2020-01-10 阅读 PyTorch深度学习快速入门指南 PyTorch概述PyTorch是由Facebook开发的深度学习框架,以其动态计算图和Pythonic的设计风格而广受欢迎。本文将带您快速入门PyTorch,掌握深度学习开发的核心技能。 PyTorch核心概念张量(Tensor)张量是PyTorch的基本数据结构,类似于NumPy的数组,但可以在...
阅读全文 安装与配置 2020-01-05 阅读 解决安装AI算法库TensorFlow 2.0的最新入坑指南以及详细的安装教程【分别在linux和windows系统下安装】 (转载作者请注明出处) 废话不多说,直接上干货 …. 正文开始 众所周知,学习深度学习和人工智能技术的科技工作者对Tensorflow的安装一直是件麻烦的事情,其实也没那么难,只是在于操作的方法是否合理和规范而已。合理正确的安装命令和正确的操作环节是成功的关键因素。为此,我们在本文中将详细说明li...
阅读全文 深度学习 2020-01-05 阅读 自注意力机制详解:从数学原理到PyTorch实现 概述自注意力机制(Self-Attention)是Transformer架构的核心组件,它允许序列中的每个位置关注序列中的所有其他位置。本文将深入解析自注意力的数学原理,并通过PyTorch实现来加深理解。 自注意力机制原理核心思想自注意力机制的核心思想是:通过Query、Key、Value三个向量...
阅读全文 计算机视觉 2019-12-10 阅读 图像分类:从VGG到ResNet的演进 图像分类:从VGG到ResNet的演进图像分类是计算机视觉的基础任务,从VGG到ResNet,网络架构经历了重要演进。 VGGNetVGGNet的核心思想是使用小卷积核(3×3)堆叠代替大卷积核: 123456789101112131415161718192021222324252627282930...
阅读全文 深度学习框架 2019-11-25 阅读 Keras高级用法:回调、自定义层与多输入输出 Keras高级用法:回调、自定义层与多输入输出Keras作为TensorFlow的高级API,不仅简单易用,还提供了丰富的扩展能力。 回调机制(Callbacks)回调是Keras训练过程中的钩子函数,可以在训练的不同阶段执行自定义逻辑: 123456789101112131415161718192...
阅读全文 深度学习框架 2019-11-05 阅读 PyTorch入门实战:动态图与自动求导 PyTorch入门实战:动态图与自动求导PyTorch以其动态计算图和Pythonic的设计风格,成为学术界最受欢迎的深度学习框架。 张量操作123456789101112131415161718192021222324252627282930import torch# 创建张量a = torch....
阅读全文 深度学习框架 2019-10-15 阅读 TensorFlow入门教程:从张量到模型训练 TensorFlow入门教程:从张量到模型训练TensorFlow是Google开源的深度学习框架,以其强大的计算能力和灵活的架构被广泛应用。 张量(Tensor)张量是TensorFlow的核心数据结构: 1234567891011121314151617181920212223import te...
阅读全文 Python编程 2019-09-28 阅读 数据预处理技术大全 数据预处理技术大全数据预处理是机器学习 pipeline 中最关键的环节,好的预处理能显著提升模型性能。 缺失值处理1234567891011121314151617181920212223242526import numpy as npimport pandas as pdfrom sklearn...
阅读全文 Python编程 2019-09-10 阅读 Matplotlib数据可视化从入门到精通 Matplotlib数据可视化从入门到精通数据可视化是数据分析的重要环节,Matplotlib是Python最基础也最灵活的绘图库。 基础绘图123456789101112131415161718192021import matplotlib.pyplot as pltimport numpy as...
阅读全文 Python编程 2019-08-22 阅读 Pandas数据分析实战指南 Pandas数据分析实战指南Pandas是Python最强大的数据分析库,提供了高效的数据结构和分析工具。 核心数据结构Series123456789import pandas as pdimport numpy as np# 创建Seriess = pd.Series([1, 3, 5, np.n...
阅读全文 Python编程 2019-08-05 阅读 NumPy高效数值计算指南 NumPy高效数值计算指南NumPy是Python科学计算的基石,几乎所有数据科学和机器学习库都建立在NumPy之上。 NumPy数组基础12345678910111213141516import numpy as np# 创建数组a = np.array([1, 2, 3, 4, 5]) ...
阅读全文 机器学习 2019-07-20 阅读 K-Means聚类算法:从原理到实战 K-Means聚类算法:从原理到实战K-Means是最经典的无监督学习算法之一,用于将数据划分为K个簇,使簇内方差最小化。 算法原理K-Means的目标是最小化簇内平方误差和: $$J = \sum_{k=1}^{K}\sum_{\mathbf{x}_i \in C_k} |\m...
阅读全文 机器学习 2019-07-15 阅读 集成学习实战:从Bagging到Boosting 概述集成学习通过组合多个模型来提升性能,是 Kaggle 竞赛的必杀技。本文系统介绍从 Bagging 到 Boosting 的各种集成方法。 集成学习方法flowchart TB subgraph 集成学习 ENS[集成学习] ENS --> PARALLE...
阅读全文 机器学习 2019-07-02 阅读 决策树与随机森林:从信息增益到集成学习 决策树与随机森林:从信息增益到集成学习决策树是最直观的机器学习算法之一,而随机森林通过集成多棵决策树,显著提升了模型性能。 决策树基本原理决策树通过一系列规则对数据进行划分,每个内部节点表示一个属性判断,每个分支代表一个判断结果,每个叶节点代表一个类别或值。 信息增益信息增益基于信息熵来选择最优划分...
阅读全文 机器学习 2019-06-15 阅读 SVM支持向量机详解:从间隔最大化到核技巧 SVM支持向量机详解:从间隔最大化到核技巧支持向量机(Support Vector Machine,SVM)是机器学习中最优雅的算法之一,通过最大化分类间隔来实现良好的泛化能力。 线性可分SVMSVM的核心思想是找到一个超平面,使得两类样本之间的间隔最大: $$\max_{\mathbf{w}, b...
阅读全文 机器学习 2019-06-05 阅读 特征工程实战:从理论到代码 概述特征工程是机器学习成功的关键,本文系统介绍特征工程的各种技术与代码实现。 特征工程流程flowchart TB RAW[原始数据] --> CLEAN[数据清洗] CLEAN --> TRANS[特征变换] TRANS --> SEL[特征选择] SEL --> ...
阅读全文 机器学习 2019-05-28 阅读 逻辑回归与二分类问题 逻辑回归与二分类问题逻辑回归虽然名字中有”回归”,但实际是一种分类算法,广泛用于二分类问题。 从线性回归到逻辑回归线性回归的输出是连续值,而分类问题需要输出概率。逻辑回归通过Sigmoid函数将线性输出映射到(0,1)区间: $$P(y=1|\mathbf{x}) = \sigm...