Avatar
Saucejiang
图像处理基础 - DCT 变换
回顾 我们学习的传统 CV 方法几乎都集中于使用卷积: 直方图提取 Canny Edge Detection Harris Corner Detection 高斯模糊 LoG SIFT HOG 这一节我们还要简单接触一种基于频域的图像处理方法:离散余弦变换(Discrete cosine trans
图像处理基础 - SIFT 和 HOG
本节是另一课程的内容,但也可以视为 CV 导论从 Classic Vision II 那一节的一个补充 SIFT 早在遇到语义分割以前,传统 CV 在处理目标识别的 equivariance 的问题时就已经举步维艰,但仍然有一些很不错的方法;我们首先回顾希望目标识别满足的 equivariance:
图像处理基础 - PIL & moviepy & TTS
PIL from PIL import Image 打开图像 img = Image.open(path) 基本变换 img_resize = img.resize((400, 400), Image.Resampling.LANCZOS) img_gray = img.convert('L') i
Deep Learning IV - Batch Norm, ResNet, 过拟合的 tricks 和多分类问题
这是 2025 春 计算机视觉导论的笔记 Todo: 内容杂乱无章,十分愚蠢,或许未来会润色语言使它便于阅读 Underfitting Underfitting 模型在training set上都不好 原因:注意dataloader很容易有bug,别搞X.shuffle, Y.shuffle这种事情
Deep Learning III - Preprocess, Initialization, Optimizer, Learning Rate
这是 2025 春 计算机视觉导论的笔记 Todo: 内容杂乱无章,十分愚蠢,或许未来会润色语言使它便于阅读 本节聚焦 Training 的细节和努力减小 Training 和 Test 之间的 Gap CNN Training Mini-batch SGD:For loop Sample:Shuf
Deep Learning II - MLP 和 CNN
这是 2025 春 计算机视觉导论的笔记 Todo: 内容杂乱无章,十分愚蠢,或许未来会润色语言使它便于阅读 接上节:线性模型的 capasity/expressivity 太小了! Multi-Layer Perceptron (MLP) 线性层堆叠没有意义:\displaystyle \math
Deep Learning I - Machine Learning 101, SGD Optimization
这是 2025 春 计算机视觉导论的笔记 Todo: 内容杂乱无章,十分愚蠢,或许未来会润色语言使它便于阅读 Feature Description 我们现在在做什么:non-learning based method \displaystyle \to learning based method
Classic Vision II - OLS、RANSAC 和 Harris Corner Detection
这是 2025 春 计算机视觉导论的笔记 Todo: 内容杂乱无章,十分愚蠢,或许未来会润色语言使它便于阅读 Review 目标:Lane Detection 完成的部分:Edge Detection 现在的目标:从散点到直线,得到更好的 Line Fitting Least Square Meth
Classic Vision I - 图片、卷积和 Canny Edge Detection
这是 2025 春 计算机视觉导论的笔记 Todo: 内容杂乱无章,十分愚蠢,或许未来会润色语言使它便于阅读 Images as Functions Image as a function 我们把图片看作一个函数 f,它从 \mathrm{R}^2 映到 \mathrm{R}^M, 其中 f(x,
图像处理基础 - OpenCV 包
OpenCV 基本操作 图像读取 import cv2 img_uint = cv2.imread(path) img_uint = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img = img_uint / 255. cv2 默认读取 BGR, uint8(0