logo
COMP95176 学分

计算机视觉

新南威尔士大学·University of New South Wales·悉尼

COMP9517《计算机视觉》是 新南威尔士大学 的公开课程页面。当前可确认的信息包括 6 学分,难度 难,公开通过率 85%。 页面已整理 10 周教学安排,3 个重点考核,方便你快速判断工作量、考核结构和适配度。 课程简介摘要:课程定位 COMP9517 是 UNSW 计算机硕士专业在‘感官智能’维度的核心选修课。

💪 压力
4 / 5
⭐ 含金量
5 / 5
✅ 通过率
0%

📖 课程概览

选课速读: COMP9517《计算机视觉》是 新南威尔士大学 的公开课程页面。当前可确认的信息包括 6 学分,难度 难,公开通过率 85%。 页面已整理 10 周教学安排,3 个重点考核,方便你快速判断工作量、考核结构和适配度。 课程简介摘要:课程定位 COMP9517 是 UNSW 计算机硕士专业在‘感官智能’维度的核心选修课。
### 课程定位 COMP9517 是 UNSW 计算机硕士专业在‘感官智能’维度的核心选修课。它解决了机器‘看懂世界’的底层命题:如何从二维像素中提取三维特征?如何让计算机识别并跟踪运动物体?它是通往自动驾驶算法、医学影像分析、及 AR/VR 研发岗位的硬核通行证。它将经典的图像处理算法、多视角几何与现代卷积神经网络 (CNN) 深度整合,是培养‘视觉算法专家’专业灵魂的必修课。 ### 技术栈与学习内容 课程围绕‘图像理解与空间重构’展开。核心技术栈包括:Python OpenCV 库、NumPy 以及深度学习框架 (PyTorch/TensorFlow)。学习内容涵盖:图像增强与空间域/频率域滤波、特征检测 (SIFT, SURF, Harris Corner)、图像分割 (Thresholding, K-means, GrabCut)、立体视觉 (Stereo Vision) 与运动估计 (Optical Flow)、以及基于深度学习的对象检测 (YOLO) 与语义分割。课程强调‘算法对光照、噪声及遮挡的鲁棒性’。 ### 课程结构 10 周理论高强度输出与两个极具实战意义的视觉项目结合。评估体系极具工业感:包含针对基础算法实现的每周 Lab、一个要求解决特定视觉场景(如医学细胞计数或交通流量监控)的 Major Project、以及一场强调几何推导、滤波器设计与模型对比能力的期末综合大考。该课极其强调‘数学变换与像素操作的直观关联’。 ### 适合人群 计算机硕士、或打算进入计算机视觉领域的理工科生。必须具备扎实的线性代数与 Python 编程基础。如果你想搞清楚‘特斯拉是如何识别红绿灯的’、或者渴望在未来的医疗人工智能领域建立核心算法壁垒,这门课是你的神功。建议每周投入 18-22 小时进行算法调优。

🧠 大神解析

📊 课程难度与压力分析

COMP9517 的难度属于‘数学与工程的混合双打’。你不仅要懂矩阵卷积,还要懂如何调参以适应不同的光影环境。难点在第七周的立体视觉几何(Epipolar Geometry),那一堆投影矩阵和对极线的数学推导会让很多数学功底弱的同学感到吃力。压力主要来自于 Major Project,你需要从头构建一个完整的 Pipeline,如果你的特征提取不够 Robust,你后面的目标分类准确率会惨不忍睹。及格容易(只要会调 OpenCV 库),但拿 HD 需要你对‘算法底层数学原理’有极高的造诣。挂科风险显著存在于对‘相机内参 vs 外参’物理意义的混淆上。

🎯 备考重点与高分策略

高分秘籍:‘得特征提取者得 Distinction,得三维几何者得 HD’。期末考试中,推导一个 Canny 算子的非极大值抑制步骤或手算一个 HOG 描述符是必考的大题。一定要练到能秒识别‘图像频率域的能量分布’。重点攻克‘基础矩阵 F 与本质矩阵 E 的物理关联’,那是区分普通码农与顶级视觉算法专家的标志。备考时,教材《Digital Image Processing》(Gonzalez) 是圣经。对于项目,HD 的关键在于‘端到端优化’——不仅给结果,还要分析你的系统在极端噪声(高斯/椒盐)下的崩溃点。重视 Tutorial 里的每一道相机标定题。

📚 学习建议与资源推荐

神级资源:Stanford 的 CS231n 课程视频,那是深度学习视觉的百科全书。如果传统视觉理解不了,强烈推荐去 YouTube 搜‘OpenCV Python Tutorials’。最重要的建议:养成‘先显示中间结果 (Intermediate Results)’的习惯,否则你永远不知道是哪一步让图像变黑了。利用好 Python 的 `Matplotlib` 进行可视化。学会使用‘LabelImg’进行高效的数据集标注。加入 UNSW 的 AI Society 探讨视觉前沿。

⚠️ 作业与 Lab 避坑指南

项目避坑:千万不要在第 10 周才跑模型训练!由于图像数据集往往很大,你可能需要数天时间来迭代。Assignment 写作中,严禁只贴彩色云图,必须写出你的‘预处理逻辑理由’——为什么你选了中值滤波而非均值?此外,注意 Final 考试有 Hurdle,关于‘傅里叶变换基础’的题目如果错太多会直接挂。考试时,带好直尺和圆规,画出的图像变换示意图必须清晰标准。注意:分清‘图像分割’与‘语义分割’在像素层级的本质差异。

💬 过来人经验分享

学长建议:这门课是为你进入自动驾驶公司(如 Waymo)或互联网大厂(如 ByteDance 视觉组)拿的‘视觉入场券’。学完后,你眼中的世界将不再是色彩,而是一个由梯度方向、特征点和几何约束构成的数字矩阵。建议找一个同样追求‘算法极致鲁棒性’的队友共同打磨程序。拿 HD 的关键:在报告中展现出你对‘光照一致性 (Illumination Invariance)’的考量。坚持住,通关 9517,你就真正跨过了从写码学生到视觉算法架构师的那道认知红线。这张成绩单是进入视觉行业最有力的逻辑背书。记住:视觉不是拍照,是推断真实。

📅 每周课程大纲

Week 1图像处理导论与空域增强
数字图像表示,灰度变换,直方图均衡化,卷积与平滑/锐化滤波器。
Week 2频率域处理与傅里叶变换
FFT 算法,高通/低通滤波器,去除周期性噪声,维纳滤波初步。
Week 3边缘检测与特征提取
Canny 边缘检测,哈里斯角点 (Harris Corner),霍夫变换 (Hough Transform) 检测几何图形。
Week 4尺度空间与 SIFT 描述符
尺度不变特征转换 (SIFT) 详解,特征匹配算法,处理图像旋转与缩放的不变性。
Week 5图像分割技术
全局阈值 vs 自适应阈值,区域生长,K-means 聚类分割,分水岭算法 (Watershed)。
Week 6灵活性周 (Flex Week)
复习特征检测数学背景,冲刺 Major Project 的视觉系统建模,练习 OpenCV 优化。
Week 7多视角几何与立体视觉
相机模型与标定,对极几何 (Epipolar Geometry),视差图 (Disparity Map) 生成三维点云。
Week 8运动分析与目标跟踪
光流法 (Optical Flow - Lucas-Kanade),背景建模与减除,均值偏移 (Mean Shift) 跟踪。
Week 9深度学习在视觉中的应用
CNN 架构,池化与激活函数,迁移学习 (Transfer Learning) 实现复杂目标识别。
Week 10计算机视觉前沿与全课总结
三维重建初步,图像超分辨率;全学期视觉逻辑大复盘;期末大冲刺。

📋 课程信息

学分
6 Credit Points
含金量
5 / 5
压力指数
4 / 5
课程类型
elective

💬 学生评价

💭

还没有同学评价这门课,成为第一个分享体验的人吧

写点评