COMP9517《计算机视觉》是 新南威尔士大学 的公开课程页面。当前可确认的信息包括 6 学分,难度 难,公开通过率 85%。 页面已整理 10 周教学安排,3 个重点考核,方便你快速判断工作量、考核结构和适配度。 课程简介摘要:课程定位 COMP9517 是 UNSW 计算机硕士专业在‘感官智能’维度的核心选修课。
COMP9517 的难度属于‘数学与工程的混合双打’。你不仅要懂矩阵卷积,还要懂如何调参以适应不同的光影环境。难点在第七周的立体视觉几何(Epipolar Geometry),那一堆投影矩阵和对极线的数学推导会让很多数学功底弱的同学感到吃力。压力主要来自于 Major Project,你需要从头构建一个完整的 Pipeline,如果你的特征提取不够 Robust,你后面的目标分类准确率会惨不忍睹。及格容易(只要会调 OpenCV 库),但拿 HD 需要你对‘算法底层数学原理’有极高的造诣。挂科风险显著存在于对‘相机内参 vs 外参’物理意义的混淆上。
高分秘籍:‘得特征提取者得 Distinction,得三维几何者得 HD’。期末考试中,推导一个 Canny 算子的非极大值抑制步骤或手算一个 HOG 描述符是必考的大题。一定要练到能秒识别‘图像频率域的能量分布’。重点攻克‘基础矩阵 F 与本质矩阵 E 的物理关联’,那是区分普通码农与顶级视觉算法专家的标志。备考时,教材《Digital Image Processing》(Gonzalez) 是圣经。对于项目,HD 的关键在于‘端到端优化’——不仅给结果,还要分析你的系统在极端噪声(高斯/椒盐)下的崩溃点。重视 Tutorial 里的每一道相机标定题。
神级资源:Stanford 的 CS231n 课程视频,那是深度学习视觉的百科全书。如果传统视觉理解不了,强烈推荐去 YouTube 搜‘OpenCV Python Tutorials’。最重要的建议:养成‘先显示中间结果 (Intermediate Results)’的习惯,否则你永远不知道是哪一步让图像变黑了。利用好 Python 的 `Matplotlib` 进行可视化。学会使用‘LabelImg’进行高效的数据集标注。加入 UNSW 的 AI Society 探讨视觉前沿。
项目避坑:千万不要在第 10 周才跑模型训练!由于图像数据集往往很大,你可能需要数天时间来迭代。Assignment 写作中,严禁只贴彩色云图,必须写出你的‘预处理逻辑理由’——为什么你选了中值滤波而非均值?此外,注意 Final 考试有 Hurdle,关于‘傅里叶变换基础’的题目如果错太多会直接挂。考试时,带好直尺和圆规,画出的图像变换示意图必须清晰标准。注意:分清‘图像分割’与‘语义分割’在像素层级的本质差异。
学长建议:这门课是为你进入自动驾驶公司(如 Waymo)或互联网大厂(如 ByteDance 视觉组)拿的‘视觉入场券’。学完后,你眼中的世界将不再是色彩,而是一个由梯度方向、特征点和几何约束构成的数字矩阵。建议找一个同样追求‘算法极致鲁棒性’的队友共同打磨程序。拿 HD 的关键:在报告中展现出你对‘光照一致性 (Illumination Invariance)’的考量。坚持住,通关 9517,你就真正跨过了从写码学生到视觉算法架构师的那道认知红线。这张成绩单是进入视觉行业最有力的逻辑背书。记住:视觉不是拍照,是推断真实。
