본 게시물은 Stanford University에서 진행 중인 CNN을 기반으로 한 Computer Vision에 대한 강의 정리입니다. 강의 영상이 외부인들에게는 2017년도까지 공개 중이기에 Spring 2024 자료와 함께 공부해 보려 합니다.
CS231n: Convolutional Neural Networks for Visual Recognition
Stanford University에서 제공하는 CS231n 강의는 컴퓨터 비전과 딥러닝을 다루는 대표적인 강의 중 하나입니다. 주요 내용으로는 CNN(합성곱 신경망)의 기본 개념, 이미지 분류, 객체 검출, 딥러닝 최적화 기법 등이 포함됩니다.
강의는 Spring 2024 기준으로 최신 연구 동향과 실습을 반영하며, Python과 TensorFlow/PyTorch를 활용한 실습 과제가 포함됩니다.
1강에서는 간략하게 Computer Vision의 역사와 cs231n의 개요에 대해 소개합니다.
Computer Vision이란, 컴퓨터 과학의 한 분야로 컴퓨터가 이미지와 같은 시각 정보를 인식하고 분석하는 시각 데이터 처리 능력을 갖는 것을 지향하는 것을 목표로 합니다.

긴 역사를 지나 2000년대 초, 객체인식은 Computer Vision 분야의 중요한 문제였으며 ImageNet 프로젝트를 통하여 큰 발전이 이루어졌습니다.

이때 대회에서 우승한 알고리즘인 대규모 데이터셋을 활용한 CNN: Convolutional Neural Network 모델이 현재의 Deep Learning의 한 형태이며, 모델의 동작 원리와 학습 방법이 이번 강의의 전반적인 주제가 될 것 같습니다.
중점적으로 다룰 주제는 시각적 인식(Visual Recognition)과 이미지 분류(Image Classfication)이며, 또한 물체 인식(Object Detection)과 이미지 캡셔닝(Image Captioning)과 같은 세부 토픽도 다룰 예정이라 합니다.
'cs231n' 카테고리의 다른 글
[cs231n] Lecture 2 | Image Classification with Linear Classifiers (1) | 2025.03.26 |
---|