1. 알고리즘별 정의, 장점, 단점 정리

종류 정의 장점 단점 이용
버블 정렬(Bubble Sort) 첫 번째 원소부터 인접한 원소끼리 계속 자리를 교환하면 맨 끝까지 정렬하는 방식 구현이 간단
코드가 직관
정렬 시간이 오래 걸림 이미 정렬된 데이터를 정렬 시에 빠르다(반대로 역순 배열은 가장 느림)
선택 정렬(Selection Sort) 최소 값을 찾고 그 값을 맨 앞에 위치한 값과 교체하는 방식(반복) 구현이 간단
비교하는 횟수에 비해 교환이 적게 일어남 
버블 정렬보다 빠름
정렬 시간이 오래 걸림 많은 교환이 일어나야 하는 자료 상태에서 비교적 효율적(역순 정렬)
이미 정렬된 상태에서 소수의 자료가 추가됨으로 재정렬할 시 최악
삽입 정렬(Insertion Sort) 자료 배열의 모든 요소를 앞에서부터 차례대로 이미 정렬된 배열 부분과 비교하여 자신위 위치를 찾아 삽입하는 방식 최선의 경우 O(N)으로 정렬 가능 최악의 경우 O(N^2)이 걸림 다른 정렬 알고리즘의 일부로 쓰임
이미 정렬된 경우 아주 최고의 정렬 알고리즘(탐색을 제외한 오버헤드가 매우 적음)
합병 정렬(Merge Sort) 작은 단위로 잘게 쪼개어 작은 단위부터 정렬해서 정렬된 단위들을 계속 병합해가면서 정렬하는 방식 항상 O(NlogN)으로 일정한 속도로 정렬 추가적인 메모리 공간 필요(임시 배열에 원본 맵을 계속해서 옮겨주면서 정렬하는 방법) 순차적인 비교로 정렬하기에 LinkedList의 정렬에 사용하면 효율적
크기가 큰 레코드 정렬 시 효율적
퀵 정렬(Quick Sort) Pivot을 정하여 이 축의 값보다 작은 값은 왼쪽에 큰 값은 오른쪽으로 위치시킨뒤 왼쪽과 오른쪽의 수들을 다시 각각의 축으로 나누어져 축 값이 가장 작은 값이 될 때까지 정렬 평균 실행시간 O(NlogN)으로 빠른 편 Pivot에 따라 성능 차이가 심함
최악의 경우 O(N^2)이 걸림
순차 접근이 아닌 임의 접근이기에 LinkedList를 퀵 정렬에 사용하면 성능이 좋지 않다
힙 정렬(Heap Sort) 최대 힙을 만들고 루트 노드를 던지고 마지막 노드를 루트 노드 위치에 넣고 다시 최대 힙 만들기를 반복 항상 O(NlogN)으로 빠른 편 다른 O(NlogN)의 정렬법보다 오래 걸림

가장 크거나 가장 작은 값을 구할 때
최대 K만큼 떨어진 요소들을 구할 때 : 삽입 정렬을 개선
쉘 정렬(Shell Sort) 삽입정렬의 개념을 확대하여 일반화한 정렬방법 O(NlogN)의 정렬법보다 빠름 설정 간격에 따라 성능 차이가 심함 삽입 정렬을 보안한 알고리즘으로 삽입 정렬 시 삽입되어야할 위치가 현재 위치에서 상당히 멀리 떨이진 곳에 정렬을 해야만 하는 경우 쉘 정렬 사용
기수 정렬(Radix Sort) 데이터의 비교를 통한 정렬이 아닌 분산 정렬을 이용한 정렬 방법으로 자릿수가 있는 데이터(정수, 문자열 등)에만 사용 가능 O(N) 속도로 굉장히 빨리 정렬 가능 '버킷'이라는 추가적인 메모리가 할당되어야 한다. 즉, 메모리가 생각보다 많이 소비
데이터 타입이 항상 일정해야함
구현을 위한 조건이 많이 붙음
자릿수가 있는 데이터를 정렬할 경우
계수 정렬(Counting Sort) 비교하지 않는 정렬로 정렬하기 위한 요소들이 몇 개씩 있는지 세어서 적절한 위치에 선형 시간에 정렬하는 방법 적은 개수의 숫자를 정렬할 때 빠름 추가적인 메모리(숫자 개수를 저장할 공간, 결과를 저장할 공간)가 필요
가장 큰 숫자에 영향을 받는다는 점
특정 범위내에서 반복되는 정수인 많은 데이터의 경우에 효율적 (만약 데이터의 특성을 파악하기 어렵다면 퀵 정렬을 이용하는 것이 유리)

 

2. 알고리즘별 시간복잡도 및 공간 복잡도

종류 평균  최선 최악  공간 복잡도
버블 정렬(Bubble Sort) O(N^2) O(N^2) O(N^2) O(N^2)
선택 정렬(Selection Sort) O(N^2) O(N^2) O(N^2) O(N)
삽입 정렬(Insertion Sort) O(N^2) O(N) O(N^2) O(N^2)
합병 정렬(Merge Sort) O(NlogN) O(NlogN) O(NlogN) O(NlogN)
퀵 정렬(Quick Sort) O(NlogN) O(NlogN) O(N^2) O(NlogN)
힙 정렬(Heap Sort) O(NlogN) O(NlogN) O(NlogN) O(NlogN)
쉘 정렬(Shell Sort) O(N^1.25) O(N^1.25) O(N^1.25) O(N)
기수 정렬(Radix Sort) O(dN) / d는 최대값의 자릿수 O(dN) O(dN) O(N)
계수 정렬(Counting Sort) O(N+k) O(N+k) O(N+k) O(K) / K는 K 크기만큼의 배열을 만들어야 한다는 뜻

 

ETC

  • 추가적인 메모리 할당이 불가능한 경우 병합 vs 큌 : 데이터가 최악인 것만 본다면 퀵 보다 병합 정렬이 훨씬 빠르지만 추가 메모리 할당이 없다면 병합 정렬은 사용 불가이기에 퀵을 써야한다
  • 안정 정렬 : 중복된 값을 입력 순서와 동일하게 정렬하는 특성 ex) 삽입 정렬, 버블 정렬, 합병 정렬, 계수 정렬
  • 불안정 정렬 : 중복된 값이 입력 순서와 동일하지 않게 정렬되는 특성 ex) 선택 정렬, 퀵 정렬, 힙 정렬
  • 기본으로 탑재 되어있는 언어의 라이브러리 중 정렬은 시간 복잡도가 보통 NlogN으로 잘 판단하여 사용할 것.
Data(자료)

참고 또는 분석을 위해 수집된 사실과 통계.

현실 세계로부터 수집되는 값 또는 이들의 집합이며 가공되기 전의 상태.

데이터를 가공하고 해석한 후의 상태를 정보(Information)이라고 한다.

 

자료구조(Data Structure)

컴퓨터 메모리상에서 데이터를 표현하건 저장하는 방법이다.

효과적으로 설계된 자료구조는 프로그램 실행시간을 단축하며 메모리 용량을 최소한으로 사용한다.

1. 단순 구조 (기본 자료형 + 사용자 정의 자료형)

 1-1. 2진수

 1-2. 정수, 실수

 1-3. 문자, 문자열

2. 선형 구조

 2-1. 리스트(배열)

 2-2. 연결 리스트

  - 단순 연결 리스트

  - 이중 연결 리스트

  - 원형 연결 리스트

 2-3. 데크

 2-4. 스택

 2-5. 큐

3. 비선형 구조

 3-1. 트리

  - 일반 트리

  - 이진 트리

 3-2. 그래프 

  - 방향 그래프

  - 무방향 그래프

4. 파일 구조

 4-1. 순차 파일

 4-2. 색인 파일

 4-3. 직접 파일

 

알고리즘 (Algorithm)

저장된 데이터를 이용하여 문제를 해결하기 위한 절차나 방법

 

시간 복잡도 & 공간 복잡도(메모리)

효과적인 알고리즘을 얻기 위해 알고리즘의 성능을 분석하고 평가할 수 있어야 한다.

시간 복잡도(Time Complexity) : 알고리즘의 수행 시간을 분석한 결과, 알고리즘이 시작되어 완료되는 데까지 걸리는 시간 but 실제 실행 시간은 하드웨어 성능 혹은 프로그래밍 언어에 따라 값이 달라지므로 고려하지 않는다. 즉, 알고리즘에서의 시간 복잡도란 명령어의 실행 횟수를 뜻한다.

공간 복잡도(Space Complexity) : 메모리 사용량을 분석한 결과

 

Big-O 표기법

알고리즘의 시간복잡도와 공간복잡도를 표현하는 대표적인 방법에는 Big-O 표기법이 있다.

이 표기법은 알고리즘 실행에 있어 최악의 경우를 나타낸다.

즉, 시간 또는 공간의 상한선을 두는 것이다.

예를 들어 3n^2 + 20n + 100 이라는 시간복잡도 함수가 있으면 입력값 n이 증가할수록 차수가 가장 큰 항이 결과값에 가장 큰 영향을 

미치며, 다른 항들은 상대적으로 무신된다. 최고 차항의 상수 계수 3 또한 무시된다.

따라서, Big-O 표기법에서는 영향력이 없는 항과 상수 계수를 제거하고 가장 영향력이 큰 항으로만 시간복잡도를 표현한다.

O(1) < O(log n) < O(n) < O(n log n) < O(n^2) < O(n^3) < O(2^n) < O(n!) : 오른쪽으로 갈수록 비효율적인 순서

 

자료구조 연산별 평균 시간복잡도
자료구조 접근  검색 입력 삭제
배열 리스트  O(1) O(n) O(n) O(n)
단일 연결 리스트 O(n) O(n) O(1) O(1)
이중 연결 리스트 O(n) O(n) O(1) O(1)
스택 O(n) O(n) O(1) O(1)
O(n) O(n) O(1) O(1)
해시 테이블 불가 O(1) O(1) O(1)
이진 트리 O(log n) O(log n) O(log n) O(log n)

 

그래서 알고리즘 어떻게 공부하는건데?

기본적인 개념을 알았으니 공부하는 방법에 대해 말해보겠습니다. 위 글을 읽어도 어떻게 공부해야하는지 감이 안 잡히실텐데요 

제 기준 공부 순서는

  1. 자신이 사용하는 언어로 자료구조들 구현해보기 (코딩테스트에서 제공이 안 될수있으므로 암기 해주시면 좋음)
  2. 유튜브나 검색을 통해 알고리즘 종류별로 공부 후 개념 파악 후 코드를 따라서 처본 후 확실하게 이해하기
  3. 문제 풀이를 통한 숙달과 재암기 및 응용

2번까지 공부하셨으면 문제에 대해 궁금하실 것 같은데 가장 기본적으로 백준을 통해 접근하시는게 좋을 것 같아 유형별로 

소개해드리겠습니다.

 

문제 유형 백준 문제 번호
입출력 2557, 1000, 2558, 10950, 10951, 10952, 10953, 11021, 11022, 11718, 11719, 11720, 11721, 2741,
2742, 2739, 1924, 8393, 10818, 2438, 2439, 2440, 2441, 2442, 2445, 2522, 2446, 10991,
10992
정렬 2751, 11650, 11651, 10814, 10825, 10989, 11652, 11004
스택 10828, 9012, 1079
10845
데크 10866
문자열 처리 10808, 10809, 10820, 2743, 11655, 10824, 11656
기타 자료구조 1406, 1158, 1168
기초 수학 10430, 2609, 1934, 1850, 9613, 11005, 2745, 1373, 1212, 2089, 11576, 1978, 1929, 11653,
10872, 1676, 2004, 6588  
그래프 1260, 11724, 1707, 10451, 2331, 9466, 2667, 4963, 7576, 2178, 2146, 1991, 11725, 1167, 196
이분탐색/삼분탐색 1654, 2805, 2110, 10815, 10816, 11662
분할정복 11728, 1780, 11729, 1992, 2447, 2448, 1517, 2261
완전탐색 1476, 1107, 1451, 9095, 10819, 10971, 1697, 1963, 9019, 1525, 2251, 2186, 3108, 5014, 1759,
2580, 1987, 6603, 1182, 2003, 1806, 1644, 1261, 1208, 7453, 2632, 2143
그리디 11047, 2875, 10610, 1783, 1931, 11399, 2873, 1744 
DP 1463, 11726, 11727, 9095, 10844, 11057, 2193, 9465, 2156, 11053, 11055, 11722, 11054, 1912,
2579, 1699, 2133, 9461, 2225, 2011, 11052

 

주의 사항으론 문제 해결 시간을 자기만의 기준을 세워서 (약 30분 ~ 1시간) 그 시간안에 풀지 못할 시 단계적으로 힌트를 보고 

풀어보며 그래도 안 될시 답을 보며 재학습을 하는게 좋습니다.

백준 알고리즘을 다 푸셔서 기본 토대가 마련되셨으면 프로그래머스, 리트코드, 코드포스 등을 통해 더 높은 난이도의 알고리즘을 통해

연습하시면 될 것 같습니다

+ Recent posts