CS

[알고리즘] 개념 정리하기

zin502 2023. 9. 2. 17:20

다이나믹 프로그래밍

연산 속도와 메모리 공간을 최대한으로 활용할 수 있는 효율적인 알고리즘을 작성하는데 해결할 수 있는 대표적인 방법.

  • 큰 문제를 작은 문제로 나누어 푸는 문제를 일컫는 말 / 한 번 계산한 문제는 다시 계산하지 않도록 하는 알고리즘
  • DP는 다음의 조건을 만족할 때 사용할 수 있음
    1. 최적 부분 구조 (Optimal Substructure)
      큰 문제를 작은 문제로 나눌 수 있고, 작은 문제의 답을 모아 큰 문제를 해결할 수 있는 경우를 의미
    2. 중복되는 부분 문제 (Overlapping Subproblem)
      동일한 작은 문제를 반복적으로 해결해야 하는 경우

피보나치 수열

피보나치 수열이란 이전 두 항의 합을 현재의 항으로 설정하는 특징을 가진 수열이다.

점화식

풀이 _ 단순 재귀 함수

def fibo(x):
    if x == 1 or x == 2:
        return 1
    return fibo(x - 1) + fibo(x - 2)

print(fibo(4))
>> 3

문제점

위와 같이 코드를 작성하게 되면 심각한 문제가 생길 수 있다. f(n)함수에서 n이 커지면 커질수록 수행 시간이 기하급수적으로 늘어나기 때문이다.

DP로 피보나치 수열 계산하기

DP는 항상 사용할 수 없기 때문에 DP의 사용 조건을 만족하는지 확인해보자.

  1. 큰 문제를 작은 문제로 나눌 수 있다.
  2. 작은 문제에서 구한 정답은 그것을 포함하는 큰 문제에서도 동일하다.

피보나치 수열은 위 2가지 조건을 만족하므로 DP를 사용할 수 있다! 이 문제를 메모이제이션 (Memoization) 기법을 사용해서 해결해보자.

# 메모이제이션하기 위한 리스트 초기화
memoization = [0] * 100


# 피보나치 함수를 재귀함수로 구현 (Top-down DP)
def fibo(x):
    if x == 1 or x == 2:
        return 1
    # 이미 계산한 적 있으면 그대로 반환
    if memoization[x] != 0:
        return memoization[x]
    # 계산한 적 없으면 점화식에 따라 피보나치 결과 반환
    memoization[x] = fibo(x - 1) + fibo(x - 2)
    return memoization[x]


print(fibo(6))

그래프

노드와 노드 사이에 연결된 간선의 정보를 가지고 있는 자료구조.

구현 방법

노드 개수 V, 간선 개수 E 일때

  • 인접 행렬(Adjacency Matrix) : 2차원 배열을 사용하는 방식
O(V^2)만큼의 메모리 공간 필요
간선의 비용을 아는데 O(1)의 시간 소요
  • 인접 리스트(Adjacency List) : 리스트를 사용하는 방식
O(E)만큼의 메모리 공간 필요
간선의 비용을 아는데 O(V)만큼의 시간 소요

다양한 그래프 알고리즘

다익스트라 최단 경로 알고리즘

  • 인접 리스트(Adjacency List)를 이용하는 방식
  • 노드의 개수가 V개 일 때 V개의 리스트를 만들어 각 노드와 연결된 모든 간선에 대한 정보를 리스트에 저장
  • 최단 경로를 찾아야하는 문제에서, 노드와 간선의 개수가 많은 경우 우선순위 큐와 함께 사용

플로이드 와샬 알고리즘

  • 인접 행렬(Adjacency Matrix)을 이용하는 방식
  • 모든 노드에 대하여 다른 노드로 가는 최소 비용을 V^2 크기의 2차원 리스트에 저장한 뒤 해당 비용 갱신 -> 최단 거리 계산
  • 최단 경로를 찾아야하는 문제에서, 노드의 개수가 적은 경우 사용

 

최단 경로

최단 경로 알고리즘은 가장 짧은 경로를 찾는 알고리즘

  • 다양한 문제 상황
    • 한 지점에서 다른 한 지점까지의 최단 경로
    • 한 지점에서 다른 모든 지점까지의 최단 경로
    • 모든 지점에서 다른 모든 지점까지의 최단 경로
  • 각 지점은 그래프에서 노드(=도시, 나라)로 표현
  • 지점 간 연결된 도로는 그래프에서 간선으로 표현

다익스트라 최단 경로 알고리즘 개요

  • 다익스트라 최단 경로 알고리즘 == 다익스트라 알고리즘
  • 특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산합니다
  • 다익스트라 최단 경로 알고리즘은 음의 간선이 없을 때 정상적으로 동작합니다.
    • 현실 세계의 도로(간선)은 음의 간선으로 표현되지 않습니다.
  • 다익스트라 최단 경로 알고리즘은 그리디 알고리즘으로 분류됩니다.
    • 매 상황에서 가장 비용이 적은 노드를 선택해 임의의 과정을 반복합니다.

다익스트라 최단 경로 알고리즘

  • 알고리즘의 동작 과정
    1. 출발 노드 설정
    2. 최단 거리 테이블 초기화(모든 노드로 가는 비용 = inf, 자신으로 가는 비용 = 0)
    3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택
    4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신
    5. 위 과정에서 3, 4번을 반복

=> 각 노드까지의 최단 거리만 알 수 있게된다. 실제로 최단 경로를 알기위해선 별도의 로직이 필요합니다. 다만 완전한 최단 경로를 출력하라는 형태의 문제는 코딩테스트에서 잘 출제되지 않습니다.

따라서 본 교안에서는 출발노드로 부터 다른 모든 노드까지의 최단 거리 테이블을 구하는 것을 목표로 하겠습니다.

  • 알고리즘 동작 과정에서 최단 거리 테이블은 각 노드에 대한 현재까지의 최단 거리 정보를 가지고 있습니다.
  • 처리 과정에서 더 짧은 경로를 찾으면 '이제부터는 이 경로가 제일 짧은 경로야'라고 갱신합니다.

아래 그림에서 맨 처음에는 "A를 가는 최단 경로는 8이 겠네!"라고 할 수 있지만 다익스트라 알고리즘을 거치면서 아래와 같이 바뀝니다.(최단 거리 테이블 갱신)

다익스트라 알고리즘: 동작 과정 살펴보기

=> 2번 노드로 갈때 현재값(=inf) > 0+2 이므로 2로 갱신합니다(True)

시작노드(1번 노드)에서 다른 노드로 갈떄 최소값

즉, 1번 노드에서 다른 노드로 갈때의 값 들 중에서 최소값(4번 노드로 가고, 거리 1)은 절대 바뀌지 않습니다. => 그리디 알고리즘인 이유

  • 2, 5 노드 중 앞에 것을 먼저 선택(순서는 상관x)

시작노드(1번 노드)에서 3번 노드까지 갈때 2번 노드를 거쳐가는 경우이므로

기존에 시작노드에서 3번 노드로 가는 최소 거리는 1--(1)--> 4 ---(3)--->3 (4)이므로

1 ---(2)-----> 2 ---(3)---> 3 (5)와 비교했을 때 기존의 1->4->3 경로가 더 최소이므로 갱신x(False)

다익스트라 알고리즘의 특징

  • 그리디 알고리즘: 매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택해 임의의 과정을 반복합니다.
  • 단계를 거치며 한 번 처리된 노드의 최단 거리는 고정되어 더 이상 바뀌지 않습니다.
    • 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있습니다.
  • 다익스트라 알고리즘을 수행한 뒤에 테이블에 각 노드까지의 최단 거리 정보가 저장됩니다.
    • 완벽한 형태의 최단 경로를 구하려면 소스코드에 추가적인 기능을 더 넣어야 합니다.

다익스트라 알고리즘: 간단한 구현 방법

  • 단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 테이블의 모든 원소를 확인(순차 탐색)합니다.
import sys
input = sys.stdin.readline

INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수 입력받기 
n, m = map(int, input().split())
start = int(input())

# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 생성
graph = [[] for _ in range(n+1)] #0번은 취급하지 않기위해 n+1길이만큼 생성 -> 노드연결정보
# 방문한 적이 있는지 체크하는 목적의 리스트를 만들기
visited = [False]*(n + 1)

# 최단거리테이블을 모두 무한으로 초기화
distance = [INF] * (n+1) # 최단거리테이블

#모든 간성정보를 입력받기
for _ in range(m):
    a, b, c = map(int, input().split())
    graph[a].append((b, c)) #a에서부터 b까지 가는 거리가 c다
    # a ----(c)-----> b
    
def get_smallest_node():
    min_value = INF
    index = 0 #가장 최단 거리가 짧은 노드(인덱스)
    for i in range(1, n+1):
        if distance[i] < min_value and not visited[i]:
            min_value = distance[i]
          	index = i
    return index # 방문하지 않은 노드중 최단 거리값이 짧은 노드의 인덱스 반환

# 다익스트라 알고리즘 - 방문처리여부를 확인 필요X
def dijkstra(start):
    # 시작노드에 대해서 초기화
    distance[start] = 0
    visited[start] = True
    for j in graph[start]:
        distance[j[0]] = j[1]
    # 시작노드를 제외한 전체 n - 1개의 노드에 대해 반복
    for i inr range(n - 1):
        # 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
        now = get_smallest_node()
        visited[now] = True
        # 현재 노드와 연결된 다른 노드를 확인
        for j in graph[now]:
            cost = distance[now] + j[1]
            # 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[j[0]]:
                distance[j[0]] = cost
# 다익스트라 호출
dijkstra(start)

# 다익스트라 수행후 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n + 1):
    # 도달할 수 없는 경우, 무한(inf)라고 출력
    if distance[i] == INF:
        print('inf')
    else:
        print(distance[i])

다익스트라 알고리즘: 간단한 구현 방법 성능 분석

  • 총 O(V)번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야 합니다.
  • 따라서 전체 시간 복잡도는 O(V^2)입니다.
  • 일반적으로 코딩 테스트의 최단 경로 문제에서 전체 노드의 개수가 5,000개 이하라면 위 코드로도 문제를 해결할 수 있습니다. (파이썬은 1초에 약 2천만번 연산 수행가능)