더 맵게

 

매운 것을 좋아하는 Leo는 모든 음식의 스코빌 지수를 K 이상으로 만들고 싶습니다. 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 Leo는 스코빌 지수가 가장 낮은 두 개의 음식을 아래와 같이 특별한 방법으로 섞어 새로운 음식을 만듭니다.

 

섞은 음식의 스코빌 지수 = 가장 맵지 않은 음식의 스코빌 지수 + (두 번째로 맵지 않은 음식의 스코빌 지수 * 2)

 

Leo는 모든 음식의 스코빌 지수가 K 이상이 될 때까지 반복하여 섞습니다.
Leo가 가진 음식의 스코빌 지수를 담은 배열 scoville과 원하는 스코빌 지수 K가 주어질 때, 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 섞어야 하는 최소 횟수를 return 하도록 solution 함수를 작성해주세요.

 

제한 사항

 

  • scoville의 길이는 1 이상 1,000,000 이하입니다.
  • K는 0 이상 1,000,000,000 이하입니다.
  • scoville의 원소는 각각 0 이상 1,000,000 이하입니다.
  • 모든 음식의 스코빌 지수를 K 이상으로 만들 수 없는 경우에는 -1을 return 합니다.

힙을 이용해 최대/최소 원소를 빠르게 찾자!

 

연산

 

  • 힙 구성(heapify)
  • 삽입(insert) - O(logn)
  • 삭제(remove) - O(logn)

 

코드 구현

 

import heapq

def solution(scoville, K):
    #heapq.heapify(L) 
    #리스트 L로부터 min heap 구성
    #m = heapq.heappop(L) 
    #min heap L에서 최소값 삭제(반환)
    #heapq.heappush(L, x) 
    #min heap L에 원소 x 삽입
    
    answer = 0
    heapq.heapify(scoville)
    while True:
        min1 = heapq.heappop(scoville)
        if min1>=K:
            break
        elif len(scoville)==0:
            return -1
        else:
            min2 = heapq.heappop(scoville)
            new_scoville = min1 + 2*min2
            heapq.heappush(scoville, new_scoville)
            answer+=1
                            
    return answer

 

시간복잡도 : O(nlogn)


동적 계획법

 

N으로 표현

 

아래와 같이 5와 사칙연산만으로 12를 표현할 수 있습니다.

12 = 5 + 5 + (5 / 5) + (5 / 5)
12 = 55 / 5 + 5 / 5
12 = (55 + 5) / 5

5를 사용한 횟수는 각각 6,5,4 입니다. 그리고 이중 가장 작은 경우는 4입니다.
이처럼 숫자 N과 number가 주어질 때, N과 사칙연산만 사용해서 표현 할 수 있는 방법 중 N 사용횟수의 최솟값을 return 하도록 solution 함수를 작성하세요.

 

제한사항

  • N은 1 이상 9 이하입니다.
  • number는 1 이상 32,000 이하입니다.
  • 수식에는 괄호와 사칙연산만 가능하며 나누기 연산에서 나머지는 무시합니다.
  • 최솟값이 8보다 크면 -1을 return 합니다.

동적계획법(Dynamic Programming)

 

동적 계획법? 주로 최적화 문제를 재귀적인 방식으로 

보다 작은 부분 문제로 나눠 부분 문제를 풀어, 이 해를 조합하여

전체 문제의 해답에 이르는 방식

 

알고리즘 진행에 따라 탐색해야 할 범위를 동적으로 결정함으로써 탐색 범위를 한정할 수 있다.

 

동적계획법 적용 예 - 피보나치 수열

 

재귀함수로 구현한다면?

 

f(4) = f(3)                         + f(2)

f(3) = f(2)         + f(1) + f(1) + f(0)

f(2) = f(1) + f(0) + f(1) + f(1) + f(0)

 

복잡도가 지수함수의 형태로 나타나게 된다.

 

동적 계획법을 적용한다면?

 

f(0) = 0,       f(1) =1

f(2) = f(1) + f(1) = 2

f(3) = f(2) + f(1) = 2

f(4) = f(3) + f(2) = 3

 

복잡도가 선형함수의 형태로 나타나게 된다.

 

동적계획법 적용 예 - Knapsack Problem

=> 가장 높은 값을 가지도록 물건들을 골라 배낭에 담으시오.

 


코드 구현

 

def solution(N, number):
    if N==number:
        return 1
    s = [set() for x in range(8)]
    for i, x in enumerate(s, start =1):
        x.add(int(str(N) * i))
    
    for i in range(1, len(s)):
        for j in range(i):
            for op1 in s[j]:
                for op2 in s[i-j-1]:
                    s[i].add(op1 + op2)
                    s[i].add(op1 - op2)
                    s[i].add(op1 * op2)
                    if op2!=0:
                        s[i].add(op1 // op2)
        if number in s[i]:
            answer = i+1
            break
    else:
        answer=-1
        
    return answer

깊이/너비 우선 탐색(DFS/BFS)

 

여행경로

 

주어진 항공권을 모두 이용하여 여행경로를 짜려고 합니다. 항상 "ICN" 공항에서 출발합니다.

항공권 정보가 담긴 2차원 배열 tickets가 매개변수로 주어질 때, 방문하는 공항 경로를 배열에 담아 return 하도록 solution 함수를 작성해주세요.

 

제한사항

  • 모든 공항은 알파벳 대문자 3글자로 이루어집니다.
  • 주어진 공항 수는 3개 이상 10,000개 이하입니다.
  • tickets의 각 행 [a, b]는 a 공항에서 b 공항으로 가는 항공권이 있다는 의미입니다.
  • 주어진 항공권은 모두 사용해야 합니다.
  • 만일 가능한 경로가 2개 이상일 경우 알파벳 순서가 앞서는 경로를 return 합니다.
  • 모든 도시를 방문할 수 없는 경우는 주어지지 않습니다.

 


그래프 (graphs)

 

  • 정점(vertex, node)과 간선(edge, link)
  • 유향(directed) 그래프와 무향(undirected) 그래프
  • 스택으로 구현했을 때와 큐로 구현했을 때를 알아두면 좋음.

알고리즘 설계

 

  • 스택을 이용하여 재귀적 '한 붓 그리기' 문제를 해결
  • DFS를 응용한 문제

 

코드 구현

 

def solution(tickets):
    routes = {}
    for t in tickets:
        routes[t[0]]=routes.get(t[0],[]) + [t[1]]
    for r in routes:
        routes[r].sort(reverse=True)
    stack = ["ICN"]
    path = []
    while len(stack)>0:
        top = stack[-1]
        if top not in routes or len(routes[top]) ==0:
            path.append(stack.pop())
        else:
            stack.append(routes[top][-1])
            routes[top] = routes[top][:-1]
        
    return path[::-1]

시간복잡도 : O(nlogn) (5, 6행에 지배된다.)

'AI > KDT 인공지능' 카테고리의 다른 글

[04/26] 인공지능 수학 - 선형 시스템  (0) 2021.04.26
[4/26] 주피터 노트북  (0) 2021.04.26
[4/21] 코딩테스트 연습  (0) 2021.04.21
[4/21] 자료구조와 알고리즘(2)  (0) 2021.04.21
[4/20] 자료구조와 알고리즘  (0) 2021.04.20

해시

 

완주하지 못한 선수

 

수많은 마라톤 선수들이 마라톤에 참여하였습니다. 단 한 명의 선수를 제외하고는 모든 선수가 마라톤을 완주하였습니다.

마라톤에 참여한 선수들의 이름이 담긴 배열 participant와 완주한 선수들의 이름이 담긴 배열 completion이 주어질 때, 완주하지 못한 선수의 이름을 return 하도록 solution 함수를 작성해주세요.

 

제한사항

  • 마라톤 경기에 참여한 선수의 수는 1명 이상 100,000명 이하입니다.
  • completion의 길이는 participant의 길이보다 1 작습니다.
  • 참가자의 이름은 1개 이상 20개 이하의 알파벳 소문자로 이루어져 있습니다.
  • 참가자 중에는 동명이인이 있을 수 있습니다.

 

해시란? 해시 테이블이라고 불리우는 저장공간에다 키들이 어느 위치에 있을지 정해 해시 테이블에 값을 저장하는 것.

값들의 위치를 결정하는데에는 hash function이 이용된다. 해시 테이블의 각각의 저장공간을 hash bucket이라고 한다.

 

코드 구현

 

def solution(participant, completion):
    d = {}
    for x in participant:
        d[x] = d.get(x,0) +1 #get(x,0) x가 존재하면 키에 해당하는 값을, 존재하지 않으면 0을 return 
    for x in completion:
        d[x] -= 1
    dnf = [k for k, v in d.items() if v > 0]
    answer = dnf[0]
    return answer

 

시간복잡도 : O(n)


탐욕법

 

체육복

 

점심시간에 도둑이 들어, 일부 학생이 체육복을 도난당했습니다. 다행히 여벌 체육복이 있는 학생이 이들에게 체육복을 빌려주려 합니다. 학생들의 번호는 체격 순으로 매겨져 있어, 바로 앞번호의 학생이나 바로 뒷번호의 학생에게만 체육복을 빌려줄 수 있습니다. 예를 들어, 4번 학생은 3번 학생이나 5번 학생에게만 체육복을 빌려줄 수 있습니다. 체육복이 없으면 수업을 들을 수 없기 때문에 체육복을 적절히 빌려 최대한 많은 학생이 체육수업을 들어야 합니다.

전체 학생의 수 n, 체육복을 도난당한 학생들의 번호가 담긴 배열 lost, 여벌의 체육복을 가져온 학생들의 번호가 담긴 배열 reserve가 매개변수로 주어질 때, 체육수업을 들을 수 있는 학생의 최댓값을 return 하도록 solution 함수를 작성해주세요.

 

제한사항

  • 전체 학생의 수는 2명 이상 30명 이하입니다.
  • 체육복을 도난당한 학생의 수는 1명 이상 n명 이하이고 중복되는 번호는 없습니다.
  • 여벌의 체육복을 가져온 학생의 수는 1명 이상 n명 이하이고 중복되는 번호는 없습니다.
  • 여벌 체육복이 있는 학생만 다른 학생에게 체육복을 빌려줄 수 있습니다.
  • 여벌 체육복을 가져온 학생이 체육복을 도난당했을 수 있습니다. 이때 이 학생은 체육복을 하나만 도난당했다고 가정하며, 남은 체육복이 하나이기에 다른 학생에게는 체육복을 빌려줄 수 없습니다.

 

탐욕법이란? 알고리즘의 각 단계에서 그 순간 최적이라고 생각되는 것을 선택

현재의 선택이 마지막 해답의 최적성을 해치지 않을 때 탐욕법 활용 가능

 

코드 구현

 

def solution(n, lost, reserve):
    u = [1]*(n+2)
    for i in reserve:
        u[i]+=1
    for i in lost:
        u[i]-=1
        
    for i in range(1, n+1):
        if u[i-1]==0 and u[i]==2:
            u[i-1:i+1]=[1,1]
        elif u[i] == 2 and u[i+1] == 0:
            u[i:i+2]=[1,1]
            
            
    return len([x for x in u[1:-1] if x > 0])

 

시간복잡도 : O(n)

 

def solution(n, lost, reserve):
    s = set(lost) & set(reserve)
    l = set(lost) - s
    r = set(reserve) - s
    for x in sorted(r):
        if x-1 in l:
            l.remove(x-1)
        elif x+1 in l:
            l.remove(x+1)
            
    return n-len(l)

 

시간복잡도 : O(klogk)

 


정렬

 

가장 큰 수 

 

0 또는 양의 정수가 주어졌을 때, 정수를 이어 붙여 만들 수 있는 가장 큰 수를 알아내 주세요.

예를 들어, 주어진 정수가 [6, 10, 2]라면 [6102, 6210, 1062, 1026, 2610, 2106]를 만들 수 있고, 이중 가장 큰 수는 6210입니다.

0 또는 양의 정수가 담긴 배열 numbers가 매개변수로 주어질 때, 순서를 재배치하여 만들 수 있는 가장 큰 수를 문자열로 바꾸어 return 하도록 solution 함수를 작성해주세요.

 

제한 사항

  • numbers의 길이는 1 이상 100,000 이하입니다.
  • numbers의 원소는 0 이상 1,000 이하입니다.
  • 정답이 너무 클 수 있으니 문자열로 바꾸어 return 합니다.

 

문제 해결 방법

  1. 빈 문자열로 수 초기화
  2. 수 목록을 (크게 만드는 것 우선) 정렬
  3. 목록에서 하나씩 꺼내 현재 수에 이어 붙인다.
  4. 모든 수를 다 사용할 때까지 반복

 

알고리즘 설계

 

  • 대소 관계 비교를 위한 기준 마련
  • 기준을 이용해 주어진 배열 정렬
  • 정렬된 배열을 이용해 문자열 표현 완성

 

코드 구현

 

def solution(numbers):
    numbers = [str(x) for x in numbers]
    numbers.sort(key=lambda x : (x*4)[:4], reverse=True)
    if numbers[0]=='0':
        answer='0'
    else:
        answer = ''.join(numbers)
    return answer

 

시간복잡도 : O(nlogn) (정렬하면서..)


탐욕법

 

큰 수 만들기

 

어떤 숫자에서 k개의 수를 제거했을 때 얻을 수 있는 가장 큰 숫자를 구하려 합니다.

예를 들어, 숫자 1924에서 수 두 개를 제거하면 [19, 12, 14, 92, 94, 24] 를 만들 수 있습니다. 이 중 가장 큰 숫자는 94 입니다.

문자열 형식으로 숫자 number와 제거할 수의 개수 k가 solution 함수의 매개변수로 주어집니다. number에서 k 개의 수를 제거했을 때 만들 수 있는 수 중 가장 큰 숫자를 문자열 형태로 return 하도록 solution 함수를 완성하세요.

제한 조건

  • number는 1자리 이상, 1,000,000자리 이하인 숫자입니다.
  • k는 1 이상 number의 자릿수 미만인 자연수입니다.

 

문제 해결 방법

 

  • 큰 수가 앞 자리에, 작은 수가 뒷 자리에 놓이도록 한다.

 

알고리즘 설계

 

  • 주어진 숫자로부터 하나씩 꺼내 모은다.
    • 이 때, 이미 모아둔 것 중 지금 등장한 것보다 작은 것들은 빼낸다.
  • 모은 숫자들을 자릿수 맞춰 반환한다.
    • 아직 뺄 개수를 채우지 못한 경우를 고려한다.

코드 구현

 

def solution(number, k):
    collected = []
    for i, num in enumerate(number):
        while len(collected)>0 and collected[-1]<num and k>0: 
            #아직까지 빼낼 게 남아있고 (k>0) 
            #마지막 글자가 현재 글자보다 작고 (collected[-1]<num) 
            #collected의 길이가 0보다 클 때동안 (len(collected)>0)
            collected.pop()
            k-=1
        if k==0:
            collected += list(number[i:])
            break
        collected.append(num)
        
    collected = collected[:-k] if k>0 else collected 
    #만약 k가 0보다 크면 즉, 잘라야 할 문자가 남았다면 맨 뒤부터 남은 문자 갯수만큼 잘라준다.
    return ''.join(collected)

 

시간복잡도 : O(n)

수식의 중위 표기법과 후위 표기법

 

중위 표기법 (infix notation)

 

(A+B) * (C+D)

   1   3    2

연산자가 피연산자들 사이에 위치하는 것


후위 표기법 (postfix notation)

 

AB + CD + *

   1     2    3

연산자가 피연산자들 뒤에 위치. 괄호가 필요 없다.


스택을 이용해 중위 표기법을 후위 표기법으로 변경하기

 

괄호 처리

 

여는 괄호는 스택에 push

닫는 괄호를 만나면 여는 괄호가 나올 때까지 pop

 

여는 괄호의 우선 순위는 가장 낮게 설정하도록 한다. 

 

알고리즘 설계

 

  1. 연산자 우선순위 설정
    • prec = { '*':3, '/':3, '+':2, '-':2, '(':1 }
  2. 중위 표현식을 왼쪽부터 한 글자씩 읽어
    • 피연산자면 그냥 출력
    • '('면 스택에 push
    • ')'면 '('가 나올 때까지 스택에서 pop
    • 출력 연산자이면 스택에서 이보다 높거나 같은 우선순위 것들을 pop, 출력 그리고 이 연산자는 스택에 push
    • 스택에 남아 있는 연산자는 모두 pop, 출력

코드 구현

 

class ArrayStack:

    def __init__(self):
        self.data = []

    def size(self):
        return len(self.data)

    def isEmpty(self):
        return self.size() == 0

    def push(self, item):
        self.data.append(item)

    def pop(self):
        return self.data.pop()

    def peek(self):
        return self.data[-1]

prec = {
    '*': 3, '/': 3,
    '+': 2, '-': 2,
    '(': 1
}

def solution(S):
    opStack = ArrayStack()
    answer=''

    for i in S:
        if i not in prec and i!=')': #비연산자면 바로 출력
            answer+=i
        else:
            if opStack.isEmpty() or i=='(': #스택이 비어있거나 '('연산자일 시 바로 스택에 push
                opStack.push(i)
            else:
                if i==')': #'('가 나올때까지 스택에서 pop
                    while opStack.peek()!='(':
                        answer+=opStack.pop()
                    opStack.pop() #'('빼기
                else:
                    while opStack.size()!=0 and prec[opStack.peek()]>=prec[i]:
                        answer+=opStack.pop()
                    opStack.push(i)

    for i in range(opStack.size()):
        answer+=opStack.pop()
                    
    return answer            

후위 표기 수식 계산

 

후위 표기된 수식을 계산하기

 

알고리즘 설계

 

  1. 후위 표현식을 왼쪽부터 한 글자씩 읽는다
  2. 피연산자면 스택에 push한다
  3. 연산자를 만나면 스택에서 pop한다. =>(1)
  4. 또 pop한다. =>(2)
  5. (2) 연산 (1)을 계산한다. 이 결과를 스택에 push한다.
  6. 수식의 끝에 도달하면 스택에서 pop한다. => 계산 결과

코드 구현

 

class ArrayStack:

    def __init__(self):
        self.data = []

    def size(self):
        return len(self.data)

    def isEmpty(self):
        return self.size() == 0

    def push(self, item):
        self.data.append(item)

    def pop(self):
        return self.data.pop()

    def peek(self):
        return self.data[-1]


def splitTokens(exprStr):
    tokens = []
    val = 0
    valProcessing = False
    for c in exprStr:
        if c == ' ':
            continue
        if c in '0123456789':
            val = val * 10 + int(c)
            valProcessing = True
        else:
            if valProcessing:
                tokens.append(val)
                val = 0
            valProcessing = False
            tokens.append(c)
    if valProcessing:
        tokens.append(val)

    return tokens


def infixToPostfix(tokenList):
    prec = {
        '*': 3,
        '/': 3,
        '+': 2,
        '-': 2,
        '(': 1,
    }

    opStack = ArrayStack()
    postfixList = []
    
    for token in tokenList:
        if type(token) is int:
            postfixList.append(token)
        elif token=='(':
            opStack.push(token)
        elif token==')':
            while opStack.peek()!='(':
                postfixList.append(opStack.pop())
            opStack.pop()
        else:
            while opStack.size()!=0 and prec[opStack.peek()]>=prec[token]:
                postfixList.append(opStack.pop())
            opStack.push(token)
    
    while not opStack.isEmpty():
        postfixList.append(opStack.pop())

    return postfixList


def postfixEval(tokenList):
    valStack = ArrayStack()
    
    for token in tokenList:
        if type(token) is int:
            valStack.push(token)
        elif token=='*':
            a=valStack.pop()
            b=valStack.pop()
            valStack.push(b*a)
        elif token=='/':
            a=valStack.pop()
            b=valStack.pop()
            valStack.push(b/a)
        elif token=='+':
            a=valStack.pop()
            b=valStack.pop()
            valStack.push(b+a)
        elif token=='-':
            a=valStack.pop()
            b=valStack.pop()
            valStack.push(b-a)
            
    return valStack.pop()


def solution(expr):
    tokens = splitTokens(expr)
    postfix = infixToPostfix(tokens)
    val = postfixEval(postfix)
    return val

너무 지저분해 보인다..^^;


큐란? 선입선출(FIFO : First In First Out)의 특징을 갖는 선형 자료구조 (ex : 영화관 입장 / 식당 입장 대기열)

 

큐의 동작

 

그림 출처 : https://velog.io/@junhok82/Queue

큐는 선입선출로 동작한다.


큐의 추상적 자료구조 구현

 

 

연산 정의

 

size() - 현재 큐에 들어 있는 데이터 원소의 수 - O(1)

isEmpty() - 현재 큐가 비어있는지 판단 - O(1)

enqueue(x) - 데이터 원소 x를 큐에 추가 - O(1)

dequeue() - 큐의 맨 앞에 저장된 데이터 원소 제거 및 반환 - O(n) 앞의 원소를 제거 후, 뒤의 원소들을 다 앞으로 한 칸씩 당겨주는 과정에서 n만큼의 시간이 소요된다.

peek() - 큐의 맨 앞에 저장된 데이터 원소 반환 (제거 X) - O(1)

 

배열을 이용해 구현

 

class ArrayQueue:
    def __init__(self):
        self.data=[]
    def size(self):
        return len(self.data)
    def isEmpty(self):
        return self.size() == 0
    def enqueue(self, item):
        self.data.append(item)
    def dequeue(self):
        return self.data.pop(0)
    def peek(self):
        return self.data[0]

 

연결 리스트를 이용해 구현

 

class Node:

    def __init__(self, item):
        self.data = item
        self.prev = None
        self.next = None


class DoublyLinkedList:

    def __init__(self):
        self.nodeCount = 0
        self.head = Node(None)
        self.tail = Node(None)
        self.head.prev = None
        self.head.next = self.tail
        self.tail.prev = self.head
        self.tail.next = None


    def __repr__(self):
        if self.nodeCount == 0:
            return 'LinkedList: empty'

        s = ''
        curr = self.head
        while curr.next.next:
            curr = curr.next
            s += repr(curr.data)
            if curr.next.next is not None:
                s += ' -> '
        return s


    def getLength(self):
        return self.nodeCount


    def traverse(self):
        result = []
        curr = self.head
        while curr.next.next:
            curr = curr.next
            result.append(curr.data)
        return result


    def reverse(self):
        result = []
        curr = self.tail
        while curr.prev.prev:
            curr = curr.prev
            result.append(curr.data)
        return result


    def getAt(self, pos):
        if pos < 0 or pos > self.nodeCount:
            return None

        if pos > self.nodeCount // 2:
            i = 0
            curr = self.tail
            while i < self.nodeCount - pos + 1:
                curr = curr.prev
                i += 1
        else:
            i = 0
            curr = self.head
            while i < pos:
                curr = curr.next
                i += 1

        return curr


    def insertAfter(self, prev, newNode):
        next = prev.next
        newNode.prev = prev
        newNode.next = next
        prev.next = newNode
        next.prev = newNode
        self.nodeCount += 1
        return True


    def insertAt(self, pos, newNode):
        if pos < 1 or pos > self.nodeCount + 1:
            return False

        prev = self.getAt(pos - 1)
        return self.insertAfter(prev, newNode)


    def popAfter(self, prev):
        curr = prev.next
        next = curr.next
        prev.next = next
        next.prev = prev
        self.nodeCount -= 1
        return curr.data


    def popAt(self, pos):
        if pos < 1 or pos > self.nodeCount:
            raise IndexError('Index out of range')

        prev = self.getAt(pos - 1)
        return self.popAfter(prev)


    def concat(self, L):
        self.tail.prev.next = L.head.next
        L.head.next.prev = self.tail.prev
        self.tail = L.tail

        self.nodeCount += L.nodeCount


class LinkedListQueue:

    def __init__(self):
        self.data = DoublyLinkedList()

    def size(self):
        return self.data.nodeCount


    def isEmpty(self):
        return self.data.nodeCount==0


    def enqueue(self, item):
        node = Node(item)
        self.data.insertAt(self.size()+1,node)


    def dequeue(self):
        return self.data.popAt(1)


    def peek(self):
        return self.data.head.next.data

큐 활용

 

  • 자료를 생성하는 작업과 그 자료를 이용하는 작업이 비동기적으로 일어나는 경우
  • 자료를 생성하거나 이용하는 작업이 여러 곳에서 일어나는 경우
  • 자료를 처리하여 새로운 자료를 생성하고, 나중에 그 자료를 또 처리해야 하는 작업의 경우

환형 큐

 

연산 정의

 

  • size() - 현재 큐에 들어 있는 데이터 원소의 수
  • isEmpty() - 현재 큐가 비어있는지 판단
  • isFull() - 큐의 데이터 원소가 꽉 차 있는지 판단
  • enqueue(x) - 데이터 원소 x를 큐에 추가
  • dequeue() - 큐의 맨 앞에 저장된 데이터 원소 제거 및 반환
  • peek() - 큐의 맨 앞에 저장된 데이터 원소 반환 (제거 X)

 

배열로 구현한 환형 큐

 

class CircularQueue:

    def __init__(self, n):
        self.maxCount = n
        self.data = [None] * n
        self.count = 0
        self.front = -1
        self.rear = -1


    def size(self):
        return self.count

    def isEmpty(self):
        return self.count == 0

    def isFull(self):
        return self.count == self.maxCount

    def enqueue(self, x):
        if self.isFull():
            raise IndexError('Queue full')
        self.rear = self.rear + 1

        self.data[self.rear] = x
        self.count += 1

    def dequeue(self):
        if self.isEmpty():
            raise IndexError('Queue empty')
        self.front = (self.front + 1) % self.maxCount

        x = self.data[self.front]

        self.count -= 1
        return x

    def peek(self):
        if self.isEmpty():
            raise IndexError('Queue empty')
        return self.data[(self.front + 1) % self.maxCount]


우선순위 큐

우선순위 큐란? 큐가 FIFO 방식을 따르지 않고 원소들의 우선순위에 따라 큐에서 빠져나오는 방식 (활용되는 ex : 운영체제의 CPU 스케쥴러)

 

우선순위 큐의 구현

 

두 가지 방식

 

  1. Enqueue할 때 우선순위 순서를 유지하도록
    • 조금 더 유리하다. 시간 복잡도가 조금 더 짧다.
  2. Dequeue할 때 우선순위 높은 것을 선택

두 가지 재료

 

  1. 선형 배열 이용
  2. 연결 리스트 이용
    • 중간에 데이터 삽입하는 일이 빈번히 발생해 연결 리스트가 더 유리

연결 리스트를 이용하여 우선순위 큐 구현

 

class Node:

    def __init__(self, item):
        self.data = item
        self.prev = None
        self.next = None


class DoublyLinkedList:

    def __init__(self):
        self.nodeCount = 0
        self.head = Node(None)
        self.tail = Node(None)
        self.head.prev = None
        self.head.next = self.tail
        self.tail.prev = self.head
        self.tail.next = None


    def __repr__(self):
        if self.nodeCount == 0:
            return 'LinkedList: empty'

        s = ''
        curr = self.head
        while curr.next.next:
            curr = curr.next
            s += repr(curr.data)
            if curr.next.next is not None:
                s += ' -> '
        return s


    def getLength(self):
        return self.nodeCount


    def traverse(self):
        result = []
        curr = self.head
        while curr.next.next:
            curr = curr.next
            result.append(curr.data)
        return result


    def reverse(self):
        result = []
        curr = self.tail
        while curr.prev.prev:
            curr = curr.prev
            result.append(curr.data)
        return result


    def getAt(self, pos):
        if pos < 0 or pos > self.nodeCount:
            return None

        if pos > self.nodeCount // 2:
            i = 0
            curr = self.tail
            while i < self.nodeCount - pos + 1:
                curr = curr.prev
                i += 1
        else:
            i = 0
            curr = self.head
            while i < pos:
                curr = curr.next
                i += 1

        return curr


    def insertAfter(self, prev, newNode):
        next = prev.next
        newNode.prev = prev
        newNode.next = next
        prev.next = newNode
        next.prev = newNode
        self.nodeCount += 1
        return True


    def insertAt(self, pos, newNode):
        if pos < 1 or pos > self.nodeCount + 1:
            return False

        prev = self.getAt(pos - 1)
        return self.insertAfter(prev, newNode)


    def popAfter(self, prev):
        curr = prev.next
        next = curr.next
        prev.next = next
        next.prev = prev
        self.nodeCount -= 1
        return curr.data


    def popAt(self, pos):
        if pos < 1 or pos > self.nodeCount:
            return None

        prev = self.getAt(pos - 1)
        return self.popAfter(prev)


    def concat(self, L):
        self.tail.prev.next = L.head.next
        L.head.next.prev = self.tail.prev
        self.tail = L.tail

        self.nodeCount += L.nodeCount


class PriorityQueue:

    def __init__(self):
        self.queue = DoublyLinkedList()


    def size(self):
        return self.queue.getLength()

    def isEmpty(self):
        return self.size() == 0

    def enqueue(self, x):
        newNode = Node(x)
        curr = self.queue.head.next

        while curr.next!=self.queue.tail and x<curr.next.data:
            curr = curr.next
        self.queue.insertAfter(curr, newNode)

    def dequeue(self):
        return self.queue.popAt(self.queue.getLength())

    def peek(self):
        return self.queue.getAt(self.queue.getLength()).data

트리

트리란? node와 edge를 이용해 데이터의 배치 형태를 추상화한 자료 구조

 

트리 구조

 

그림 출처 : https://ko.wikipedia.org/wiki/%ED%8A%B8%EB%A6%AC_%EA%B5%AC%EC%A1%B0

트리 구조

 

  • 루트 노드 : 가장 위에 위치한 노드
  • 리프 노드 : 가지를 치는 곳이 없는 노드
  • 내부 노드 : 루트 노드도 리프 노드도 아닌 노드
  • 부모 노드와 자식 노드
    • 노드 6은 노드 5와 11의 부모 노드이다.
    • 노드 5와 11은 노드 6의 자식 노드이다.
  • 형제 노드(Sibling node)
    • 노드 5와 11은 형제 노드이다.
  • 조상 노드(ancestor)와 후손 노드(descendant node)
    • 노드 5의 조상 노드는 2, 7, 6이다.
    • 루트 노드 2는 자기 자신을 제외하고 모든 노드가 후손 노드이다.
  • 노드의 수준(Level) : 루트 노드로부터 해당 노드에 이를 때까지 지나치는 간선의 수
    • Level 0 : 2
    • Level 1 : 7, 5
    • Level 2 : 2, 6, 9
    • Level 3 : 5, 11, 4
  • 트리의 높이 = 최대 수준(level) + 1 (깊이라고도 함)
  • 부분트리 (서브트리 - Subtree) : 트리에서 노드 한 개로부터 후손들을 빼내면 그것을 서브트리라고 한다.
  • 노드의 차수 (Degree) = 자식 (서브트리)의 수
    • 노드 6의 차수는 2이다.

이진 트리

 

이진 트리란? 모든 노드의 차수가 2 이하인 트리 (앞서 예시로 보여준 트리의 그림같은 경우에도 이진 트리이다.)

재귀적으로 정의할 수 있다. => 루트 노드 + 왼쪽 서브트리 + 오른쪽 서브트리

 

이진 트리의 종류

 

  • 포화 이진 트리 : 모든 레벨에서 노드들이 모두 채워져 있는 이진 트리
    • 높이가 k
    • 노드의 개수가 2^k-1
  • 완전 이진 트리
    • 높이 k인 완전 이진 트리
    • 레벨 k-2까지는 모든 노드가 2개의 자식을 가진 포화 이진 트리
    • 레벨 k-1에서는 왼쪽부터 노드가 순차적으로 채워져 있는 이진 트리

그림 출처 : https://limkydev.tistory.com/134

포화 이진 트리와 완전 이진 트리

 

연산 정의

 

  • size() - 현재 트리에 포함되어 있는 노드의 수
  • depth() - 현재 트리의 깊이 (또는 높이)를 구함
  • 순회 (traversal)

 


이진 트리 순회

 

  • 깊이 우선 순회 (재귀적 방식 적합)
    • 중위 순회
      • Left subtree
      • 자기 자신
      • Right subtree
    • 전위 순회
      • 자기 자신
      • Left subtree
      • Right subtree
    • 후위 순회
      • Left subtree
      • Right subtree
      • 자기 자신

 

  • 넓이 우선 순회 (재귀적 방식 부적합. 큐 이용)
    • 수준이 낮은 노드 우선 방문
    • 같은 수준 노드들 사이에선 
      • 부모 노드 방문 순서에 따라 방문
      • 왼쪽 자식 노드를 오른쪽 자식보다 먼저 방문
    • 알고리즘 설계
      • traversal은 빈 리스트로 q는 빈 큐로 초기화
      • 빈 트리가 아니면 root node에 q 추가
      • q가 비어 있지 않은 동안
        • node <- q에서 원소를 추출 (deque)
        • node 방문
        • node의 왼쪽, 오른쪽 자식들을 q에 추가
        • q가 빈 큐가 되면 모든 노드 방문 완료

 

깊이 우선 순회 코드 구현

 

class Node:

    def __init__(self, item):
        self.data = item
        self.left = None
        self.right = None


    def size(self):
        l = self.left.size() if self.left else 0
        r = self.right.size() if self.right else 0
        return l + r + 1


    def depth(self):
        l = self.left.depth() if self.left else 0
        r = self.right.depth() if self.right else 0
        return  max(l,r)+1
        
    def inorder(self): #중위 순회
        traversal = []
        if self.left:
            traversal += self.left.inorder()
        traversal.append(self.data)
        if self.right:
            traversal += self.right.inorder()
        return traversal


    def preorder(self): #전위 순회
        traversal = []
        traversal.append(self.data)
        if self.left:
            traversal +=self.left.preorder()
        if self.right:
            traversal +=self.right.preorder()
        return traversal
    
    def postorder(self): #후위 순회 #후위 순회
        traversal = []
        if self.left:
            traversal += self.left.postorder()
        if self.right:
            traversal += self.right.postorder()
        traversal.append(self.data)
        return traversal


class BinaryTree:

    def __init__(self, r):
        self.root = r

    def size(self):
        if self.root:
            return self.root.size()
        else:
            return 0


    def depth(self):
        if self.root:
            return self.root.depth()
        else:
            return 0
            
    def inorder(self):
        if self.root:
            return self.root.inorder()
        else:
            return []


    def preorder(self):
        if self.root:
            return self.root.preorder()
        else:
            return []
            
    def postorder(self):
        if self.root:
            return self.root.postorder()
        else:
            return []

 

넓이 우선 순회 코드 구현

 

class ArrayQueue:

    def __init__(self):
        self.data = []

    def size(self):
        return len(self.data)

    def isEmpty(self):
        return self.size() == 0

    def enqueue(self, item):
        self.data.append(item)

    def dequeue(self):
        return self.data.pop(0)

    def peek(self):
        return self.data[0]


class Node:

    def __init__(self, item):
        self.data = item
        self.left = None
        self.right = None


class BinaryTree:

    def __init__(self, r):
        self.root = r


    def bft(self):
        traversal = []
        q = ArrayQueue()
        
        if self.root:
            q.enqueue(self.root)
        
        while not q.isEmpty():
            node = q.dequeue()
            traversal.append(node.data)
            
            if node.left:
                q.enqueue(node.left)
            if node.right:
                q.enqueue(node.right)
                
        return traversal

이진 탐색 트리

 

 

모든 노드에 대해 

  • 왼쪽 서브트리에 있는 데이터는 모두 현재 노드 값보다 작다
  • 오른쪽 서브트리에 있는 데이터는 모두 현재 노드 값보다 크다

그림 출처 : https://ratsgo.github.io/data%20structure&algorithm/2017/10/22/bst/

이진 탐색 트리

 

정렬된 배열과 이진 탐색과 비교

 

(장점) 이진 탐색이 정렬된 배열보다 데이터 원소의 추가, 삭제가 더 용이하다.

(단점) 공간 소요가 크다.

 

연산 정의

 

  • insert(key, data) - 트리에 주어진 데이터 원소 추가
  • remove(key) - 특정 원소를 트리로부터 삭제
  • lookup(key) - 특정 원소 검색
  • inorder() - 키의 순서대로 데이터 원소 나열
  • min(), max() - 최소키, 최대키를 가지는 원소를 각각 탐색

 

이진 탐색 트리에서 원소 삭제 알고리즘

 

  1. 키(key)를 이용해 노드를 찾는다.
    • 해당 키의 노드가 없으면 삭제할 것도 없다.
    • 찾은 노드의 부모 노드도 알고 있어야 한다.
  2. 찾은 노드를 제거하고도 이진 탐색 트리 성질을 만족하도록 트리의 구조를 정리한다.
    • 삭제되는 노드가
      • 말단 노드인 경우
        • 그냥 그 노드를 없애면 된다. 
        • 부모 노드의 링크를 조정
      • 자식을 하나 가지고 있는 경우
        • 삭제되는 노드 자리에 그 자식을 대신 배치
        • 자식이 왼쪽에 있는지 오른쪽에 있는지를 알고 있어야 한다.
        • 부모 노드의 링크를 조정
      • 자식을 둘 가지고 있는 경우
        • 삭제되는 노드보다 바로 다음 키를 갖는 노드를 찾아 그 노드를 삭제되는 노드 자리에 대신 배치

 

코드 구현

 

class Node:

    def __init__(self, key, data):
        self.key = key
        self.data = data
        self.left = None
        self.right = None


    def insert(self, key, data):
        if key < self.key:
            if self.left:
                self.left.insert(key, data)
            else:
                self.left = Node(key, data)
        elif key > self.key:
            if self.right:
                self.right.insert(key, data)
            else:
                self.right = Node(key, data)
        else:
            raise KeyError('Key %s already exists.' % key)


    def lookup(self, key, parent=None):
        if key < self.key:
            if self.left:
                return self.left.lookup(key, self)
            else:
                return None, None
        elif key > self.key:
            if self.right:
                return self.right.lookup(key, self)
            else:
                return None, None
        else:
            return self, parent


    def inorder(self):
        traversal = []
        if self.left:
            traversal += self.left.inorder()
        traversal.append(self)
        if self.right:
            traversal += self.right.inorder()
        return traversal


    def countChildren(self):
        count = 0
        if self.left:
            count += 1
        if self.right:
            count += 1
        return count


class BinSearchTree:

    def __init__(self):
        self.root = None


    def insert(self, key, data):
        if self.root:
            self.root.insert(key, data)
        else:
            self.root = Node(key, data)


    def lookup(self, key):
        if self.root:
            return self.root.lookup(key)
        else:
            return None, None


    def remove(self, key):
        node, parent = self.lookup(key)
        if node:
            nChildren = node.countChildren()
            # The simplest case of no children
            if nChildren == 0:
                # 만약 parent 가 있으면
                # node 가 왼쪽 자식인지 오른쪽 자식인지 판단하여
                # parent.left 또는 parent.right 를 None 으로 하여
                # leaf node 였던 자식을 트리에서 끊어내어 없앱니다.
                if parent:
                    if parent.left == node:
                        parent.left = None
                    else:
                        parent.right = None
                # 만약 parent 가 없으면 (node 는 root 인 경우)
                # self.root 를 None 으로 하여 빈 트리로 만듭니다.
                else:
                    self.root=None
            # When the node has only one child
            elif nChildren == 1:
                # 하나 있는 자식이 왼쪽인지 오른쪽인지를 판단하여
                # 그 자식을 어떤 변수가 가리키도록 합니다.
                if node.left:
                    child = node.left
                else:
                    child = node.right
                # 만약 parent 가 있으면
                # node 가 왼쪽 자식인지 오른쪽 자식인지 판단하여
                # 위에서 가리킨 자식을 대신 node 의 자리에 넣습니다.
                if parent:
                    if parent.left == node:
                        parent.left = child
                    else:
                        parent.right = child
                # 만약 parent 가 없으면 (node 는 root 인 경우)
                # self.root 에 위에서 가리킨 자식을 대신 넣습니다.
                else:
                    self.root = child
            # When the node has both left and right children
            else:
                parent = node
                successor = node.right
                # parent 는 node 를 가리키고 있고,
                # successor 는 node 의 오른쪽 자식을 가리키고 있으므로
                # successor 로부터 왼쪽 자식의 링크를 반복하여 따라감으로써
                # 순환문이 종료할 때 successor 는 바로 다음 키를 가진 노드를,
                # 그리고 parent 는 그 노드의 부모 노드를 가리키도록 찾아냅니다.
                while successor.left:
                    parent = successor
                    successor = successor.left
                # 삭제하려는 노드인 node 에 successor 의 key 와 data 를 대입합니다.
                node.key = successor.key
                node.data = successor.data
                if parent.left == successor:
                    parent.left =successor.right
                else:
                    parent.right = successor.right
                    
                # 이제, successor 가 parent 의 왼쪽 자식인지 오른쪽 자식인지를 판단하여
                # 그에 따라 parent.left 또는 parent.right 를
                # successor 가 가지고 있던 (없을 수도 있지만) 자식을 가리키도록 합니다.
                

            return True

        else:
            return False


    def inorder(self):
        if self.root:
            return self.root.inorder()
        else:
            return []

 

보다 좋은 성능의 이진 탐색 트리들

 


힙(heap)

 

힙이란? 이진 트리의 한 종류

 

  1. 루트 노드가 언제나 최댓값 또는 최솟값을 가진다.
    • 최대 힙(max heap), 최소 힙(min heap)
  2. 완전 이진 트리여야 한다.

 

그림 출처 : https://guides.codepath.com/compsci/Heaps

Min heap과 Max heap

 

이진 탐색 트리와의 차이

 

  1. 이진 탐색 트리는 완전히 크기 순으로 정렬되어 있으나, 최대힙/최소힙은 그렇지 않다.
  2. 이진 탐색 트리는 특정 키 값을 가지는 원소를 빠르게 검색할 수 있으나, 힙은 특정한 키 값이 어느 트리에 들어있는가를 알아내는데 좋은 방법이 없다.
  3. 힙은 이진 탐색 트리에 비해 완전 이진 트리여야 한다는 부가의 제약 조건이 있다.

 

연산 정의

 

  • __init__() - 빈 최대 힙 생성
  • insert(item) - 새로운 원소 삽입
  • remove() - 최대 원소 (root node) 반환과 동시에 삭제

배열을 이용한 최대힙의 표현

 

노드 번호 m을 기준으로

  • 왼쪽 자식 번호 : 2*m
  • 오른쪽 자식 번호 : 2*m+1
  • 부모 노드의 번호 : m//2

완전 이진 트리이므로 노드의 추가 / 삭제는 마지막 노드에서만 이뤄진다.

 

최대 힙에 원소 삽입

 

  1. 트리의 마지막 자리에 새로운 원소 임시 저장
  2. 부모 노드와 키 값을 비교해 위로 이동

복잡도 = 부모 노드와의 대소 비교 최대 회수 => log₂n

∴ 최악 복잡도 O(logn)의 삽입 연산

 

최대 힙에 원소 삭제

 

  1. 루트 노드 제거 - 이것이 원소들 중 최댓값
  2. 트리 마지막 자리 노드를 임시로 루트 노드 자리에 배치
  3. 자식 노드들과 값을 비교해 아래로 이동
    • 자식이 둘이 있다면 더 큰 값을 기준으로 아래로 이동하게 된다.

복잡도 = 자식 노드들과의 대소 비교 최대 회수 => 2log₂n

∴ 최악 복잡도 O(logn)의 삭제 연산

 

 

코드 구현

 

class MaxHeap:

    def __init__(self):
        self.data = [None]


    def insert(self, item):
        self.data.append(item)
        idx = len(self.data)-1
        
        while idx != 1:
            parent = idx//2
            
            if self.data[parent] < self.data[idx]:
                self.data[parent],self.data[idx] = self.data[idx], self.data[parent]
                idx = parent
            else:
                break
                
    def remove(self):
        if len(self.data) > 1:
            self.data[1], self.data[-1] = self.data[-1], self.data[1]
            data = self.data.pop(-1)
            self.maxHeapify(1)
        else:
            data = None
        return data
                

    def maxHeapify(self, i):
        # 왼쪽 자식 (left child) 의 인덱스를 계산합니다.
        left = 2*i

        # 오른쪽 자식 (right child) 의 인덱스를 계산합니다.
        right = 2*i+1

        greatest = i
        
        # 왼쪽 자식이 존재하는지, 그리고 왼쪽 자식의 (키) 값이 (무엇보다?) 더 큰지를 판단합니다.
        if left<len(self.data) and self.data[left]>self.data[greatest]:            
        # 조건이 만족하는 경우, smallest 는 왼쪽 자식의 인덱스를 가집니다.
            greatest=left
        # 오른쪽 자식이 존재하는지, 그리고 오른쪽 자식의 (키) 값이 (무엇보다?) 더 큰지를 판단합니다.
        if right<len(self.data) and self.data[right]>self.data[smallest]:            
        # 조건이 만족하는 경우, smallest 는 오른쪽 자식의 인덱스를 가집니다.      
            greatest=right

        if greatest != i:
            # 현재 노드 (인덱스 i) 와 최댓값 노드 (왼쪽 아니면 오른쪽 자식) 를 교체합니다.
            self.data[i],self.data[greatest]=self.data[greatest],self.data[i]

            # 재귀적 호출을 이용하여 최대 힙의 성질을 만족할 때까지 트리를 정리합니다.
            self.maxHeapify(greatest)

최대/최소 힙 응용

 

  1. 우선 순위 큐
    • Enqueue할 때 '느슨한 정렬'을 이루도록 한다. - O(logn)
    • Dequeue할 때 최댓값을 순서대로 추출 - O(logn)
  2. 힙 정렬
    • 정렬되지 않은 원소들을 아무 순서로나 최대 힙에 삽입 - O(logn)
    • 삽입이 끝나면 힙이 비게 될 때까지 하나씩 삭제 : O(logn)
    • 원소들 삭제된 순서가 원소들의 정렬 순서
    • 정렬 알고리즘 복잡도 - O(nlogn)

 

그림 출처 : ko.wikipedia.org/wiki/%ED%9E%99_%EC%A0%95%EB%A0%AC

힙 정렬

 

힙 정렬 코드 구현

 

def heapsort(unsorted):
    H = MaxHeap()
    for item in unsorted:
        H.insert(item)
    sorted = []
    d = H.remove()
    while d :
        sorted.append(d)
        d = H.remove()
    return sorted

'AI > KDT 인공지능' 카테고리의 다른 글

[04/26] 인공지능 수학 - 선형 시스템  (0) 2021.04.26
[4/26] 주피터 노트북  (0) 2021.04.26
[4/22] 코딩테스트 연습 (2)  (0) 2021.04.22
[4/21] 코딩테스트 연습  (0) 2021.04.21
[4/20] 자료구조와 알고리즘  (0) 2021.04.20

자료구조와 알고리즘

자료구조란? 데이터가 있고, 그 데이터에 대해 행할 수 있는 연산들로 이루어진 구조

알고리즘이란? 주어진 문제의 해결을 위한 자료구조와 연산 방법에 대한 선택


선형 배열

배열이란? 원소들을 순서대로 늘어놓은 것

 

원소 삽입

 

L = [ 1, 3, 5, 7, 9 ]
index 0 1 2 3 4

 

L.insert(3,6) 적용 시

 

3번 인덱스의 앞을 우선 찾아내게 되고,

맨 뒤의 수를 오른쪽으로 한 칸 옮기게 된다. (이 과정에서 배열의 크기가 하나 늘어나 크기가 6인 배열이 된다.)
그 후 7을 또 오른쪽으로 한 칸 옮기고
마지막으로 6을 삽입함

 

결과

 

L = [ 1, 3, 5, 6, 7, 9 ]
index 0 1 2 3 4 5


원소 삭제

 

L = [ 1, 3, 5, 6, 7, 9 ]
index 0 1 2 3 4 5

 

del(L[2]) 적용 시

 

2번 인덱스에 있던 5를 삭제하고,

오른편에 있던 6과 7과 9를 한 칸씩 옮긴다.

그 후 맨마지막 5번 인덱스에 있던 9를 옮긴다. (이 과정에서 배열의 크기가 하나 줄어 크기가 5인 배열이 된다.)

 

결과

 

L = [ 1, 3, 6, 7, 9 ]
index 0 1 2 3 4

 

del()과 pop()은 비슷한 동작을 시행하지만,

del()은 시행한 후 빠져나간 원소의 값이 반환되지 않고,

pop()은 시행한 후 빠져나간 원소의 값이 반환된다는 차이를 보인다.

 

원소 삽입과 삭제는 리스트의 길이가 길면 비례해서 연산이 오래걸린다. (선형 시간)

=> O(n)만큼의 시간이 걸린다.


정렬

수 정렬

 

L = [ 5, 1, 3, 7, 2 ]

 

sorted(L) 적용 시

 

L = [ 5, 1, 3, 7, 2 ]

 

sorted(L)은 리스트 자체에 변화를 주지 않는다.

 

L.sort() 적용 시

 

L = [ 1, 2, 3, 5, 7 ]

 

L.sort()는 L 리스트 자체에 변화를 준다. (바로 적용이 된다.)

 

L = sorted(L, reverse=True) OR L.sort(reverse=True) 적용 시

 

L = [ 7, 5, 3, 2, 1]


문자열 정렬

 

L = [ 'abcd', 'xyz', 'spam']

 

위 리스트를 그냥 정렬하게 되면 사전순으로 정렬하게 된다.

그렇다면 문자열 길이별로 정렬하려면 어떻게 하여야 할까?

 

키를 활용한다.

sorted(L, key = lambda x : len(x)) 적용 시

 

L = [ 'xyz, 'abcd', 'spam' ]


탐색

 

탐색 알고리즘 (1) - 선형 탐색

 

리스트에 비례하는 시간 소요

=> O(n)


 

탐색 알고리즘 (2) - 이진 탐색

 

한 번 비교할 때마다 리스트를 반씩 줄인다. (divide & conquer)

=> O(log n)

 

이진 탐색 코드 구현

 

lower = 0
upper = len(L) - 1
while lower <= upper:
    middle = (lower + upper)//2 #중간 인덱스 찾기
    if L[middle] == target:
    	return middle
    elif L[middle] < target: #중간값이 target값보다 작을 경우
    	lower = middle+1 #중간 인덱스보다 1만큼 큰 값으로 lower값 조정
    else: #중간값이 target값보다 클 경우
    	upper = middle-1 #중간 인덱스보다 1만큼 작은 값으로 upper값 조정

재귀 알고리즘

재귀함수(Recursive function)란? 하나의 함수에서 자신을 다시 호출해 작업을 수행하는 것

재귀함수 설계 시, 종결 조건에 유의하여야 한다.

 

재귀 알고리즘의 효율

def sum(n):
    if n<=1:
    	return n
    else:
    	return n+sum(n-1)

=> O(n)

 

vs

 

def sum(n):
    s = 0
    while n>=0:
    	s+=n
        n-=1
    return s

=> O(n)

 

vs

 

def sum(n):
    return n*(n+1)//2

=> O(1)

 

※ 효율성 측면에 유의하여 알고리즘을 잘 설계해야 한다! 


피보나치 순열

 

재귀함수를 활용한 경우

def solution(x):
    if x==0:
        return 0
    elif x==1:
        return 1
    else:
        return solution(x-1) + solution(x-2)

 

피보나치 순열 재귀함수 테스트 결과

반복적 함수를 활용한 경우

def solution(x):
    a, b = 0, 1
    
    if x==0:
        return 0
    
    for i in range(x-1):
        a,b = b, a+b
            
    return b

피보나치 순열 반복적 함수 테스트 결과

※ 꼭 재귀라고 효율성이 좋은 것만은 아니다. 문제에 따라 적절한 자료구조를 선택해야 한다는 좋은 본보기가 되어준다.


재귀적 이진 탐색

 

def binsearch(L, x, lower, upper):
    if l>u:
        return -1
    mid = (lower + upper) // 2
    if x==L[mid]:
        return mid
    elif x<L[mid]:
        return solution(L,x,l,mid-1)
    else:
        return solution(L,x,mid+1,u)

알고리즘의 복잡도

☆ 시간 복잡도란? 문제의 크기와 이를 해결하는 데 걸리는 시간 사이의 관계

  • 평균 시간 복잡도 : 임의의 입력 패턴(랜덤한 패턴)을 가정했을 때 소요되는 시간의 평균
  • 최악 시간 복잡도 : 가장 긴 시간을 소요하게 만드는 입력에 따라 소요되는 시간 (이를 기준으로 알고리즘의 복잡도를 계산한다.)

공간 복잡도란? 문제의 크기와 이를 해결하는 데 필요한 메모리 공간 사이의 관계

 

Big-O Notation이란? 점근 표기법의 하나. 알고리즘의 복잡도를 표현할 때 흔히 쓰인다.

  • 선형 시간 알고리즘 - O(n)
  • 로그 시간 알고리즘 - O(log n)
    • ex) 이진 탐색 알고리즘
  • 이차 시간 알고리즘 - O(n²)
    • ex) 삽입 정렬

 

삽입 정렬보다 낮은 복잡도를 가지는 정렬 알고리즘

병합정렬의 예


연결 리스트 (Linked List)

추상적 자료구조 

  • Data
    • 정수, 문자열, 레코드, ...
  • A set of operations
    • 삽입, 삭제, 순회, ...
    • 정렬, 탐색, ...

연결 리스트 구현

class Node:

    def __init__(self, item):
        self.data = item
        self.next = None


class LinkedList:

    def __init__(self):
        self.nodeCount = 0
        self.head = None
        self.tail = None


    def getAt(self, pos):
        if pos < 1 or pos > self.nodeCount:
            return None

        i = 1
        curr = self.head
        while i < pos:
            curr = curr.next
            i += 1

        return curr


    def insertAt(self, pos, newNode):
        if pos < 1 or pos > self.nodeCount + 1:
            return False

        if pos == 1:
            newNode.next = self.head
            self.head = newNode

        else:
            if pos == self.nodeCount + 1:
                prev = self.tail
            else:
                prev = self.getAt(pos - 1)
            newNode.next = prev.next
            prev.next = newNode

        if pos == self.nodeCount + 1:
            self.tail = newNode

        self.nodeCount += 1
        return True


    def popAt(self, pos):
        delete_node = self.getAt(pos)

        if pos < 1 or pos > self.nodeCount:  
            raise IndexError 

        if pos == 1:    
            if self.nodeCount == 1:    
                self.head=None
                self.tail=None
                
            else:                          
                self.head = self.head.next
            
        else:                          
            prev = self.getAt(pos - 1)
            prev.next = delete_node.next
            if pos == self.nodeCount:   
                prev.next = None
                self.tail = prev
                
        self.nodeCount -= 1
        return delete_node.data

    def traverse(self):
        result = []
        curr = self.head
        while curr is not None:
            result.append(curr.data)
            curr = curr.next
        return result

조금 변형된 연결 리스트 (Dummy head 추가)

그림 출처 : http://cslabserver2.cs.mtsu.edu/labs/2170/lab10/dummy.html

dummy head가 추가된 링크드 리스트

class Node:

    def __init__(self, item):
        self.data = item
        self.next = None


class LinkedList:

    def __init__(self):
        self.nodeCount = 0
        self.head = Node(None)
        self.tail = None
        self.head.next = self.tail


    def traverse(self):
        result = []
        curr = self.head
        while curr.next:
            curr = curr.next
            result.append(curr.data)
        return result


    def getAt(self, pos):
        if pos < 0 or pos > self.nodeCount:
            return None

        i = 0
        curr = self.head
        while i < pos:
            curr = curr.next
            i += 1

        return curr


    def insertAfter(self, prev, newNode):
        newNode.next = prev.next
        if prev.next is None:
            self.tail = newNode
        prev.next = newNode
        self.nodeCount += 1
        return True


    def insertAt(self, pos, newNode):
        if pos < 1 or pos > self.nodeCount + 1:
            return False

        if pos != 1 and pos == self.nodeCount + 1:
            prev = self.tail
        else:
            prev = self.getAt(pos - 1)
        return self.insertAfter(prev, newNode)


    def popAfter(self, prev):
        curr = prev.next
        
        if prev.next == None:
            return None
        
        if curr.next == None:
            self.tail = prev
        
        prev.next = curr.next
        self.nodeCount-=1 
        
        return curr.data


    def popAt(self, pos):
        if pos < 1 or pos > self.nodeCount :
            raise IndexError
            
        prev = self.getAt(pos-1)
        
        return self.popAfter(prev)
    
    def concat(self, L):
        self.tail.next = L.head.next
        if L.tail:
            self.tail = L.tail
        self.nodeCount+=L.nodeCount

한 쪽으로만 진행이 가능하다는 단점이 있다. 이를 보완한 것이...


양방향 연결 리스트(Doubly Linked Lists)

양방향 연결 리스트란? 앞으로도 뒤로도 즉, 양쪽으로 진행이 가능한 리스트

그림 출처 : https://www.studytonight.com/data-structures/doubly-linked-list

doubly linked list

head와 tail에 dummy node를 달아준다.

class Node:

    def __init__(self, item):
        self.data = item
        self.prev = None
        self.next = None


class DoublyLinkedList:

    def __init__(self):
        self.nodeCount = 0
        self.head = Node(None)
        self.tail = Node(None)
        self.head.prev = None
        self.head.next = self.tail
        self.tail.prev = self.head
        self.tail.next = None


    def traverse(self):
        result = []
        curr = self.head
        while curr.next.next:
            curr = curr.next
            result.append(curr.data)
        return result


    def getAt(self, pos):
        if pos < 0 or pos > self.nodeCount:
            return None

        if pos > self.nodeCount // 2:
            i = 0
            curr = self.tail
            while i < self.nodeCount - pos + 1:
                curr = curr.prev
                i += 1
        else:
            i = 0
            curr = self.head
            while i < pos:
                curr = curr.next
                i += 1

        return curr


    def insertAfter(self, prev, newNode):
        next = prev.next
        newNode.prev = prev
        newNode.next = next
        prev.next = newNode
        next.prev = newNode
        self.nodeCount += 1
        return True


    def insertAt(self, pos, newNode):
        if pos < 1 or pos > self.nodeCount + 1:
            return False

        prev = self.getAt(pos - 1)
        return self.insertAfter(prev, newNode)
        
    def insertBefore(self, next, newNode):
        prev = next.prev
        newNode.next = prev.next
        newNode.prev = prev
        prev.next = newNode
        next.prev = newNode
        self.nodeCount+=1
        return True


    def popAfter(self, prev):
        curr = prev.next
        next = curr.next
        prev.next = next
        next.prev = prev
        self.nodeCount-=1
        
        return curr.data


    def popBefore(self, next): #수정필요
        curr = next.prev
        prev = curr.prev
        prev.next = next
        next.prev = prev
        self.nodeCount-=1
        
        return curr.data


    def popAt(self, pos):
        if pos < 1 or pos > self.nodeCount:
            raise IndexError
            
        prev = self.getAt(pos-1)
        next = self.getAt(pos)
        
        return self.popAfter(prev)
        #return self.popBefore(next)
        
    def concat(self, L):
        self.tail.prev.next = L.head.next
        L.head.next.prev = self.tail.prev
        self.tail = L.tail
        self.nodeCount += L.nodeCount

스택

스택이란? 자료를 보관할 수 있는 구조

 

한 쪽 끝에서 밀어 넣어야 하고 

=> push

같은 쪽에서 뽑아 꺼내야 한다.

=> pop

 

※ LIFO구조 (Last in First out)

그림 출처 :  https://swexpertacademy.com/

스택 구조 gif

 

스택 연산

  • size() - 현재 스택에 들어 있는 데이터 원소 수
  • isEmpty() - 현재 스택이 비어 있는지 판단
  • push(x) - 데이터 원소 x를 스택에 추가
  • pop() - 스택의 맨 위 저장된 데이터 원소 제거 및 반환
  • peek() - 스택의 맨 위 저장된 데이터 원소 반환 (제거하지 않음)

배열을 이용해 구현

 

class ArrayStack:
    def __init__(self):
        self.data = []
    def size(self):
        return len(self.data)
    def isEmpty(self):
        return self.size() == 0
    def push(self, item):
        self.data.append(item)
    def pop(self):
        return self.data.pop()
    def peek(self):
        return self.data[-1]

연결 리스트를 이용해 구현

 

from doublylinkedlist import Node
from doublylinkedlist import DoublyLinkedList

class LinkedListStack
    def __init__(self):
        self.data = DoublyLinkedList()
    
    def size(self):
        return self.data.getLength()
        
    def isEmpty(self):
        return self.size()==0
        
    def push(self, item):
        node = Node(item)
        self.data.insertAt(self.size() + 1, node)
        
    def pop(self):
        return self.data.popAt(self.size())
        
    def peek(self):
        return self.data.getAt(self.size()).data   

'AI > KDT 인공지능' 카테고리의 다른 글

[04/26] 인공지능 수학 - 선형 시스템  (0) 2021.04.26
[4/26] 주피터 노트북  (0) 2021.04.26
[4/22] 코딩테스트 연습 (2)  (0) 2021.04.22
[4/21] 코딩테스트 연습  (0) 2021.04.21
[4/21] 자료구조와 알고리즘(2)  (0) 2021.04.21

+ Recent posts