코딩테스트용 라이브러리 정리
python 코테용 module 및 주의점 정리
📜 제목으로 보기
표준라이브러리 6가지
내장함수
-
sum, min, max, eval, sorted(key=, reverse=)
result = eval("(3 + 5) * 7") print(result)
itertools
반복되는 형태의 데이터를 처리하는 기능을 제공, 순열과 조합 라이브러리르 제공
-
permutations(r개의 데이터를 뽑아 나열하는 모든 경우(순열))
-
combinations(r개의 데이터를 뽑아 순서를 고려하지 않고 나열하는 모든 경우(조합))
-
products(r개의 데이터를 뽑아 일렬로 나열하는 모든 경우(순열)를 계산한다. 다만 원소를 중복하여 뽑는다.)
from itertools import product data = ['A', 'B', 'C'] # 데이터 준비 result = list(product(data, repeat=2)) # 2개를 뽑는 모든 순열 구하기(중복 허용) print(result) # [('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'B'), ('B', 'C'), ('C', 'A'), ('C', 'B'), ('C', 'C')]
heapq
힙을 활용한 우선순위 큐 기능을 구현할 때 사용되며, O(NlogN)에 오름차순 정렬을 제공한다. PriorityQueue 라이브러리가 따로 있지만, heapq가 더 빠르게 동작한다.
- PriorityQueue를 리스트나 힙으로 구현할 수 있지만
- 리스트는 삽입
O(1)
삭제O(N)
의 복잡도를 가지지만, - 힙은 삽입
O(logN)
삭제O(logN)
의 복잡도를 가진다.- 그래서 우선순위 큐는 보통 힙으로 구현하고, 시간복잡도도 힙으로 구현한 시간복잡도를 사용한다.
- 리스트는 삽입
- heapq.heappush() : 원소 삽입
- heapq.heappop() : 원소 꺼내기
- heapq.heapify()
import heapq
def heapsort(iterable):
h = []
result = []
# 모든 원소를 차례대로 힙에 삽입
for value in iterable:
heapq.heappush(h, value)
# 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
for i in range(len(h)):
result.append(heapq.heappop(h))
return result
result = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(result)
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
-
히피파이를 이용한 힙정렬
- 기존에 있는 list 객체로 힙 정렬 만들기
import heapq
h = [3, 9, 1, 4, 2]
heapq.heapify(h) # 파라미터로 list 객체를 받는다.
for _ in range(6):
print(-heapq.heappop(h)) # 작은 값부터 출력된다.
bisect
- 이진 탐색을 쉽게 구현할 수 있도록 bisect 라이브러리를 제공함. ‘정렬된 배열’에서 특정한 원소를 찾아야 할 때 매우 효과적이다. O(logN)에 정렬된 배열에 맞는 위치를 찾아준다.
-
‘정렬된 리스트’에서 특정 범위에 속하는 원소의 개수를 구하는데 효과적이다.
- bisect_left(a, x) : 정렬된 순서를 유지하면서 리스트 a에서 데이터 x를 삽입할 가장 왼쪽 인덱스를 찾는 메서드
- bisect_right(a, x) : 정렬된 순서를 유지하면서 리스트 a에서 데이터 x를 삽입할 가장 오른쪽 인덱스를 찾는 메서드
-
bisect
모듈은 이미 정렬되어 있는list
의 정렬 상태를 유지하기 위해 사용되는 모듈입니다. 이를 이용해서, 기존에 있는list
의 정렬 상태를 유지 할 수 있고, 이를 응용해서Binary Search
또한 구현할 수 있습니다.
from bisect import bisect_left, bisect_right
a = [1, 2, 4, 4, 8]
x = 4
print(bisect_left(a, x)) # 2
print(bisect_right(a, x)) # 4
정렬된 리스트’에서 특정 범위(시작과 끝)
에 속하는 원소의 개수를 구하는데 효과적이다.
- left는 같아도 젤 왼쪽 index(포함), right는 같아도 젤 오른쪽index(미포함, 들어가야하는 자리)를 반환하므로 시작과 끝 index를 알 수 있다.
from bisect import bisect_left, bisect_right
# 값이 [left_value, right_value]인 데이터의 개수를 반환하는 함수
def count_by_range(a, left_value, right_value):
right_index = bisect_right(a, right_value)
left_index = bissect_left(a, left_value)
return right_index - left_index
# 리스트 선언
a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9]
# 값이 4인 데이터 개수 출력
print(count_by_range(a, 4, 4)) # 2
# 값이 [-1, 3] 범위에 있는 데이터 개수 출력
print(count_by_range(a, -1, 3)) # 6
-
lgN으로 정렬까지 해주는 bisect.insort( )도 있다.
-
bisect
모듈은 이미 정렬되어 있는list
의 정렬 상태를 유지하기 위해 사용되는 모듈입니다. 이를 이용해서, 기존에 있는list
의 정렬 상태를 유지 할 수 있고, 이를 응용해서Binary Search
또한 구현할 수 있습니다.
# 1. 삽입 되어야 하는 index 찾기
import bisect
arr = [1, 2, 3, 3, 4, 5]
print(bisect.bisect_left(arr, 6)) # 6이 들어가야 하는 Index인 6을 반환
print(bisect.bisect_right(arr, 6)) # arr에 6이 없기 때문에 위와 똑같은 값을 반환한다.
print(bisect.bisect_left(arr, 3)) # 중복 되는 값 제일 왼쪽, 2를 반환한다.
print(bisect.bisect_right(arr, 3)) # 중복 되는 값 제일 오른쪽 + 1, 4를 반환한다.
bisect.insort_left(arr, 3) # 중복 되는 값 왼쪽에 삽입
bisect.insort_right(arr, 3) # 중복 되는 값 오른쪽에 삽입
print(arr)
#2. Binary Search 구현
from bisect import bisect_left
arr = [1, 2, 3, 3, 4, 5]
def bs(arr, x):
i = bisect_left(arr, x) # 들어가야 하는 '제일 왼쪽' index 반환
if i != len(arr) and arr[i] == x: # 들어가야 하는 index가
return i # 마지막 index + 1 이라면, arr에 x가 없는 것
else: # arr[i] == x가 아니라면, arr에 x가 없는 것
return -1
a = [1, 2, 4, 4, 8]
x = 4
res = bs(a, x)
if res == -1:
print(x, "는 없습니다!")
else:
print("첫번째", x, "가 등장한 위치는", res)
collections
덱(deque), 카운터(Counter) 등의 유용한 자료구조를 포함하고 있는 라이브러리
-
deque
- 파이썬에서는 일반적으로 deque를 활용해 큐를 구현한다.
- Queue 라이브러리 있지만 일반적인 큐 자료구조를 구현하는 라이브러리는 아니다.
- 리스트와 다르게 인덱싱, 슬라이싱 등의 기능은 사용할 수 없다.
- 데이터의 시작이나 끝부분에 데이터를 삽입하는데 효과적이다.
-
Counter 등장 횟수를 세는 기능을 제공한다. iterable 객체가 주어졌을 때, 해당 객체 내부 원소가 몇 번 등장했는지 알려준다.
math
수학적 기능을 제공하는 라이브러리
자주 사용되는 수학적인 기능을 포함하고 있는 라이브러리 팩토리얼, 제곱근, 최대공약수(GCD) 등을 계산해주는 기능을 포함
- 종류
- math.factorial() : 팩토리얼
- math.sqrt() : 제곱근
- math.gcd() : 최대공약수
- math.pi : 파이
- math.e : 자연상수
import math
print(math.factorial(5)) # 120
print(math.sqrt(7)) # 2.6457513110645907
print(math.gcd(21, 14)) # 7
print(math.pi) # 3.141592653589793
print(math.e) # 2.718281828459045
그외
map, split, sorted
주의점
input말고
- 뭐 어느정도로 더 빠르고 느리냐는, 코딩 테스트 문제푸는 수준에서 다룰만한 내용이 아니므로 넘어가도록 하고, 직관적으로만 느꼈던 것은, input() 으로 코드를 제출할 시, 시간초과가 뜨지만, sys.stdin.readline() 으로 제출할 시 정답이 뜨더라는 것이다. 이와 비슷한 이슈는 이미 이전부터 있었다.
한편, 나는 입출력을 지금까지 이런 방식으로 했다.
a = [int(x) for x in input().split()]
# a = [1, 2, 3, 4 ,5]
하지만, 이 방법보다 다음 방법이 더 권장된다. (위와 같은 이유로)
import sys a = list(map(int, sys.stdin.readline().split()))# a = [1, 2, 3, 4, 5]
재귀풀기
-
이전에 문제풀다가 말한 적이 있는데, 특히 자주접하는 DFS, BFS 문제의 경우 그렇다.
파이썬의 재귀 허용 깊이의 기본치가 c 보다 약한건지, c 로 짠 DFS, BFS의 경우 문제 없이 돌아가지만, 파이썬으로 돌리면 런타임 오류가 뜨는 경우가 있다. 그래서 다음과 같이 재귀 허용 깊이를 수동으로 늘려주는 코드를, 코드 상단에 적어줘야 한다.
import sys sys.setrecursionlimit(10**8) # 10^8 까지 늘림.
Pypy
-
PyPy 가 뭔지 찾아보니, 쉽게말해 파이썬 보다 몇 배 더 빠른 개선된 파이썬이라고 생각하면 된다.
좀 더 자세히 말하면, Python3 는 내부적으로는 C로 짜여져있는데 (이 이유 때문에 Python2 보다 빠르다.), 이를 C가 아니라 Python으로 다시 짠 것이다. 당연히 느릴 것 같은데, 의외로 빠르단다. 자세한 내용은 나무위키 참고.
때문에, 일반적으로 Python3 보다 PyPy로 제출해서 내는게 더 안전한 듯 하다. (빠르다는 의미에서)
한편, PyPy에서는
sys.setrecursionlimit(10**8)
이 안먹는다. 즉 임의로 재귀 호출 깊이를 설정할 수 없다는 것에 주의해야 한다.파이썬으로 문제푸는 게 편한점도 많지만 아직 어색하고, 이런 자잘한 리스크가 많은 듯 하다. 이후 또 뭔가 발견하면 남겨놔야겠다.