문제주소 :programmers.co.kr/learn/courses/30/lessons/17676
<문제 설명>
문제 설명
추석 트래픽
이번 추석에도 시스템 장애가 없는 명절을 보내고 싶은 어피치는 서버를 증설해야 할지 고민이다. 장애 대비용 서버 증설 여부를 결정하기 위해 작년 추석 기간인 9월 15일 로그 데이터를 분석한 후 초당 최대 처리량을 계산해보기로 했다. 초당 최대 처리량은 요청의 응답 완료 여부에 관계없이 임의 시간부터 1초(=1,000밀리초)간 처리하는 요청의 최대 개수를 의미한다.
입력 형식
- solution 함수에 전달되는 lines 배열은 N(1 ≦ N ≦ 2,000)개의 로그 문자열로 되어 있으며, 각 로그 문자열마다 요청에 대한 응답완료시간 S와 처리시간 T가 공백으로 구분되어 있다.
- 응답완료시간 S는 작년 추석인 2016년 9월 15일만 포함하여 고정 길이 2016-09-15 hh:mm:ss.sss 형식으로 되어 있다.
- 처리시간 T는 0.1s, 0.312s, 2s 와 같이 최대 소수점 셋째 자리까지 기록하며 뒤에는 초 단위를 의미하는 s로 끝난다.
- 예를 들어, 로그 문자열 2016-09-15 03:10:33.020 0.011s은 2016년 9월 15일 오전 3시 10분 **33.010초**부터 2016년 9월 15일 오전 3시 10분 **33.020초**까지 **0.011초** 동안 처리된 요청을 의미한다. (처리시간은 시작시간과 끝시간을 포함)
- 서버에는 타임아웃이 3초로 적용되어 있기 때문에 처리시간은 0.001 ≦ T ≦ 3.000이다.
- lines 배열은 응답완료시간 S를 기준으로 오름차순 정렬되어 있다.
출력 형식
- solution 함수에서는 로그 데이터 lines 배열에 대해 초당 최대 처리량을 리턴한다.
입출력 예제
예제1
-
입력: [
2016-09-15 01:00:04.001 2.0s,
2016-09-15 01:00:07.000 2s
] -
출력: 1
예제2
-
입력: [
2016-09-15 01:00:04.002 2.0s,
2016-09-15 01:00:07.000 2s
] -
출력: 2
-
설명: 처리시간은 시작시간과 끝시간을 포함하므로
첫 번째 로그는 01:00:02.003 ~ 01:00:04.002에서 2초 동안 처리되었으며,
두 번째 로그는 01:00:05.001 ~ 01:00:07.000에서 2초 동안 처리된다.
따라서, 첫 번째 로그가 끝나는 시점과 두 번째 로그가 시작하는 시점의 구간인 01:00:04.002 ~ 01:00:05.001 1초 동안 최대 2개가 된다.
예제3
-
입력: [
2016-09-15 20:59:57.421 0.351s,
2016-09-15 20:59:58.233 1.181s,
2016-09-15 20:59:58.299 0.8s,
2016-09-15 20:59:58.688 1.041s,
2016-09-15 20:59:59.591 1.412s,
2016-09-15 21:00:00.464 1.466s,
2016-09-15 21:00:00.741 1.581s,
2016-09-15 21:00:00.748 2.31s,
2016-09-15 21:00:00.966 0.381s,
2016-09-15 21:00:02.066 2.62s
] -
출력: 7
-
설명: 아래 타임라인 그림에서 빨간색으로 표시된 1초 각 구간의 처리량을 구해보면 (1)은 4개, (2)는 7개, (3)는 2개임을 알 수 있다. 따라서 초당 최대 처리량은 7이 되며, 동일한 최대 처리량을 갖는 1초 구간은 여러 개 존재할 수 있으므로 이 문제에서는 구간이 아닌 개수만 출력한다.
<풀이법>
▒ 한줄 개념: 파싱 ▒
정말 피곤한 문제네요. 시간 문자열 파싱은 해도해도 적응이 되지 않는 것 같습니다.
특별한 알고리즘이 필요한 건 아니고, 문제 풀이 방식은 다음과 같습니다.
1. 시간 문자열을 파싱해서 (시작시간, 종료시간)
의 형태로 저장.
배열을 하나 선언한 뒤, 위와 같은 형태로 저장해줍니다. 여기서 float이나 double 형을 사용할 경우 계산이 까다로울 뿐더러 실수나 에러가 발생하기도 하니, int형으로 통일시켜 주는 것이 가장 좋습니다.
2. 2중 반복문을 사용하며, 종료시간을 기준으로 조건 체크.
어떤 로그의 종료시간 end_time[i]
에 대하여, 1초 내에 다른 로그가 포함되어 있는지를 확인하는 조건은 다음과 같이 3개가 있습니다.
a. 다른 로그의 시작시간이 범위안에 있는 경우 : end_time[i] < start_time[j] < end_time[i] + 1000
b. 다른 로그의 종료시간이 범위안에 있는 경우 : end_time[i] < end_time[j] < end_time[i] + 1000
c. 현재 로그의 종료 시간의 범위가 다른 로그 진행 시간안에 있는 경우 : start_time[j] < end_time[i], end_time[i] + 1000 < end_time[j]
3. 위 조건들을 가지고 센 갯수들을 answer
와 비교
answer = max(count, answer)
<코드(Python)>
def solution(lines):
answer = 0
total_times = []
for i in range(len(lines)):
start_time, end_time = get_times(lines[i])
total_times.append((start_time, end_time, i))
for i in range(len(total_times)):
count = 1
end_time = total_times[i][1]
for j in range(len(total_times)):
if i == j:
continue
t_start_time = total_times[j][0]
t_end_time = total_times[j][1]
if t_start_time >= end_time and t_start_time < end_time + 1000:
count += 1
elif t_end_time >= end_time and t_end_time < end_time + 1000:
count += 1
elif end_time >= t_start_time and end_time + 1000 <= t_end_time:
count += 1
if count > answer:
answer = count
return answer
def get_times(log):
temp = log.split(" ")
end_time = temp[1].split(':')
end_time = int(end_time[0]) * 3600000 + int(end_time[1]) * 60000 + int(end_time[2].replace('.', ''))
start_time = end_time - int(float(temp[2].replace('s', ''))*1000) + 1
return (start_time, end_time) if start_time > 0 else (0, end_time)
더 많은 코드 보기(GitHub) : github.com/dwkim-97/CodingTest
'Programmers' 카테고리의 다른 글
[프로그래머스] 올바른 괄호의 갯수 / Python (0) | 2021.02.06 |
---|---|
[프로그래머스] 가사 검색 / Python (0) | 2021.02.06 |
[프로그래머스] 불량 사용자 / Python / 반례 (0) | 2021.02.05 |
[프로그래머스] 징검다리 건너기 / Python (0) | 2021.02.04 |
[프로그래머스] 스타 수열 / Python / 반례 (0) | 2021.02.04 |