
오늘은 추가 데이터분석을 중점적으로 하였다. 온도와 압력의 결함 수를 비교하여 어떤 변수가 더 영향을 미치는지와 공정별로 결함비율이 어느정도인지, 1월~4월의 시간(hour)데이터를 선그래프로 나타내서 비교 등을 진행하였다. 내일은 공정별로 노출시간, 온도, 압력의 가중치를 정해 어떤 변수가 더 결함에 영향을 주는지와 시간데이터를 월별로 나눠서 다시 비교해보는 등 추가 데이터 분석을 더 하고, 대시보드 작성을 할려고 한다.
🤓 기초 프로젝트
사실 조원들의 속도를 따라갈려고 분석을 이것저것 해보았으나 그래프를 그리고 나서 보니 어제 조원들이 올려준 그래프와 똑같은게 있어서 살짝 당황했다.
1. 공정 단계별 결함 유형의 '평균 결함 개수' | 공정 단계별 결함 유형(Defect Type) 발생 비율(%)

2. 온도 조건별(10℃ 간격) 결함 유형별 평균 발생 비율 | 압력 조건별(0.5mbar 간격) 결함 유형별 평균 발생 비율

→ 온도 기준 170℃ 이후부터 Overetch 결함이 발생하였고, Particle은 사라진걸 확인
→ 압력별로는 Overetch와 Particle이 크게 영향이 있는지 보기 힘들다.
3. 시간대별 평균 결함 개수 추이 | 시간대별 결함 유형(Defect Type) 누적 발생 추이

→ 이것은 내일 월별로 나눠서 다시 분석해볼 예정
⌨️ 코드카타
59번

def solution(n, m, section):
count = 0
i = 0
length = len(section)
while i < length:
start = section[i] # 아직 안 칠한 가장 왼쪽
cover_end = start + m - 1 # 롤러로 덮을 수 있는 최대 범위
count += 1
# 현재 롤러로 덮이는 구간 모두 skip
while i < length and section[i] <= cover_end:
i += 1
return count
solution(8,4,[2,3,6])
# 출력 결과 : 2

def solution(number, limit, power):
div_cnt = [0] * (number + 1)
# 약수 개수 누적 (에라토스테네스식)
for i in range(1, number + 1):
for j in range(i, number + 1, i):
div_cnt[j] += 1
total = 0
for i in range(1, number + 1):
if div_cnt[i] > limit:
total += power
else:
total += div_cnt[i]
return total
solution(5,3,2)
# 출력 결과 : 10


def solution(lottos, win_nums):
zero_count = lottos.count(0)
win_set = set(win_nums)
match_count = 0
for num in lottos:
if num != 0 and num in win_set:
match_count += 1
best = match_count + zero_count
worst = match_count
def rank(x):
if x <= 1:
return 6
return 7 - x
return [rank(best), rank(worst)]
solution([44,1,0,0,31,25],[31,10,45,1,6,19])
# 출력 결과 : [3, 5]