
오늘은 정말 최최최최최최최종 데이터 분석 후, 시각화 자료 결과 안사이트 서로 의견 나눠보고, PPT 제작 및 그래프 순서를 어떻게 넣을지 토의를 했다.
저는 equipment_log 값에서 나눈 timestamp의 날짜를 월별, 주별로 나눠서 평균 결함 수를 분석했다.
월별
month defect_count_sum defect_count_mean
0 2025-01 4166 1.485205
1 2025-02 3725 1.509931
2 2025-03 4071 1.449786
3 2025-04 1535 1.460514
평균 Defect_count 최대 월
month 2025-02
defect_count_sum 3725
defect_count_mean 1.509931
Name: 1, dtype: object
평균 Defect_count 최소 월
month 2025-03
defect_count_sum 4071
defect_count_mean 1.449786
Name: 2, dtype: object
주별
week defect_count_sum defect_count_mean
0 2025-W01 707 1.574610
1 2025-W02 896 1.447496
2 2025-W03 962 1.408492
3 2025-W04 943 1.508800
4 2025-W05 902 1.493377
5 2025-W06 893 1.488333
6 2025-W07 966 1.560582
7 2025-W08 913 1.477346
8 2025-W09 986 1.516923
9 2025-W10 913 1.393893
10 2025-W11 934 1.441358
11 2025-W12 983 1.514638
12 2025-W13 852 1.486911
13 2025-W14 889 1.417863
14 2025-W15 758 1.480469
평균 Defect_count 최대 주
week 2025-W01
defect_count_sum 707
defect_count_mean 1.57461
Name: 0, dtype: object
평균 Defect_count 최소 주
week 2025-W10
defect_count_sum 913
defect_count_mean 1.393893
Name: 9, dtype: object
허나 분석한 후 도메인 공부를 해본 결과. timestamp에 나타난 시간은 작동시간이 아닌 그 전 단계의 공정을 했던 시간이므로 상관관계 분석을 할 수 없다는걸 알게 되었다.