카테고리 없음

기초 프로젝트_DAY2_데이터 전처리2

iron-min 2025. 10. 14. 20:49

1. 추가 데이터 확보하기

조원들과 토의를 하여 원 데이터에 유가 데이터를 추가해 유가와 탄소배출과 관련된 상관관계를 보기로 하였습니다.

그래서 데이터를 찾기위해 EIA 웹사이트의 북미 유가 데이터를 찾아 데이터 시트화 하였습니다.

 

천연가스 유가 월별 데이터 시트

 

 

이런 데이터를 총 5개의 시트를 만들었고 분석해보기로 했습니다.

 

2. 이전 데이터에서 추가 분석

소형 중형 대형 차량의 연료종류에 따른 연도별 탄소배출량 변화를 알고 싶어서 다음과 같이 분석해보았습니다.

Fuel_Consumption_SMALL = Fuel_Consumption[Fuel_Consumption['SIZE CLASS']=='SMALL']
EMISSIONS_cols_SMALL = Fuel_Consumption_SMALL[['YEAR','EMISSIONS']]
EMISSIONS_cols_SMALL_grouped = EMISSIONS_cols_SMALL.groupby('YEAR').mean()

plt.figure(figsize=(12, 8))

sns.lineplot(data=EMISSIONS_cols_SMALL_grouped, x='YEAR', y='EMISSIONS' ,marker='o', markersize=6)

plt.title('연도별 평균 연비 변화', fontsize=16)
plt.xlabel('연도 (YEAR)', fontsize=12)
plt.ylabel('EMISSIONS', fontsize=12)
plt.grid(True, linestyle='--', alpha=0.6)

plt.show()

 

소형 차량의 연도별 탄소배출량 평균변화

 

중형 차량의 연도별 탄소배출량 평균변화
대형 차량의 연도별 탄소배출량 평균변화

 

이번 시각화로 정말 차량의 연식이 탄소배출량에 영향이 없다는 것을 알 수 있었습니다.

상관계수도 그걸 증명하고요.

 

3. 추가데이터 활용 방안 분석

 

앞서 추가데이터를 가져왔긴 했지만 아무래도 문제정의가 잘 되지 않아 데이터 분석을 시작하는데 어려움이 있었습니다.

추가데이터를 가져오기 전에 어떤 문제를 해결하고 싶은지 먼저 생각해보는것도 좋을 것 같습니다.