Self-Taught/Project_ECC

ECC 프로젝트) 6차 회의 회의록

CC_flavor.철근 2025. 2. 22. 05:09

02.13 회의 회의록 

 

문장 단위로 리뷰 쪼개기
--> 문장 단위로 쪼개고, 어떤 리뷰에서 왔는지에 대한 original_row 칼럼, 기존 데이터셋의 score 칼럼으로 새로운 데이터 세트 만듦

--> 전처리, 피처벡터화 완료 & 전처리 과정에서 불용어로 추가되는 단어 업데이트 (무의미한 단어들이 많이 나와서 업데이트 진행)

--> 감성 분석 진행 : 감성 분석 점수 분포를 확인하고 어떻게 클러스터링 기준을 세울 것인지 확인해야 할 것 같음 
==>토요일까지 진행

 

 

#LightGBM 모델 hyperopt로 최적화
릿지+GBM가 오히려 성능이 더 떨어짐. 

스태킹 rmse: 1.1067
혼합 rmse: 1.6433, mae: 0.9912
lightgmb rmse: 1.5848, mae: 0.9635
ridge rmse: 1.8398

새로 생성한 리뷰의 별점과 예측 별점 차이
->감성분석점수 반영하여 예측모델 생성