Self-Taught/Project_ECC
ECC 프로젝트) 6차 회의 회의록
CC_flavor.철근
2025. 2. 22. 05:09
02.13 회의 회의록
문장 단위로 리뷰 쪼개기
--> 문장 단위로 쪼개고, 어떤 리뷰에서 왔는지에 대한 original_row 칼럼, 기존 데이터셋의 score 칼럼으로 새로운 데이터 세트 만듦
--> 전처리, 피처벡터화 완료 & 전처리 과정에서 불용어로 추가되는 단어 업데이트 (무의미한 단어들이 많이 나와서 업데이트 진행)
--> 감성 분석 진행 : 감성 분석 점수 분포를 확인하고 어떻게 클러스터링 기준을 세울 것인지 확인해야 할 것 같음
==>토요일까지 진행
#LightGBM 모델 hyperopt로 최적화
릿지+GBM가 오히려 성능이 더 떨어짐.
스태킹 rmse: 1.1067
혼합 rmse: 1.6433, mae: 0.9912
lightgmb rmse: 1.5848, mae: 0.9635
ridge rmse: 1.8398
새로 생성한 리뷰의 별점과 예측 별점 차이
->감성분석점수 반영하여 예측모델 생성