철솜_STUDY
ECC 프로젝트) 4차 회의 회의록 본문
ECC 회의록(2.6)
현경, 은서-키워드 분석, 빈도 관련 내용
정윤, 서아-회귀 모델 릿지, LightGBM
은서-키워드 추출
1. 부정적 리뷰만 뽑아서 상위 20개 추출
2. 워드클라우드 추출한 결과
3. LDA 적용->토픽 모델링 진행
토픽1: 주문, 서비스 관련
토픽2: 제품의 퀄리티, 오래 걸린다
토픽3: 앱 업데이트 시의 문제
토픽4: 앱 자체의 오류. 주문 오류, 시간 지연 등의 불만
토픽5: 배달비, 배달 시간, 현금 결제 문제
##상의할 것
리뷰 텍스트 내에 포함된 장점+단점 문장들
클러스터링하는 데 신경써야 했다...리뷰 텍스트를 문장 단위로 진행하는 건 어떨지...
ex) 좋은 내용 중에서도 안 좋은 내용을 부각되게 해서 1점을 주는 경우...
=>추가 의견
서아-텍스트 분석 하고 모델 만들면 더 좋을 것 같다
정윤-문장 단위면 너무 디테일 해져서 분류가 어려울 것 같다
서아-릿지
alpha: 0~0.1, 10, 100 수행. 1일 때 가장 높은 점수.
텍스트 ngram 등 모델 임베딩하고 다시 릿지, lgbm, 앙상블 진행하는 것이 좋지 않을까 고려 중
정윤-LightGBM
하이퍼 파라미터 최적화 미수행
lightGBM>> RMSE 1.2984, MAE 0.9275
릿지+GBM>> RMSE 1.2673 MAE 0.9134
##제안
은서-확장자를 하나로 통일하는 게 좋을 것 같다=>주피터
다음 회의까지 해와야 할 것
서아, 정윤-회귀 모델
은서, 현경-텍스트 처리 방향성
'Self-Taught > Project_ECC' 카테고리의 다른 글
ECC 프로젝트) 6차 회의 회의록 (0) | 2025.02.22 |
---|---|
ECC 프로젝트) 5차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트) 3차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트 ) 2차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트) 1차 회의 회의록 (0) | 2025.02.22 |