Notice
Recent Posts
Recent Comments
Link
«   2025/03   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
Tags
more
Archives
Today
Total
관리 메뉴

철솜_STUDY

ECC 프로젝트) 4차 회의 회의록 본문

Self-Taught/Project_ECC

ECC 프로젝트) 4차 회의 회의록

CC_flavor.철근 2025. 2. 22. 05:06

ECC 회의록(2.6)

현경, 은서-키워드 분석, 빈도 관련 내용
정윤, 서아-회귀 모델 릿지, LightGBM

은서-키워드 추출

1. 부정적 리뷰만 뽑아서 상위 20개 추출
2. 워드클라우드 추출한 결과
3. LDA 적용->토픽 모델링 진행
토픽1: 주문, 서비스 관련
토픽2: 제품의 퀄리티, 오래 걸린다
토픽3: 앱 업데이트 시의 문제
토픽4: 앱 자체의 오류. 주문 오류, 시간 지연 등의 불만
토픽5: 배달비, 배달 시간, 현금 결제 문제

##상의할 것
리뷰 텍스트 내에 포함된 장점+단점 문장들
클러스터링하는 데 신경써야 했다...리뷰 텍스트를 문장 단위로 진행하는 건 어떨지...
ex) 좋은 내용 중에서도 안 좋은 내용을 부각되게 해서 1점을 주는 경우...
=>추가 의견
서아-텍스트 분석 하고 모델 만들면 더 좋을 것 같다
정윤-문장 단위면 너무 디테일 해져서 분류가 어려울 것 같다

서아-릿지
alpha: 0~0.1, 10, 100 수행. 1일 때 가장 높은 점수.
텍스트 ngram 등 모델 임베딩하고 다시 릿지, lgbm, 앙상블 진행하는 것이 좋지 않을까 고려 중

정윤-LightGBM
하이퍼 파라미터 최적화 미수행
lightGBM>> RMSE 1.2984, MAE 0.9275
릿지+GBM>> RMSE 1.2673 MAE 0.9134

##제안
은서-확장자를 하나로 통일하는 게 좋을 것 같다=>주피터

다음 회의까지 해와야 할 것
서아, 정윤-회귀 모델
은서, 현경-텍스트 처리 방향성