철솜_STUDY
ECC 프로젝트) 8차 회의 회의록 본문
[2025. 2. 20 (목) 프로젝트 회의]
1. 회귀분석 팀 (정윤, 서아)
* 지난 회의까진 릿지+LGBM 혼합모델에 감성분석 합침
* 하지만 데이터 자체에 텍스트 데이터가 들어있어 감성분석을 넣어도 무의미함을 느낌.
* 성능을 높이기 위해 Lasso 를 돌려보았으나 성능 변화가 크게 없어 기존 모델인 Ridge+LGBM 혼합 앙상블 모델로 프로젝트 마무리를 하기로 함.
2. 텍스트 분석 팀 (현경, 은서)
2.1. 현경님
* 감성 분석 이후로 문장 단위로 먼저 감성 분석.
* 리뷰단위/문장단위 같이 보는 게 좋을 것 같다고 판단. -> 평균 감성 점수와 점수의 간극이 커서 문장 단위가 아닌 리뷰 단위로 감성분석 점수를 내기로 함.
* 별점과 리뷰 내용이 다르기 때문에 별점의 객관성이 낮다고 생각하여 감성점수를 기준으로 긍정/부정/중립을 나눔.
* 긍정/부정/중립 리뷰들의 별점 분포를 살펴본 결과
ㄴ 별점과 감성 점수의 간극의 큰 리뷰들을 따로 추출하여 키워드를 봄.
ㄴ 키워드 분석보다는 토픽모델링이 적절할 것 같다고 판단
ㄴ 별점과 감성 점수의 간극의 큰 리뷰들을 토픽 모델링 -> 유의미한 단어들 추출하여 클러스터링 진행할 예정
ㄴ 앱 자체가 아닌 앱에 상품을 판매하는 판매자에 대한 신뢰도에 대해 의문을 제기한 리뷰들이 많아서 조금 더 분석할 예정
2.2. 은서님 – 클러스터링
* 분할적 클러스터링 진행
* 클러스터링은 토요일까지 진행할 예정
'Self-Taught > Project_ECC' 카테고리의 다른 글
ECC 프로젝트) 7차 회의 회의록 (0) | 2025.02.22 |
---|---|
ECC 프로젝트) 6차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트) 5차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트) 4차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트) 3차 회의 회의록 (0) | 2025.02.22 |