Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

철솜_STUDY

ECC 프로젝트) 8차 회의 회의록 본문

Self-Taught/Project_ECC

ECC 프로젝트) 8차 회의 회의록

CC_flavor.철근 2025. 2. 22. 05:11

[2025. 2. 20 (목) 프로젝트 회의]

1. 회귀분석 팀 (정윤, 서아)
* 지난 회의까진 릿지+LGBM 혼합모델에 감성분석 합침
* 하지만 데이터 자체에 텍스트 데이터가 들어있어 감성분석을 넣어도 무의미함을 느낌.
* 성능을 높이기 위해 Lasso 를 돌려보았으나 성능 변화가 크게 없어 기존 모델인 Ridge+LGBM 혼합 앙상블 모델로 프로젝트 마무리를 하기로 함.

2. 텍스트 분석 팀 (현경, 은서)
2.1. 현경님
* 감성 분석 이후로 문장 단위로 먼저 감성 분석.
* 리뷰단위/문장단위 같이 보는 게 좋을 것 같다고 판단. -> 평균 감성 점수와 점수의 간극이 커서 문장 단위가 아닌 리뷰 단위로 감성분석 점수를 내기로 함.
* 별점과 리뷰 내용이 다르기 때문에 별점의 객관성이 낮다고 생각하여 감성점수를 기준으로 긍정/부정/중립을 나눔. 
* 긍정/부정/중립 리뷰들의 별점 분포를 살펴본 결과 
ㄴ 별점과 감성 점수의 간극의 큰 리뷰들을 따로 추출하여 키워드를 봄.
ㄴ 키워드 분석보다는 토픽모델링이 적절할 것 같다고 판단
ㄴ 별점과 감성 점수의 간극의 큰 리뷰들을 토픽 모델링 -> 유의미한 단어들 추출하여 클러스터링 진행할 예정
ㄴ 앱 자체가 아닌 앱에 상품을 판매하는 판매자에 대한 신뢰도에 대해 의문을 제기한 리뷰들이 많아서 조금 더 분석할 예정
2.2. 은서님 – 클러스터링
* 분할적 클러스터링 진행
* 클러스터링은 토요일까지 진행할 예정