철솜_STUDY
ECC 프로젝트) 1차 회의 회의록 본문
2025.01.25 회의록
[ 주 회의 내용 ]
1. 프로젝트 방향성
2. 칼럼에 대한 논의 (전처리 방법 등)
1. 프로젝트 방향성
- 추천 시스템에 대한 이야기 => 상품에 관련된 내용이 없어서 무리
- 알리익스프레스 알리바바 등은 비슷한 상품들을 파는 사이트 => 쇼핑몰의 장단점, 키워드 뽑아서 여유가 된다면 쇼핑몰 추천 시스템으로 이어져도 괜찮을듯!
=>> 결론 : 별점 예측 하는 정도 + 앱의 문제점 분석 정도 (+ 추후 여유 시 쇼핑몰 추천 시스템 추가)
2. 칼럼에 대한 논의
1) 리뷰ID칼럼 없애기? (문자열 처리 어려움?)
- 한 앱에 대해 한 사람이 여러번 리뷰를 남길 수 있는지 확인 (EDA 과정에서)
2) thumbsupcount => 최소값 0 최대값 10000 => 처리 방법?
- 칼럼이 나타내는 것이 앱을 얼마나 많은 사람들이 사용하는지 표시되는 듯 함? 그게 아니라면 삭제해도 괜찮을 듯.
- 동의를 했다는 표시, 리뷰에 대한 신빙성 증가
- 5~10개 이상으로 잡았을 떄 절반 정도의 데이터가 살아남을 듯.
- 0인것만 제외하고 본다거나 하는 방법도?
- 데이터 수 구간 분류해서 등급으로 새로 매기기?
>>>> EDA를 더 해보면서 고민해보기 <<<<
3) 쇼핑몰 데이터 12개를 다 이용? 특정 쇼핑몰 데이터만 이용해서 활용?
- 데이터 하나를 가지고 테스트 or 비슷한 데이터 분포를 가진 쇼핑몰 데이터끼리 묶어서 진행해보기 => 하나를 가지고로 결정!
- 중복된 개수가 적은 데이터, thumbsupcount가 치중되지 않은 데이터를 고르기로 결정
[ 다음주 목표 ]
= 3 / 3 / 3 / 2 개 쇼핑몰 데이터에 대한 EDA 작성, 결과 공유
= 목요일(01.30.)까지 데이터 결정
= 토요일(02.01.)까지 전처리와 피처벡터 부분 결정
'Self-Taught > Project_ECC' 카테고리의 다른 글
ECC 프로젝트) 6차 회의 회의록 (0) | 2025.02.22 |
---|---|
ECC 프로젝트) 5차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트) 4차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트) 3차 회의 회의록 (0) | 2025.02.22 |
ECC 프로젝트 ) 2차 회의 회의록 (0) | 2025.02.22 |