Skip to content

탐색 및 추천 레포 풀 생성 로직  #2

@dane805

Description

@dane805

추천 풀 생성 룰 관련

  • 포크 떠온 레포는 제거하자 (어케 할 건지는 알아봐야함)
  • 스타/포크 수 아다리가 좀 안 맞는다 -> distinct count를 해야 한다
  • 풀 형성 관련해서 데이터 날리는 걸로는 어전히 star가 그래도 유의미하지 않을까 (vs 상재: issue!!)

기억해둘 정보

  • 레포의 60%는 스타 1개, 30%는 커밋 1개
  • 포크는 그냥 공유용일 수 있어보인다(교육) -> 신뢰하기 어려움
  • 레포 이름은 사용자가 이름 바뀌면 바뀌고, 탈퇴하면 날라가기 때문에 살아있는지 검사에 주의해야 한다 (id는 ㄱㅊ)
    • id로 URL 땡기는 등의 API 가능
    • 죽으면(탈퇴하면) 안나옴
  • 커밋 별로 없이 유명한 건 간단하며 유용한 거거나 논문 같은 것들
  • 이슈 없이 유명한 건 간단한 거나 교재 같은 것 .. 비슷 ... 아님 풀리퀘 conversation에 나오기도 함

기타 아이디어

  • 웹 UI에서 add한 건지 아님 push한 건지도 확인되면 유의미한 피쳐일듯
  • 봇이 푸시한 것도 변별되는가? -> 아마 유의미한 피쳐
  • 활동의 다양성 (type 종류 수)
  • 최근 업데이트가 없어도 계속 스타가 찍히는 케이스들도 얼마나 있을까?
    • 책 솔루션??

커밋 메시지의 컨벤션

  • 오탈자 잡는 커밋이라던가
  • 근데 요새는 보통 이슈로 처리함

구루 유저

als로 간단하게 임베딩 뽑아서 클러스터링 해보면?

Metadata

Metadata

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions