SonicDecoder (kotlin_pcmdecoding_mvp)

SonicDecoder는 차세대 AI 뮤직 탐색기 'SonicFinder'의 핵심 엔진을 검증하기 위한 초고성능 오디오 분석 및 온디바이스(On-device) LLM 추론 MVP 프로젝트입니다.

🚀 프로젝트 핵심 가치

본 프로젝트는 단순한 음악 재생기를 넘어, 음악을 기술적으로 이해하고 의미론적으로 해석하는 데 집중합니다.

Ultra-Fast Native Engine: C++ NDK와 하드웨어 가속(AMediaCodec)을 사용하여 수천 곡의 라이브러리를 초고속 분석합니다.
On-device Semantic Intelligence: 인터넷 연결 없이 기기 내부에서 로컬 LLM을 구동하여 사용자의 자연어 요청을 음악적 태그로 변환합니다.
RAG-based Recommendation: 음악의 물리적 특징(BPM, 에너지 등)을 6D 벡터화하여 사용자 의도에 가장 가까운 곡을 추천합니다.
Scalable Search: 대규모 라이브러리를 위해 HNSW ANN + 히스토그램 매퍼로 고속 추천을 지원합니다.

✨ 주요 기능

1. 하드웨어 가속 기반 오디오 분석 (Native Core)

High-speed Decoding: AMediaExtractor & AMediaCodec 기반 하드웨어 가속 디코딩 파이프라인.
Deep Feature Extraction:
- Rhythm: BPM 추정, BPM Score(추정 신뢰도), Rhythm Stability.
- Loudness: RMS(dBFS), Peak, Crest Factor, Dynamic Range.
- Spectral: Centroid(밝기), Rolloff(개방감), MFCC Timbre (음색적 특징).
- Tonal: Key(조성), Mode(장/단조), Key Strength(조성 강도) 분석.

2. 온디바이스 지능형 인터페이스 (AI Engine)

Multi-language NLI: ML Kit 기반 다국어(9개국어+) 언어 식별 및 실시간 번역 지원.
LLM Inference: MediaPipe 기반 Gemma-2B (int4) 로컬 구동, 의도 파악 및 16개 상황 태그 매칭.
Stability Improvement: JNI 레이스 컨디션 해결을 위한 Mutex 동기화 적용으로 안정적인 추론 보장.

3. 지능형 라이브러리 관리 (Database)

Incremental Scan: MediaStore 변경분만 증분 스캔하여 분석 큐에 반영.
Deletion Sync: 라이브러리 감소 감지 시 FULL 스캔을 강제하여 삭제를 반영.
Room SQLite Persistence: 분석된 모든 오디오 피처와 6D 벡터 데이터를 로컬 DB에 안전하게 보관.

4. 검색/추천 엔진 (RAG Search)

6D Cosine Similarity: 감성 벡터 기반 유사도 검색.
ANN Index (HNSW): 10k+ 라이브러리에서 ANN 자동 전환.
Fast Percentile Mapper: 히스토그램 기반 O(1) 백분위 매핑.
MMR Diversity: 아티스트/앨범 쏠림 방지 리랭킹.
Analysis-in-Progress Fallback: 6D 미완료 트랙은 3D(energy/brightness/bpm) 폴백 검색 지원.

📊 현재 개발 상태 (Current Status)

현재 프로젝트는 핵심 기술 파이프라인 완성 및 고도화된 UI/UX 적용 단계입니다.

NDK 분석 파이프라인: MFCC, Spectral 피처 및 Tonal 분석 통합 완료.
온디바이스 LLM: 다국어 지원, JNI 안정화, 추론 파이프라인 안전장치(isReady 체크) 적용 완료.
6D Mood Mapping: Warmth, Calm, Valence 등을 포함한 6차원 감성 벡터 엔진 구축 완료.
Scalability: HNSW ANN + 히스토그램 매핑 적용 완료.
Library Sync: MediaStore 증분 스캔 + 삭제 감지(FULL 스캔) 지원.
UI/UX Enhancement:
- Theme: Energy Yellow(황금색) 메인 테마 적용, AI Test 탭 전용 Pastel Red 테마 적용.
- Visuals: 앨범 아트 표시, 직관적인 상태 아이콘(Ready/Processing/Failed), 믹스 탭 시각화 아이콘 적용.
- Interaction: 믹스 탭 라이브 프리뷰 연동, 검색창 초기화 버튼, 탭 간 네비게이션 스택 최적화.

🛠 기술 스택

Languages: Kotlin (Android), C++17 (NDK/JNI).
Audio Processing: Android Media NDK, FFTW-like DSP logic.
AI/ML: MediaPipe LLM Inference, Google ML Kit (Translation/ID).
Architecture: MVVM(LLM MVP), UseCase/Repository, WorkManager, Room Persistence Library.

🏃 시작하기

모델 파일 준비

MediaPipe에서 지원하는 gemma-2b-it-cpu-int4.bin 또는 호환 모델이 필요합니다.

# 모델 파일을 기기의 임시 폴더로 전송
adb push gemma-2b-it-cpu-int4.bin /data/local/tmp/

설치 및 로드

저장소를 클론합니다.
Android Studio에서 프로젝트를 엽니다.
Gradle 빌드를 실행합니다.
앱 실행 후 LLM MVP 탭에서 '전체 분석 다시 실행 (DB 리셋)' 버튼으로 라이브러리를 재분석할 수 있습니다.

CLI 명령 (ADB)

.\gradlew.bat :app:assembleDebug
adb install -r app\build\outputs\apk\debug\app-debug.apk
adb shell am start -n com.example.sonicdecodertest/.MainActivity
adb logcat -s SonicDecoderTest:I

📈 향후 로드맵 (Roadmap)

[완료] Visual Interaction: 6차원 감성 벡터를 직접 조절할 수 있는 다차원 슬라이더 및 레이더 차트 UI 구현.
Library Source 확장: SAF 폴더 import + 길이 미확보 FD fallback 강화.
Feature Upgrade: onset/flux, band ratios, flatness, LUFS/LRA 등 추가.
Schema 정합: raw_json v1.1 스펙 정합 및 확장.
Cross-platform Core: 분석 엔진(C++)의 재사용성을 극대화하여 멀티 플랫폼 확장 준비.

📚 학술적 배경 및 핵심 기술 (Academic Background & Core Technologies)

본 프로젝트에 적용된 핵심 알고리즘들은 검증된 학술적 연구와 산업 표준 기술을 기반으로 설계되었습니다.

1. 음악 분석 및 특징 추출 (Audio DSP)

네이티브 엔진(native-lib.cpp)에서 사용되는 로직의 이론적 기초입니다.

BPM 및 비트 탐지 (Tempo Analysis)
- 핵심 알고리즘: 에너지 엔벨로프의 자기상관(Autocorrelation) 함수 필터링.
- 관련 논문: Scheirer, E. D. (1998), "Tempo and beat analysis of acoustic musical signals." 현대 오디오 분석 엔진들이 템포를 측정하는 가장 표준적인 기법의 토대가 된 연구입니다.
조성 및 화음 분석 (Key/Tonal Detection)
- 핵심 알고리즘: Krumhansl-Schmuckler 키 찾기 알고리즘 (코드 내 24개 Major/Minor Profile 사용).
- 관련 문헌: Krumhansl, C. L. (1990), "Cognitive Foundations of Musical Pitch." 음악 심리학과 물리적 수치를 결합한 조성 분석의 표준 바이블입니다.
음색 특징 추출 (MFCC)
- 핵심 알고리즘: Mel-Frequency Cepstral Coefficients.
- 관련 논문: Davis, S., & Mermelstein, P. (1980), "Comparison of parametric representations for monosyllabic word recognition." 인간의 청각 인지 특성을 반영한 특징 추출 표준입니다.

2. 검색 및 추천 알고리즘 (Information Retrieval)

검색 엔진(SimilaritySearchEngine.kt)에서 대규모 데이터를 고속으로 처리하기 위해 채택된 기술입니다.

고속 근사 검색 (ANN Search)
- 핵심 알고리즘: HNSW (Hierarchical Navigable Small World).
- 관련 논문: Malkov, Y. A., & Yashunin, D. A. (2018), "Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs."
추천 결과 다양성 확보 (Diversity Re-ranking)
- 핵심 알고리즘: MMR (Maximal Marginal Relevance).
- 관련 논문: Carbonell, J., & Goldstein, J. (1998), "The use of MMR, diversity-based reranking for reordering documents." 추천 결과 내 아티스트/앨범 중복을 방지하기 위해 사용되었습니다.

3. 최신 온디바이스 AI 기술 (On-device AI)

NLI 엔진(LlmManager.kt)에서 사용하는 기술 스택입니다.

Gemma 2b (Google): 온디바이스 소형 언어 모델.
MediaPipe GenAI: 구글의 최신 실시간 온디바이스 LLM 추론 프레임워크.
기술 백서: Gemma Team, Google (2024), "Gemma: Open Models Based on Gemini Research and Technology."

4. 고유 기술 자산 (Proprietary IP)

6차원 감성 벡터 매핑 수식: 오디오의 물리적 수치(BPM, Centroid 등)를 6가지 감성 축(Energy, Calm 등)으로 정규화하여 매핑하는 **특정 가중치와 수식(MoodVectorCalculator.kt)**은 본 프로젝트 고유의 노하우입니다.
하이브리드 NLI 추론 파이프라인: 다국어 번역과 키워드 힌트를 LLM 결과와 교차 검증하는 3단계 워크플로우는 이 앱만의 특화된 기술 아키텍처입니다.

📄 라이선스

본 프로젝트는 **GNU Affero General Public License v3.0 (AGPL-3.0)**에 따라 배포됩니다.

Developed by Hwan Choi for SonicFinder Project.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SonicDecoder (kotlin_pcmdecoding_mvp)

🚀 프로젝트 핵심 가치

✨ 주요 기능

1. 하드웨어 가속 기반 오디오 분석 (Native Core)

2. 온디바이스 지능형 인터페이스 (AI Engine)

3. 지능형 라이브러리 관리 (Database)

4. 검색/추천 엔진 (RAG Search)

📊 현재 개발 상태 (Current Status)

🛠 기술 스택

🏃 시작하기

모델 파일 준비

설치 및 로드

CLI 명령 (ADB)

📈 향후 로드맵 (Roadmap)

📚 학술적 배경 및 핵심 기술 (Academic Background & Core Technologies)

1. 음악 분석 및 특징 추출 (Audio DSP)

2. 검색 및 추천 알고리즘 (Information Retrieval)

3. 최신 온디바이스 AI 기술 (On-device AI)

4. 고유 기술 자산 (Proprietary IP)

📄 라이선스

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

SonicDecoder (kotlin_pcmdecoding_mvp)

🚀 프로젝트 핵심 가치

✨ 주요 기능

1. 하드웨어 가속 기반 오디오 분석 (Native Core)

2. 온디바이스 지능형 인터페이스 (AI Engine)

3. 지능형 라이브러리 관리 (Database)

4. 검색/추천 엔진 (RAG Search)

📊 현재 개발 상태 (Current Status)

🛠 기술 스택

🏃 시작하기

모델 파일 준비

설치 및 로드

CLI 명령 (ADB)

📈 향후 로드맵 (Roadmap)

📚 학술적 배경 및 핵심 기술 (Academic Background & Core Technologies)

1. 음악 분석 및 특징 추출 (Audio DSP)

2. 검색 및 추천 알고리즘 (Information Retrieval)

3. 최신 온디바이스 AI 기술 (On-device AI)

4. 고유 기술 자산 (Proprietary IP)

📄 라이선스

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages