You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
- UI 명칭 확정: AI Assistant & Agent (약칭 AI)
- 연결 방식 비교표 추가 (계정 연결 / API Key / 로컬 실행)
- Provider 모델명 최신화 (Gemini 2.5, GPT-5, Claude 4.x, Llama3 계열)
- 로컬 실행 툴 확장: Ollama 외 LM Studio, Jan, LocalAI, GPT4All 추가
- Gemma 4 로컬 모델 추가
- 외부 AI Agent 섹션 [확정] → [미확정 / 초안] 태그 수정
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
Copy file name to clipboardExpand all lines: docs/v2_FINANCIAL-LEDGER/technical/03-ai-integration.md
+61-16Lines changed: 61 additions & 16 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -1,5 +1,16 @@
1
1
# AI 통합 정책
2
2
3
+
## UI 명칭
4
+
5
+
-**정식 명칭**: AI Assistant & Agent (AI 어시스턴트 & 에이전트)
6
+
-**약칭**: AI (설정 메뉴 레이블 등 공간이 좁을 때)
7
+
-**구분 기준**:
8
+
- Assistant — 사용자 요청에 응답하는 대화형 분석/요약
9
+
- Agent — 모듈에 사전 저장된 프롬프트로 자동 동작하는 것
10
+
-**설정 화면 구조**: 항목 수에 따라 단일 섹션 또는 서브탭으로 결정 예정
11
+
12
+
---
13
+
3
14
## 개요
4
15
5
16
AI는 계산 주체가 아닌 **분석/요약/해설 역할**로만 사용됩니다.
@@ -21,42 +32,76 @@ AI는 계산 주체가 아닌 **분석/요약/해설 역할**로만 사용됩니
21
32
22
33
---
23
34
35
+
## 연결 방식 비교
36
+
37
+
AI를 사용하는 방식은 크게 세 가지로 나뉩니다.
38
+
39
+
| 항목 | 계정 연결 | API Key 연결 | 로컬 실행 |
40
+
|------|-----------|--------------|-----------|
41
+
|**연결 방법**| OAuth / 소비자 앱 계정 | API Key 직접 입력 | 로컬 서버 URL 입력 |
42
+
|**해당 툴**| ChatGPT Plus, Gemini Advanced 등 | OpenAI, Anthropic, Google AI | Ollama, LM Studio, Jan, LocalAI, GPT4All 등 |
43
+
|**학습 데이터 사용**| ⚠️ Provider 정책에 따라 다름 | ✅ 기본적으로 학습 제외 | ✅ 데이터 외부 전송 없음 |
44
+
|**프라이버시**| 낮음 | 중간 | 높음 (완전 로컬) |
45
+
|**비용**| 구독료 (월정액) | 사용량 기반 과금 | 무료 (하드웨어 비용 제외) |
46
+
|**응답 품질**| 높음 | 높음 | 모델에 따라 다름 |
47
+
|**설정 난이도**| 쉬움 | 보통 | 보통~어려움 (별도 설치 필요) |
48
+
|**오프라인 사용**| ❌ | ❌ | ✅ |
49
+
|**권장 여부**| 비권장 | ✅ 권장 | ✅ 권장 (프라이버시 우선 시) |
50
+
51
+
> **📌 권장 사항:** API Key 연결 방식은 Provider 약관상 API 호출 데이터를 학습에 사용하지 않으므로, 계정 연결 방식보다 프라이버시 측면에서 안전합니다. 완전한 데이터 격리가 필요하다면 로컬 실행 방식을 권장합니다.
52
+
53
+
---
54
+
24
55
## 지원 Provider
25
56
26
57
### 1. Google Gemini
27
58
28
-
Provider를 'gemini'로 설정하고, 사용 가능한 모델으로 gemini-pro와 gemini-pro-vision이 있습니다. 지원하는 기능은 텍스트, 이미지, 멀티모달입니다.
59
+
Provider를 'gemini'로 설정하고, 사용 가능한 모델으로 `gemini-2.5-flash`, `gemini-2.5-pro`가 있습니다. 지원하는 기능은 텍스트, 이미지, 멀티모달입니다.
29
60
30
61
**장점:**
31
-
- 무료 티어 제공
32
-
- 멀티모달 (텍스트 + 이미지)
62
+
- 무료 티어 제공 (Flash 계열)
63
+
- 멀티모달 (텍스트 + 이미지) — 별도 Vision 모델 없이 통합 지원
33
64
- 빠른 응답
34
65
35
-
### 2. OpenAI
66
+
### 2. OpenAI(ChatGPT)
36
67
37
-
Provider를 'openai'로 설정하고, 사용 가능한 모델으로 gpt-4, gpt-4-turbo, gpt-3.5-turbo가 있습니다. 지원하는 기능은 텍스트와 함수 호출(Function Calling)입니다.
68
+
Provider를 'openai'로 설정하고, 사용 가능한 모델으로 `gpt-5.4`, `gpt-5.3`, `o3`가 있습니다. 지원하는 기능은 텍스트, 이미지(Vision), 함수 호출(Function Calling)입니다.
38
69
39
70
**장점:**
40
71
- 고품질 응답
41
-
- Function Calling 지원
72
+
- Function Calling 및 Vision 지원
42
73
- 안정적
43
74
44
75
### 3. Anthropic Claude
45
76
46
-
Provider를 'anthropic'로 설정하고, 사용 가능한 모델으로 claude-3-opus, claude-3-sonnet, claude-3-haiku가 있습니다. 지원하는 기능은 텍스트와 긴 컨텍스트 처리입니다.
77
+
Provider를 'anthropic'로 설정하고, 사용 가능한 모델으로 `claude-opus-4-6`, `claude-sonnet-4-6`, `claude-haiku-4-5-20251001`가 있습니다. 지원하는 기능은 텍스트, 이미지(Vision), 긴 컨텍스트 처리입니다.
47
78
48
79
**장점:**
49
-
- 긴 컨텍스트
50
-
- 정확한 분석
51
-
- 안전성
80
+
- 긴 컨텍스트 (최대 200k 토큰)
81
+
- 정확한 분석 및 안전성
82
+
- Vision 지원
83
+
84
+
### 4. 로컬 실행
85
+
86
+
모델을 기기에서 직접 실행하는 방식입니다. 데이터가 외부로 전송되지 않아 완전한 프라이버시를 보장합니다.
87
+
88
+
**지원 툴:**
89
+
90
+
| 툴 | 특징 | 난이도 |
91
+
|----|------|--------|
92
+
|**Ollama**| CLI 기반, 개발자 친화적. 가장 널리 사용됨 | 보통 |
93
+
|**LM Studio**| GUI 기반, 비개발자도 쉽게 사용 가능. OpenAI 호환 API 제공 | 쉬움 |
94
+
|**Jan**| 프라이버시 중심 설계, GUI 앱. OpenAI 호환 API 제공 | 쉬움 |
95
+
|**LocalAI**| OpenAI API 완전 호환 서버. 다양한 모델 형식 지원 | 어려움 |
96
+
|**GPT4All**| 설치가 매우 간단한 데스크탑 앱 | 쉬움 |
52
97
53
-
### 4. Ollama (로컬)
98
+
**사용 가능한 주요 모델:**`llama3.2`, `llama3.1`, `gemma4`, `gemma3`, `mistral`, `codellama` 등 (구 `llama2`는 구버전)
54
99
55
-
Provider를 'ollama'로 설정하고, 사용 가능한 모델으로 llama2, mistral, codellama가 있습니다. 지원하는 기능은 텍스트와 로컬 실행입니다.
100
+
> **Gemma 4 (Google):** Google이 공개한 최신 로컬 모델. Ollama에서 `gemma4`로 실행 가능. 경량 모델 대비 성능이 뛰어나며 한국어 처리도 개선됨.
56
101
57
102
**장점:**
58
103
- 완전 무료
59
-
- 프라이버시
104
+
- 프라이버시 (데이터 외부 전송 없음)
60
105
- 오프라인 사용
61
106
62
107
---
@@ -69,7 +114,7 @@ AI_PROVIDER에 사용할 Provider 이름을 넣고, AI_API_KEY에 해당 Provide
generateStream 메서드는 동일하게 프롬프트를 전송하지만, 응답을 청크 단위로 실시간으로 받아 하나씩 반환합니다.
96
141
97
-
analyzeImage 메서드는 이미지를 Base64로 변환하여 프롬프트와 함께 gemini-pro-vision 모델에 전송하고, 분석 결과를 텍스트로 반환합니다.
142
+
analyzeImage 메서드는 이미지를 Base64로 변환하여 프롬프트와 함께 멀티모달 모델(예: `gemini-2.5-flash`, `gpt-5.4`, `claude-sonnet-4-6`)에 전송하고, 분석 결과를 텍스트로 반환합니다. Vision을 지원하지 않는 Provider(예: Ollama 일부 모델)는 에러를 발생시킵니다.
98
143
99
144
### Provider 팩토리
100
145
@@ -198,7 +243,7 @@ AI가 비활성화되면 모든 AI 기능은 기본 통계로 대체됩니다.
198
243
199
244
---
200
245
201
-
## [확정] 외부 AI Agent 연동 (OpenClaw, Custom GPTs 등)
246
+
## [미확정 / 초안] 외부 AI Agent 연동 (Custom GPTs 등)
202
247
203
248
> **📌 핵심 원칙:** Fieldstack의 기능을 외부 AI가 "스킬(Skill)"로 사용할 수 있도록 표준화된 인터페이스를 제공합니다.
0 commit comments