count token

PlexPt · PlexPt · commit fd3ac24a779d · 2024-08-01T06:28:24.000+08:00
diff --git a/README.md b/README.md
@@ -20,28 +20,19 @@ OpenAI ChatGPT 的SDK。觉得不错请右上角Star
 
 # 功能特性
 
-|     功能      |   特性   |
-|:-----------:| :------: |
-|   GPT 3.5   |   支持   |
-|   GPT 4.0   |   支持   |
-|    函数调用     |   支持   |
-|    流式对话     |   支持   |
-|    阻塞式对话    |   支持   |
-|     前端      |    无    |
-|     上下文     |   支持   |
-|   计算Token   | [用jtokkit](https://github.com/knuddelsgmbh/jtokkit) |
-|   多KEY轮询    |   支持   |
-|     代理      |   支持   |
-|    反向代理     |   支持   |
-
-
-
- 
-
-![image](https://user-images.githubusercontent.com/15922823/206353660-47d99158-a664-4ade-b2f1-e2cc8ac68b74.png)
-
-![image](https://user-images.githubusercontent.com/15922823/206615422-23c5e587-d29a-4f04-8d0d-f8dd7c19da37.png)
-
+|     功能      | 特性  |
+|:-----------:|:---:|
+|   GPT 3.5   | 支持  |
+|   GPT 4.0   | 支持  |
+|   GPT 4o    | 支持  |
+| GPT 4o-mini | 支持  |
+|    函数调用     | 支持  |
+|    流式对话     | 支持  |
+|     上下文     | 支持  |
+|   计算Token   | 支持  |
+|   多KEY轮询    | 支持  |
+|     代理      | 支持  |
+|    反向代理     | 支持  |
 
 
 ## 使用指南
@@ -116,6 +107,33 @@ implementation group: 'com.github.plexpt', name: 'chatgpt', version: '5.1.0'
         System.out.println(response.toPlainString());
 
 ```
+
+
+### 计算token数
+
+
+```java
+        Message system = Message.ofSystem("你现在是一个诗人，专门写七言绝句");
+        Message message = Message.of("写一段七言绝句诗，题目是：火锅！");
+
+        ChatCompletion chatCompletion1 = ChatCompletion.builder()
+        .model(ChatCompletion.Model.GPT_3_5_TURBO)
+        .messages(Arrays.asList(system, message))
+        .maxTokens(3000)
+        .temperature(0.9)
+        .build();
+        ChatCompletion chatCompletion2 = ChatCompletion.builder()
+        .model(ChatCompletion.Model.GPT4)
+        .messages(Arrays.asList(system, message))
+        .maxTokens(3000)
+        .temperature(0.9)
+        .build();
+
+        log.info("{} tokens: {}", chatCompletion1.getModel(), chatCompletion1.countTokens());
+        log.info("{} tokens: {}", chatCompletion2.getModel(), chatCompletion2.countTokens());
+
+```
+
 ### 函数调用（Function Call）
 
 ```java
@@ -299,24 +317,24 @@ chatGPT = ChatGPT.builder()
 
 # 常见问题
 
-|                              问                              |                              答                              |
-| :----------------------------------------------------------: | :----------------------------------------------------------: |
-|                         KEY从哪来？                          | 手动注册生成：openai.com(需要海外手机号)、或者成品独享帐号：[购买](https://fk.fq.mk/?code=YT0xJmI9Mg%3D%3D) |
-|                        哪些地区不能用                        | **以下国家IP不支持使用：中国(包含港澳台) 俄罗斯 乌克兰 阿富汗 白俄罗斯 委内瑞拉 伊朗 埃及!!** |
-|                         有封号风险吗                         |              使用代理有一定的风险。                  |
-|                  我是尊贵的Plus会员，能用吗                  |             PLUS是网页端，调用API没啥区别              |
-|                        GPT4.0 怎么用                         |          目前需要充值         |
-|                  api.openai.com ping不通？                   |                   禁ping，用curl测试连通性                   |
-|                          显示超时？                          |                        IP不好，换个IP                        |
-| 显示`Your access was terminated due to violation of our policies`... |                       你号没了，下一个                       |
-| 显示`That model is currently overloaded with other requests. You can retry your request` |                   模型过载，官方炸了，重试                   |
-|                      生成的图片不能用？                      |                   图片是它瞎编的，洗洗睡吧                   |
-|                          如何充值？                          |                   用国外信用卡，国内的不行                   |
-|                    没有国外信用卡怎么办？                    |         暂时没有特别好的办法待定               |
-|                         返回http 401                         |                     API 密钥写错了/没写                      |
-|                         返回http 429                         |            请求超速了，或者官方超载了。充钱可解决            |
-|                         返回http 500                         |                          服务器炸了                          |
-|                                                              |                                                              |
+|                              问                              |                                                  答                                                   |
+| :----------------------------------------------------------: |:----------------------------------------------------------------------------------------------------:|
+|                         KEY从哪来？                          | 手动注册生成：openai.com(需要海外手机号)、或者[GPT API 额度购买(微信)](https://work.weixin.qq.com/kfid/kfc6913bb4906e0e597) |
+|                        哪些地区不能用                        |                       **以下国家IP不支持使用：中国(包含港澳台) 俄罗斯 乌克兰 阿富汗 白俄罗斯 委内瑞拉 伊朗 埃及!!**                        |
+|                         有封号风险吗                         |                                             使用代理有一定的风险。                                              |
+|                  我是尊贵的Plus会员，能用吗                  |                                          PLUS是网页端，和API不是一个                                           |
+|                        GPT4.0 怎么用                         |                                                目前需要充值                                                |
+|                  api.openai.com ping不通？                   |                                           禁ping，用curl测试连通性                                           |
+|                          显示超时？                          |                                              IP不好，换个IP                                               |
+| 显示`Your access was terminated due to violation of our policies`... |                                               你号没了，下一个                                               |
+| 显示`That model is currently overloaded with other requests. You can retry your request` |                                             模型过载，官方炸了，重试                                             |
+|                      生成的图片不能用？                      |                                             图片是它瞎编的，洗洗睡吧                                             |
+|                          如何充值？                          |                                             用国外信用卡，国内的不行                                             |
+|                    没有国外信用卡怎么办？                    |                                             暂时没有特别好的办法待定                                             |
+|                         返回http 401                         |                                             API 密钥写错了/没写                                             |
+|                         返回http 429                         |                                         请求超速了，或者官方超载了。充钱可解决                                          |
+|                         返回http 500                         |                                                服务器炸了                                                 |
+|                                                              |                                                                                                      |
 
 ---
 
diff --git a/src/main/java/com/plexpt/chatgpt/entity/chat/ChatCompletion.java b/src/main/java/com/plexpt/chatgpt/entity/chat/ChatCompletion.java
@@ -178,6 +178,11 @@ public interface Model {
 
     }
 
+    /**
+     * 计算token
+     *
+     * @return
+     */
     public int countTokens() {
         return TokensUtil.tokens(this.model, this.messages);
     }
diff --git a/src/main/java/com/plexpt/chatgpt/util/TokensUtil.java b/src/main/java/com/plexpt/chatgpt/util/TokensUtil.java
@@ -18,6 +18,7 @@ public class TokensUtil {
 
     public static EncodingRegistry registry = Encodings.newDefaultEncodingRegistry();
     public static Encoding encoding = registry.getEncoding(EncodingType.CL100K_BASE);
+    public static Encoding encoding4o = registry.getEncoding(EncodingType.O200K_BASE);
 
 
     /**
@@ -27,7 +28,21 @@ public class TokensUtil {
      * @return
      */
     public static int countTextTokens(String text) {
-        return encoding.countTokens(text);
+        return encoding4o.countTokens(text);
+    }
+
+    /**
+     * 计算text信息的tokens
+     *
+     * @param text
+     * @return
+     */
+    public static int countTextTokens(String text, String model) {
+        if (StringUtils.startsWithIgnoreCase(model, ModelType.GPT_3_5_TURBO.getName())) {
+            return encoding.countTokens(text);
+        }
+
+        return encoding4o.countTokens(text);
     }
 
 
@@ -37,7 +52,7 @@ public static int countTextTokens(String text) {
      * @param name
      * @return
      */
-    private static ModelType getModelTypeByName(String name) {
+    public static ModelType getModelTypeByName(String name) {
         Optional<ModelType> optional = ModelType.fromName(name);
 
         return optional.orElse(ModelType.GPT_3_5_TURBO);
@@ -55,7 +70,7 @@ public static int tokens(List<Message> messages, String model) {
         if (CollectionUtils.isEmpty(messages)) {
             return 0;
         }
-
+        Encoding encodingUsed = encoding;
         //"gpt-3.5-turbo"
         // every message follows <|start|>{role/name}\n{content}<|end|>\n
         int tokensPerMessage = 4;
@@ -66,14 +81,17 @@ public static int tokens(List<Message> messages, String model) {
             tokensPerMessage = 3;
             tokensPerName = 1;
         }
+        if (StringUtils.startsWithIgnoreCase(model, ModelType.GPT_4O.getName())) {
+            encodingUsed = encoding4o;
+        }
 
         int sum = 0;
         for (final Message message : messages) {
             sum += tokensPerMessage;
-            sum += encoding.countTokens(message.getContent());
-            sum += encoding.countTokens(message.getRole());
+            sum += encodingUsed.countTokens(message.getContent());
+            sum += encodingUsed.countTokens(message.getRole());
             if (!StringUtils.isEmpty(message.getName())) {
-                sum += encoding.countTokens(message.getName());
+                sum += encodingUsed.countTokens(message.getName());
                 sum += tokensPerName;
             }
         }

Original file line number	Diff line number	Diff line change
`@@ -178,6 +178,11 @@ public interface Model {`
`178`	`178`
`179`	`179`	`}`
`180`	`180`
	`181`	`+ /**`
	`182`	`+ * 计算token`
	`183`	`+ *`
	`184`	`+ * @return`
	`185`	`+ */`
`181`	`186`	`public int countTokens() {`
`182`	`187`	`return TokensUtil.tokens(this.model, this.messages);`
`183`	`188`	`}`