Skip to content

feat: 增加 lite 账户类型,解决 25 次限额账号被刷新自动识别为 basic 的问题#555

Open
luolong47 wants to merge 1 commit into
chenyme:mainfrom
luolong47:feature/add-lite-pool-tier
Open

feat: 增加 lite 账户类型,解决 25 次限额账号被刷新自动识别为 basic 的问题#555
luolong47 wants to merge 1 commit into
chenyme:mainfrom
luolong47:feature/add-lite-pool-tier

Conversation

@luolong47
Copy link
Copy Markdown

Summary

我是 Grok Lite 账号(官方接口返回的 auto.total 限制是 25 次)。

痛点
之前系统里没有 lite 这个 pool 档位,所以每次我手动在数据库里把账号改成 super 勉强能用。但是只要系统后台一刷新,系统读到 25 次配额之后,由于不认识这个额度,就会把账号自动降级判定回 basic,导致高级模型直接用不了(也就是一刷新就和 basic 一桌了)。

为了解决这个问题,本次 PR 增加了 lite 账户类型,并在刷新、判定、路由上使其表现和 super 账户完全一致。

改动内容

  1. 配额自动推断:在 quota_defaults.pyinfer_pool() 中增加 auto.total == 25 的判定,将其正确推断为 lite 账户。
  2. 对齐支持的模式与模型
    • _SUPPORTED_MODE_IDS_BY_POOL["lite"] 配置为 (0, 1, 2, 4),跟 super 完全一样(增加了对 grok-4.3-beta 的 Mode 4 的支持,移除了不支持的 heavy)。
    • LITE_QUOTA_DEFAULTS 里的 heavy 去除,增加 grok_4_3 配额。
    • Tier.SUPER 的模型的候选池列表里包含了 lite(即 1),使得 lite 可以作为 super 模型的可选路由。
  3. 各组件兼容
    • enums.py 中增加了 LITE 的 Tier / PoolId。
    • 兼容了 SQLite / SQL / Redis 后端的 pool 写入白名单(支持写入 "lite",解决 500 报错)。
    • scheduler.py 中配置了和 super 相同的同步刷新和冷却机制(7200秒)。

Testing

在本地进行了实际接口调用验证。
当数据库里只有 lite 账号时,调用 http://127.0.0.1:8000/v1/models 接口,可以正常加载所有原属于 super 的高级模型列表(包括 grok-4.3-beta ),未再出现降级为 basic 或 Pydantic 校验的 500 报错。

Related

暂无

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant