steipete · ngattusohw · Feb 15, 2026 · Feb 15, 2026
diff --git a/src/costs.ts b/src/costs.ts
@@ -1,6 +1,6 @@
 import type { LlmTokenUsage } from "./llm/generate-text.js";
 
-export type LlmProvider = "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia" | "cli";
+export type LlmProvider = "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia" | "vertex" | "cli";
 
 export type LlmCall = {
   provider: LlmProvider;

diff --git a/src/daemon/flow-context.ts b/src/daemon/flow-context.ts
@@ -179,6 +179,7 @@ export function createDaemonUrlFlowContext(args: DaemonUrlFlowContextArgs): UrlF
     firecrawlConfigured,
     googleConfigured,
     anthropicConfigured,
+    vertexConfig,
     cliAvailability,
     envForAuto,
     apifyToken,
@@ -268,6 +269,7 @@ export function createDaemonUrlFlowContext(args: DaemonUrlFlowContextArgs): UrlF
     zai: { apiKey: zaiApiKey, baseUrl: zaiBaseUrl },
     nvidia: { apiKey: nvidiaApiKey, baseUrl: nvidiaBaseUrl },
     providerBaseUrls,
+    vertexConfig: vertexConfig ?? null,
   });
 
   const outputLanguage = resolveOutputLanguageSetting({

diff --git a/src/llm/generate-text.ts b/src/llm/generate-text.ts
@@ -11,9 +11,11 @@ import {
   normalizeAnthropicModelAccessError,
 } from "./providers/anthropic.js";
 import { completeGoogleDocument, completeGoogleText } from "./providers/google.js";
+import { completeVertexText, completeVertexDocument, type VertexConfig } from "./providers/vertex.js";
 import {
   resolveAnthropicModel,
   resolveGoogleModel,
+  resolveVertexModel,
   resolveOpenAiModel,
   resolveXaiModel,
   resolveNvidiaModel,
@@ -164,6 +166,7 @@ export async function generateTextWithModelId({
   anthropicBaseUrlOverride,
   googleBaseUrlOverride,
   xaiBaseUrlOverride,
+  vertexConfig,
   forceChatCompletions,
   retries = 0,
   onRetry,
@@ -180,13 +183,14 @@ export async function generateTextWithModelId({
   anthropicBaseUrlOverride?: string | null;
   googleBaseUrlOverride?: string | null;
   xaiBaseUrlOverride?: string | null;
+  vertexConfig?: VertexConfig | null;
   forceChatCompletions?: boolean;
   retries?: number;
   onRetry?: (notice: RetryNotice) => void;
 }): Promise<{
   text: string;
   canonicalModelId: string;
-  provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia";
+  provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia" | "vertex";
   usage: LlmTokenUsage | null;
 }> {
   const parsed = parseGatewayStyleModelId(modelId);
@@ -281,6 +285,30 @@ export async function generateTextWithModelId({
       };
     }
 
+    if (parsed.provider === "vertex") {
+      if (!vertexConfig)
+        throw new Error(
+          "Missing Vertex AI configuration. Set GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION, " +
+            "and VERTEX_AI_SERVICE_ACCOUNT_KEY (or GOOGLE_APPLICATION_CREDENTIALS).",
+        );
+      const result = await completeVertexDocument({
+        modelId: parsed.model,
+        vertexConfig,
+        promptText: prompt.userText,
+        document: documentAttachment,
+        maxOutputTokens,
+        temperature: effectiveTemperature,
+        timeoutMs,
+        fetchImpl,
+      });
+      return {
+        text: result.text,
+        canonicalModelId: parsed.canonical,
+        provider: parsed.provider,
+        usage: result.usage,
+      };
+    }
+
     throw createUnsupportedFunctionalityError(
       `document attachments are not supported for ${parsed.provider}/... models`,
     );
@@ -375,6 +403,28 @@ export async function generateTextWithModelId({
         };
       }
 
+      if (parsed.provider === "vertex") {
+        if (!vertexConfig)
+          throw new Error(
+            "Missing Vertex AI configuration. Set GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION, " +
+              "and VERTEX_AI_SERVICE_ACCOUNT_KEY (or GOOGLE_APPLICATION_CREDENTIALS).",
+          );
+        const result = await completeVertexText({
+          modelId: parsed.model,
+          vertexConfig,
+          context,
+          temperature: effectiveTemperature,
+          maxOutputTokens,
+          signal: controller.signal,
+        });
+        return {
+          text: result.text,
+          canonicalModelId: parsed.canonical,
+          provider: parsed.provider,
+          usage: result.usage,
+        };
+      }
+
       if (parsed.provider === "anthropic") {
         const apiKey = apiKeys.anthropicApiKey;
         if (!apiKey) throw new Error("Missing ANTHROPIC_API_KEY for anthropic/... model");
@@ -479,6 +529,7 @@ export async function streamTextWithModelId({
   anthropicBaseUrlOverride,
   googleBaseUrlOverride,
   xaiBaseUrlOverride,
+  vertexConfig,
   forceChatCompletions,
 }: {
   modelId: string;
@@ -493,11 +544,12 @@ export async function streamTextWithModelId({
   anthropicBaseUrlOverride?: string | null;
   googleBaseUrlOverride?: string | null;
   xaiBaseUrlOverride?: string | null;
+  vertexConfig?: VertexConfig | null;
   forceChatCompletions?: boolean;
 }): Promise<{
   textStream: AsyncIterable<string>;
   canonicalModelId: string;
-  provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia";
+  provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia" | "vertex";
   usage: Promise<LlmTokenUsage | null>;
   lastError: () => unknown;
 }> {
@@ -515,6 +567,7 @@ export async function streamTextWithModelId({
     anthropicBaseUrlOverride,
     googleBaseUrlOverride,
     xaiBaseUrlOverride,
+    vertexConfig,
     forceChatCompletions,
   });
 }
@@ -532,6 +585,7 @@ export async function streamTextWithContext({
   anthropicBaseUrlOverride,
   googleBaseUrlOverride,
   xaiBaseUrlOverride,
+  vertexConfig,
   forceChatCompletions,
 }: {
   modelId: string;
@@ -546,11 +600,12 @@ export async function streamTextWithContext({
   anthropicBaseUrlOverride?: string | null;
   googleBaseUrlOverride?: string | null;
   xaiBaseUrlOverride?: string | null;
+  vertexConfig?: VertexConfig | null;
   forceChatCompletions?: boolean;
 }): Promise<{
   textStream: AsyncIterable<string>;
   canonicalModelId: string;
-  provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia";
+  provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia" | "vertex";
   usage: Promise<LlmTokenUsage | null>;
   lastError: () => unknown;
 }> {
@@ -701,6 +756,44 @@ export async function streamTextWithContext({
       };
     }
 
+    if (parsed.provider === "vertex") {
+      if (!vertexConfig)
+        throw new Error(
+          "Missing Vertex AI configuration. Set GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_LOCATION, " +
+            "and VERTEX_AI_SERVICE_ACCOUNT_KEY (or GOOGLE_APPLICATION_CREDENTIALS).",
+        );
+      const model = resolveVertexModel({
+        modelId: parsed.model,
+        context,
+      });
+      const stream = streamSimple(model, context, {
+        ...(typeof effectiveTemperature === "number" ? { temperature: effectiveTemperature } : {}),
+        ...(typeof maxOutputTokens === "number" ? { maxTokens: maxOutputTokens } : {}),
+        project: vertexConfig.project,
+        location: vertexConfig.location,
+        signal: controller.signal,
+      } as Record<string, unknown>);
+
+      const textStream: AsyncIterable<string> = {
+        async *[Symbol.asyncIterator]() {
+          for await (const event of stream) {
+            if (event.type === "text_delta") yield event.delta;
+            if (event.type === "error") {
+              lastError = event.error;
+              break;
+            }
+          }
+        },
+      };
+      return {
+        textStream: wrapTextStream(textStream),
+        canonicalModelId: parsed.canonical,
+        provider: parsed.provider,
+        usage: streamUsageWithTimeout({ result: stream.result(), timeoutMs }),
+        lastError: () => lastError,
+      };
+    }
+
     if (parsed.provider === "anthropic") {
       const apiKey = apiKeys.anthropicApiKey;
       if (!apiKey) throw new Error("Missing ANTHROPIC_API_KEY for anthropic/... model");

diff --git a/src/llm/html-to-markdown.ts b/src/llm/html-to-markdown.ts
@@ -77,7 +77,7 @@ export function createHtmlToMarkdownConverter({
   }) => void;
   onUsage?: (usage: {
     model: string;
-    provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia";
+    provider: "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia" | "vertex";
     usage: LlmTokenUsage | null;
   }) => void;
 }): ConvertHtmlToMarkdown {

diff --git a/src/llm/model-id.ts b/src/llm/model-id.ts
@@ -1,4 +1,4 @@
-export type LlmProvider = "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia";
+export type LlmProvider = "xai" | "openai" | "google" | "anthropic" | "zai" | "nvidia" | "vertex";
 
 export type ParsedModelId = {
   provider: LlmProvider;
@@ -12,7 +12,7 @@ export type ParsedModelId = {
   canonical: string;
 };
 
-const PROVIDERS: LlmProvider[] = ["xai", "openai", "google", "anthropic", "zai", "nvidia"];
+const PROVIDERS: LlmProvider[] = ["xai", "openai", "google", "anthropic", "zai", "nvidia", "vertex"];
 
 /**
  * Anthropic short model aliases that are NOT valid API model identifiers.
@@ -63,7 +63,7 @@ export function normalizeGatewayStyleModelId(raw: string): string {
   const model = normalized.slice(slash + 1);
   if (!PROVIDERS.includes(provider as LlmProvider)) {
     throw new Error(
-      `Unsupported model provider "${provider}". Use xai/..., openai/..., google/..., anthropic/..., zai/..., or nvidia/...`,
+      `Unsupported model provider "${provider}". Use xai/..., openai/..., google/..., anthropic/..., zai/..., nvidia/..., or vertex/...`,
     );
   }
   if (model.trim().length === 0) {

diff --git a/src/llm/providers/models.ts b/src/llm/providers/models.ts
@@ -152,6 +152,30 @@ export function resolveGoogleModel({
   );
 }
 
+export function resolveVertexModel({
+  modelId,
+  context,
+}: {
+  modelId: string;
+  context: Context;
+}): Model<Api> {
+  const allowImages = wantsImages(context);
+  // Vertex AI uses the same model ids as google (e.g. gemini-3-flash-preview)
+  // but dispatches via the google-vertex API which uses ADC auth.
+  const base = tryGetModel("google", modelId);
+  return {
+    ...(base ??
+      createSyntheticModel({
+        provider: "google",
+        modelId,
+        api: "google-vertex",
+        baseUrl: "https://us-central1-aiplatform.googleapis.com",
+        allowImages,
+      })),
+    api: "google-vertex" as Api,
+  };
+}
+
 export function resolveAnthropicModel({
   modelId,
   context,