Skip to content

Latest commit

 

History

History
104 lines (54 loc) · 1.55 KB

File metadata and controls

104 lines (54 loc) · 1.55 KB
timezone UTC+8

Jeff

GitHub ID: Easycoder-lin

Telegram: @Jefflin_EC

Self-introduction

a highly motivated blockchain enthusiast

Notes

2025-12-30

1. Google Search Grounding

以前:

  • 我要自己接 SerpAPI / Bing API

  • 再自己做摘要、過濾、citation

現在:

  • Gemini 3 原生支援 Google Search Tool

  • Agent 可以直接:

    • 查即時資料

    • 理解搜尋結果

    • 用在 reasoning 裡


🖥️ 2. Computer Use(Agent 操作 UI)

這點我覺得是 Agent vs Chatbot 的分水嶺

Agent 可以:

  • 看畫面

  • 點擊按鈕

  • 填表單

  • 在 UI 上完成任務


🎥 3. Live API(語音 / 影像即時串流)

這代表:

  • Agent 不只做 request-response

  • 而是 長時間存在、即時反應

我腦中直接聯想到:

  • 語音助理

  • 即時交易 agent

  • 即時監控 agent


🔎 4. Native Observability(超重要但容易被忽略)

這一點我特別記下來。

ADK 內建:

  • 每次 Gemini 呼叫

  • 用了哪個 tool

  • reasoning 流程(部分可視)

👉 這解決了我一直很在意的問題:

Agent 出錯時,我到底要 debug 什麼?

2025-12-28

看了 introduction of agent