From 71b70421fc55f927c828c92cd34829fb317ff7b1 Mon Sep 17 00:00:00 2001
From: SonyLeo <746591437@qq.com>
Date: Tue, 17 Mar 2026 06:22:14 -0700
Subject: [PATCH 1/6] feat(voice-button): add autoReplace support for
 continuous speech replacement

---
 docs/src/components/sender.md                 | 19 ++++++--
 .../src/sender-actions/voice-button/index.vue | 47 +++++++++++++++----
 .../voice-button/speech.types.ts              |  2 +-
 3 files changed, 56 insertions(+), 12 deletions(-)
diff --git a/docs/src/components/sender.md b/docs/src/components/sender.md
index e78fb9d9c..c72ae693f 100644
--- a/docs/src/components/sender.md
+++ b/docs/src/components/sender.md
@@ -155,10 +155,23 @@ TrSender.Suggestion.configure({ items: suggestions, filterFn: customFilter })
 
 #### 基础语音识别
 
-使用浏览器内置的语音识别功能，支持混合输入和连续识别两种模式。
+使用浏览器内置的语音识别功能，支持混合输入和连续识别两种模式。可通过 `speechConfig.lang` 显式指定识别语言。
 
 <demo vue="../../demos/sender/voice-input.vue" title="基础语音输入" description="使用浏览器内置语音识别，支持混合输入和连续识别。" />
 
+:::tip lang 语言说明
+`lang` 用于指定语音识别语言，建议显式传入，并与页面的 `html lang` 保持一致，避免页面语言和浏览器环境语言不一致时出现识别偏差。
+
+常见取值示例：
+
+| 值 | 说明 |
+| --- | --- |
+| `en` | 英语 |
+| `zh` | 中文 |
+| `zh-CN` | 简体中文 |
+| `en-US` | 美式英语 |
+:::
+
 #### 自定义语音服务
 
 支持集成第三方语音识别服务（如阿里云、百度、Azure 等）。
@@ -597,7 +610,7 @@ type TooltipPlacement =
 // SpeechConfig 语音配置
 interface SpeechConfig {
   customHandler?: SpeechHandler // 自定义语音处理器
-  lang?: string // 识别语言，默认浏览器语言
+  lang?: string // 识别语言，建议显式配置并与 html lang 保持一致；未传入时由浏览器环境决定
   continuous?: boolean // 是否持续识别
   interimResults?: boolean // 是否返回中间结果
   autoReplace?: boolean // 是否自动替换内容
@@ -789,4 +802,4 @@ Sender 组件提供了丰富的 CSS 变量用于自定义样式。
 |-------|----------|
 | startSpeech | 使用 `VoiceButton.start()` |
 | stopSpeech | 使用 `VoiceButton.stop()` |
-| activateTemplateFirstField | 自动处理，无需调用 |
\ No newline at end of file
+| activateTemplateFirstField | 自动处理，无需调用 |
diff --git a/packages/components/src/sender-actions/voice-button/index.vue b/packages/components/src/sender-actions/voice-button/index.vue
index 700bb5200..1cd7d5f84 100644
--- a/packages/components/src/sender-actions/voice-button/index.vue
+++ b/packages/components/src/sender-actions/voice-button/index.vue
@@ -1,5 +1,5 @@
 <script setup lang="ts">
-import { computed } from 'vue'
+import { computed, ref } from 'vue'
 import { useSenderContext } from '../../sender/context'
 import { useSpeechHandler } from './useSpeechHandler'
 import ActionButton from '../action-button/index.vue'
@@ -16,24 +16,53 @@ const emit = defineEmits<VoiceButtonEmits>()
 // 从 Context 获取最小依赖：只需要 editor 和 disabled
 const { editor, disabled: contextDisabled } = useSenderContext()
 const isDisabled = computed(() => props.disabled || contextDisabled.value)
+const speechRange = ref<{ from: number; to: number } | null>(null)
+
+const resetSpeechRange = () => {
+  speechRange.value = null
+}
+
+const insertTranscript = (transcript: string) => {
+  if (!props.autoInsert || !editor.value || !transcript) return
+
+  const editorInstance = editor.value
+  const autoReplace = props.speechConfig?.autoReplace ?? false
+
+  if (!autoReplace) {
+    editorInstance.commands.insertContent(transcript + ' ')
+    editorInstance.commands.focus('end')
+    return
+  }
+
+  // 在单次录音会话期间，持续替换当前的语音插入范围
+  const range = speechRange.value ?? {
+    from: editorInstance.state.selection.from,
+    to: editorInstance.state.selection.to,
+  }
+  const tr = editorInstance.state.tr.insertText(transcript, range.from, range.to)
+  editorInstance.view.dispatch(tr)
+  speechRange.value = {
+    from: range.from,
+    to: range.from + transcript.length,
+  }
+  editorInstance.commands.focus('end')
+}
 
 // 语音配置 - 使用普通对象而不是 computed，避免每次都创建新对象
 const speechOptions = {
   ...props.speechConfig,
   onStart: () => {
+    resetSpeechRange()
     emit('speech-start')
   },
   onInterim: (transcript: string) => {
+    if (props.speechConfig?.autoReplace) {
+      insertTranscript(transcript)
+    }
     emit('speech-interim', transcript)
   },
   onFinal: (transcript: string) => {
-    // 自动插入到编辑器(可配置)
-    if (props.autoInsert && editor.value) {
-      // 插入内容
-      editor.value.commands.insertContent(transcript + ' ')
-      // 确保光标在内容末尾
-      editor.value.commands.focus('end')
-    }
+    insertTranscript(transcript)
     emit('speech-final', transcript)
   },
   onEnd: (transcript?: string) => {
@@ -41,9 +70,11 @@ const speechOptions = {
     if (editor.value) {
       editor.value.commands.focus('end')
     }
+    resetSpeechRange()
     emit('speech-end', transcript)
   },
   onError: (error: Error) => {
+    resetSpeechRange()
     emit('speech-error', error)
   },
 }
diff --git a/packages/components/src/sender-actions/voice-button/speech.types.ts b/packages/components/src/sender-actions/voice-button/speech.types.ts
index f745f1e66..7c51d70a5 100644
--- a/packages/components/src/sender-actions/voice-button/speech.types.ts
+++ b/packages/components/src/sender-actions/voice-button/speech.types.ts
@@ -27,7 +27,7 @@ export interface SpeechConfig {
   lang?: string // 识别语言，默认浏览器语言
   continuous?: boolean // 是否持续识别
   interimResults?: boolean // 是否返回中间结果
-  autoReplace?: boolean // 是否自动替换当前输入内容
+  autoReplace?: boolean // 是否在本次录音期间自动替换语音插入内容
   onVoiceButtonClick?: (isRecording: boolean, preventDefault: () => void) => void | Promise<void> // 录音按钮点击拦截器
 }
 

From 39ca9cbfeb29c5090956df67c6cc197f3a239c6c Mon Sep 17 00:00:00 2001
From: SonyLeo <746591437@qq.com>
Date: Tue, 17 Mar 2026 21:05:49 -0700
Subject: [PATCH 2/6] docs(sender): update voice button documentation and type
 definitions

---
 docs/src/components/sender.md                     | 15 +++++++--------
 .../sender-actions/voice-button/speech.types.ts   |  3 +--
 2 files changed, 8 insertions(+), 10 deletions(-)

diff --git a/docs/src/components/sender.md b/docs/src/components/sender.md
index c72ae693f..a7bcfc7f7 100644
--- a/docs/src/components/sender.md
+++ b/docs/src/components/sender.md
@@ -1,4 +1,4 @@
----
+﻿---
 outline: [1, 3]
 ---
 
@@ -442,7 +442,7 @@ onSelect: (item) => {
 | tooltipPlacement | Tooltip 位置                 | `TooltipPlacement`    | `'top'`     |
 | speechConfig     | 语音配置                     | `SpeechConfig`        | -           |
 | autoInsert       | 是否自动插入识别结果到编辑器 | `boolean`             | `true`      |
-| onButtonClick    | 按钮点击拦截器               | `Function`            | -           |
+| onButtonClick    | 按钮点击拦截器               | `(isRecording: boolean, preventDefault: () => void) => void \| Promise<void>` | - |
 
 ## Slots
 
@@ -610,11 +610,10 @@ type TooltipPlacement =
 // SpeechConfig 语音配置
 interface SpeechConfig {
   customHandler?: SpeechHandler // 自定义语音处理器
-  lang?: string // 识别语言，建议显式配置并与 html lang 保持一致；未传入时由浏览器环境决定
-  continuous?: boolean // 是否持续识别
-  interimResults?: boolean // 是否返回中间结果
-  autoReplace?: boolean // 是否自动替换内容
-  onVoiceButtonClick?: (isRecording, preventDefault) => void // 按钮点击拦截器
+  lang?: string // 内置 Web Speech 的识别语言；未传入时使用 navigator.language
+  continuous?: boolean // 内置 Web Speech 是否持续识别
+  interimResults?: boolean // 内置 Web Speech 是否返回中间结果
+  autoReplace?: boolean // 是否在本次录音期间用最新识别结果替换当前语音插入内容
 }
 
 // 模板项（联合类型）
@@ -802,4 +801,4 @@ Sender 组件提供了丰富的 CSS 变量用于自定义样式。
 |-------|----------|
 | startSpeech | 使用 `VoiceButton.start()` |
 | stopSpeech | 使用 `VoiceButton.stop()` |
-| activateTemplateFirstField | 自动处理，无需调用 |
+| activateTemplateFirstField | 自动处理，无需调用 |
\ No newline at end of file
diff --git a/packages/components/src/sender-actions/voice-button/speech.types.ts b/packages/components/src/sender-actions/voice-button/speech.types.ts
index 7c51d70a5..a182d1aae 100644
--- a/packages/components/src/sender-actions/voice-button/speech.types.ts
+++ b/packages/components/src/sender-actions/voice-button/speech.types.ts
@@ -1,4 +1,4 @@
-/**
+﻿/**
  * 语音识别相关类型定义
  */
 // 语音回调函数集合
@@ -28,7 +28,6 @@ export interface SpeechConfig {
   continuous?: boolean // 是否持续识别
   interimResults?: boolean // 是否返回中间结果
   autoReplace?: boolean // 是否在本次录音期间自动替换语音插入内容
-  onVoiceButtonClick?: (isRecording: boolean, preventDefault: () => void) => void | Promise<void> // 录音按钮点击拦截器
 }
 
 // 语音识别状态

From 855ae9eac6733ddc6f6c10bfc0264c404776877a Mon Sep 17 00:00:00 2001
From: SonyLeo <746591437@qq.com>
Date: Wed, 18 Mar 2026 02:24:51 -0700
Subject: [PATCH 3/6] feat(voice-button): refactor speech input modes from
 mixed/continuous to append/replace

---
 docs/demos/sender/voice-input.vue             | 26 ++++++++++++-------
 .../src/sender-actions/voice-button/index.vue | 26 +++++++++++++------
 2 files changed, 35 insertions(+), 17 deletions(-)

diff --git a/docs/demos/sender/voice-input.vue b/docs/demos/sender/voice-input.vue
index 39bfff2bc..d3e617d50 100644
--- a/docs/demos/sender/voice-input.vue
+++ b/docs/demos/sender/voice-input.vue
@@ -2,7 +2,7 @@
 import { ref } from 'vue'
 import { TrSender, VoiceButton } from '@opentiny/tiny-robot'
 
-const voiceMode = ref<'mixed' | 'continuous'>('mixed')
+const voiceMode = ref<'append' | 'replace'>('append')
 </script>
 
 <template>
@@ -10,28 +10,36 @@ const voiceMode = ref<'mixed' | 'continuous'>('mixed')
     <div style="display: flex; align-items: center; gap: 12px">
       <span style="font-weight: 500">模式：</span>
       <label style="display: flex; align-items: center; gap: 4px; cursor: pointer">
-        <input type="radio" value="mixed" v-model="voiceMode" style="cursor: pointer" />
-        <span>混合输入</span>
+        <input type="radio" value="append" v-model="voiceMode" style="cursor: pointer" />
+        <span>追加模式</span>
       </label>
       <label style="display: flex; align-items: center; gap: 4px; cursor: pointer">
-        <input type="radio" value="continuous" v-model="voiceMode" style="cursor: pointer" />
-        <span>连续识别</span>
+        <input type="radio" value="replace" v-model="voiceMode" style="cursor: pointer" />
+        <span>替换模式</span>
       </label>
     </div>
     <div style="padding: 8px 12px; background: #f5f7fa; border-radius: 4px; font-size: 13px; color: #666">
-      {{ voiceMode === 'mixed' ? '语音识别结果追加到输入框，可继续编辑' : '持续识别语音并自动替换内容' }}
+      {{
+        voiceMode === 'append'
+          ? '追加模式：每次语音识别结果会追加到输入框末尾，适合混合输入'
+          : '替换模式：每次语音识别会替换输入框全部内容，适合纯语音输入'
+      }}
     </div>
     <tr-sender
       :key="voiceMode"
       mode="multiple"
-      :placeholder="voiceMode === 'mixed' ? '点击麦克风说话，识别结果会追加到此处...' : '点击麦克风开始连续识别...'"
+      :placeholder="
+        voiceMode === 'append'
+          ? '可以打字或点击麦克风说话，语音内容会追加...'
+          : '点击麦克风说话，每次识别会替换全部内容...'
+      "
     >
       <template #footer-right>
         <VoiceButton
           :speech-config="
-            voiceMode === 'mixed'
+            voiceMode === 'append'
               ? { autoReplace: false, interimResults: true }
-              : { autoReplace: true, continuous: true }
+              : { autoReplace: true, interimResults: true }
           "
         />
       </template>
diff --git a/packages/components/src/sender-actions/voice-button/index.vue b/packages/components/src/sender-actions/voice-button/index.vue
index 1cd7d5f84..e2a7a6683 100644
--- a/packages/components/src/sender-actions/voice-button/index.vue
+++ b/packages/components/src/sender-actions/voice-button/index.vue
@@ -34,16 +34,24 @@ const insertTranscript = (transcript: string) => {
     return
   }
 
-  // 在单次录音会话期间，持续替换当前的语音插入范围
-  const range = speechRange.value ?? {
-    from: editorInstance.state.selection.from,
-    to: editorInstance.state.selection.to,
+  // autoReplace 模式：替换整个输入框内容
+  if (speechRange.value === null) {
+    // 首次插入，记录起始位置为 0
+    speechRange.value = {
+      from: 0,
+      to: 0,
+    }
   }
-  const tr = editorInstance.state.tr.insertText(transcript, range.from, range.to)
+
+  // 替换从起始位置到当前内容末尾的所有文本
+  const docSize = editorInstance.state.doc.content.size
+  const tr = editorInstance.state.tr.insertText(transcript, speechRange.value.from, docSize)
   editorInstance.view.dispatch(tr)
+
+  // 更新范围，保持起始位置不变，更新结束位置
   speechRange.value = {
-    from: range.from,
-    to: range.from + transcript.length,
+    from: speechRange.value.from,
+    to: speechRange.value.from + transcript.length,
   }
   editorInstance.commands.focus('end')
 }
@@ -62,7 +70,9 @@ const speechOptions = {
     emit('speech-interim', transcript)
   },
   onFinal: (transcript: string) => {
-    insertTranscript(transcript)
+    if (!props.speechConfig?.autoReplace) {
+      insertTranscript(transcript)
+    }
     emit('speech-final', transcript)
   },
   onEnd: (transcript?: string) => {

From 986c63cb3d320070e98fb66e9252d78b5908ee28 Mon Sep 17 00:00:00 2001
From: SonyLeo <746591437@qq.com>
Date: Wed, 15 Apr 2026 21:02:00 -0700
Subject: [PATCH 4/6] feat(voice-button): improve speech handling with
 autoReplace and continuous recognition support

---
 docs/demos/sender/voice-input.vue             |   6 +-
 docs/src/components/sender.md                 |   6 +-
 .../src/sender-actions/voice-button/index.vue | 112 +++++++++++++-----
 .../voice-button/speech.types.ts              |   4 +-
 .../voice-button/webSpeechHandler.ts          |  68 +++++++++--
 5 files changed, 146 insertions(+), 50 deletions(-)

diff --git a/docs/demos/sender/voice-input.vue b/docs/demos/sender/voice-input.vue
index d3e617d50..b820a3885 100644
--- a/docs/demos/sender/voice-input.vue
+++ b/docs/demos/sender/voice-input.vue
@@ -22,7 +22,7 @@ const voiceMode = ref<'append' | 'replace'>('append')
       {{
         voiceMode === 'append'
           ? '追加模式：每次语音识别结果会追加到输入框末尾，适合混合输入'
-          : '替换模式：每次语音识别会替换输入框全部内容，适合纯语音输入'
+          : '替换模式：在同一次录音会话内持续识别，并用最新结果更新本次语音输入内容'
       }}
     </div>
     <tr-sender
@@ -31,7 +31,7 @@ const voiceMode = ref<'append' | 'replace'>('append')
       :placeholder="
         voiceMode === 'append'
           ? '可以打字或点击麦克风说话，语音内容会追加...'
-          : '点击麦克风说话，每次识别会替换全部内容...'
+          : '点击麦克风连续说话，本次语音内容会持续更新...'
       "
     >
       <template #footer-right>
@@ -39,7 +39,7 @@ const voiceMode = ref<'append' | 'replace'>('append')
           :speech-config="
             voiceMode === 'append'
               ? { autoReplace: false, interimResults: true }
-              : { autoReplace: true, interimResults: true }
+              : { autoReplace: true, continuous: true, interimResults: true }
           "
         />
       </template>
diff --git a/docs/src/components/sender.md b/docs/src/components/sender.md
index a7bcfc7f7..f1a1f3b3d 100644
--- a/docs/src/components/sender.md
+++ b/docs/src/components/sender.md
@@ -155,9 +155,9 @@ TrSender.Suggestion.configure({ items: suggestions, filterFn: customFilter })
 
 #### 基础语音识别
 
-使用浏览器内置的语音识别功能，支持混合输入和连续识别两种模式。可通过 `speechConfig.lang` 显式指定识别语言。
+使用浏览器内置的语音识别功能，支持追加写入和替换写入两种体验。可通过 `speechConfig.lang` 显式指定识别语言，并结合 `speechConfig.continuous` 控制是否持续识别。
 
-<demo vue="../../demos/sender/voice-input.vue" title="基础语音输入" description="使用浏览器内置语音识别，支持混合输入和连续识别。" />
+<demo vue="../../demos/sender/voice-input.vue" title="基础语音输入" description="使用浏览器内置语音识别，展示追加写入和连续替换两种体验。" />
 
 :::tip lang 语言说明
 `lang` 用于指定语音识别语言，建议显式传入，并与页面的 `html lang` 保持一致，避免页面语言和浏览器环境语言不一致时出现识别偏差。
@@ -613,7 +613,7 @@ interface SpeechConfig {
   lang?: string // 内置 Web Speech 的识别语言；未传入时使用 navigator.language
   continuous?: boolean // 内置 Web Speech 是否持续识别
   interimResults?: boolean // 内置 Web Speech 是否返回中间结果
-  autoReplace?: boolean // 是否在本次录音期间用最新识别结果替换当前语音插入内容
+  autoReplace?: boolean // 是否在本次录音期间仅用最新识别结果替换语音写入的内容区间
 }
 
 // 模板项（联合类型）
diff --git a/packages/components/src/sender-actions/voice-button/index.vue b/packages/components/src/sender-actions/voice-button/index.vue
index e2a7a6683..211d5b957 100644
--- a/packages/components/src/sender-actions/voice-button/index.vue
+++ b/packages/components/src/sender-actions/voice-button/index.vue
@@ -16,75 +16,123 @@ const emit = defineEmits<VoiceButtonEmits>()
 // 从 Context 获取最小依赖：只需要 editor 和 disabled
 const { editor, disabled: contextDisabled } = useSenderContext()
 const isDisabled = computed(() => props.disabled || contextDisabled.value)
+const isAutoReplace = computed(() => props.speechConfig?.autoReplace ?? false)
 const speechRange = ref<{ from: number; to: number } | null>(null)
+const committedTranscript = ref('')
+const speechPrefix = ref('')
 
-const resetSpeechRange = () => {
+const resetSpeechSession = () => {
   speechRange.value = null
+  committedTranscript.value = ''
+  speechPrefix.value = ''
 }
 
-const insertTranscript = (transcript: string) => {
-  if (!props.autoInsert || !editor.value || !transcript) return
+const ensureSpeechRange = () => {
+  if (speechRange.value || !editor.value) {
+    return speechRange.value
+  }
+
+  const { from, to } = editor.value.state.selection
+  const previousText = from === to ? (editor.value.state.doc.resolve(from).nodeBefore?.textContent ?? '') : ''
+
+  speechPrefix.value = previousText && /\S$/.test(previousText) ? ' ' : ''
+  speechRange.value = {
+    from,
+    to,
+  }
+
+  return speechRange.value
+}
 
-  const editorInstance = editor.value
-  const autoReplace = props.speechConfig?.autoReplace ?? false
+const focusEditor = () => {
+  if (!editor.value) return
 
-  if (!autoReplace) {
-    editorInstance.commands.insertContent(transcript + ' ')
-    editorInstance.commands.focus('end')
+  if (isAutoReplace.value && speechRange.value) {
+    editor.value.commands.focus(speechRange.value.to)
     return
   }
 
-  // autoReplace 模式：替换整个输入框内容
-  if (speechRange.value === null) {
-    // 首次插入，记录起始位置为 0
-    speechRange.value = {
-      from: 0,
-      to: 0,
-    }
+  editor.value.commands.focus('end')
+}
+
+const appendTranscript = (transcript: string) => {
+  if (!props.autoInsert || !editor.value || !transcript) return
+
+  editor.value.commands.insertContent(transcript + ' ')
+  focusEditor()
+}
+
+const replaceTranscript = (transcript: string) => {
+  if (!props.autoInsert || !editor.value || !transcript) return
+
+  const range = ensureSpeechRange()
+  const nextTranscript = `${speechPrefix.value}${transcript}`
+
+  if (!range) {
+    return
   }
 
-  // 替换从起始位置到当前内容末尾的所有文本
-  const docSize = editorInstance.state.doc.content.size
-  const tr = editorInstance.state.tr.insertText(transcript, speechRange.value.from, docSize)
-  editorInstance.view.dispatch(tr)
+  const tr = editor.value.state.tr.insertText(nextTranscript, range.from, range.to)
+  editor.value.view.dispatch(tr)
 
-  // 更新范围，保持起始位置不变，更新结束位置
   speechRange.value = {
-    from: speechRange.value.from,
-    to: speechRange.value.from + transcript.length,
+    from: range.from,
+    to: range.from + nextTranscript.length,
+  }
+
+  focusEditor()
+}
+
+const mergeCommittedTranscript = (transcript: string) => {
+  if (!transcript) {
+    return committedTranscript.value
+  }
+
+  if (!committedTranscript.value || transcript.startsWith(committedTranscript.value)) {
+    committedTranscript.value = transcript
+    return committedTranscript.value
   }
-  editorInstance.commands.focus('end')
+
+  if (committedTranscript.value !== transcript && !committedTranscript.value.endsWith(transcript)) {
+    committedTranscript.value += transcript
+  }
+
+  return committedTranscript.value
 }
 
 // 语音配置 - 使用普通对象而不是 computed，避免每次都创建新对象
 const speechOptions = {
   ...props.speechConfig,
   onStart: () => {
-    resetSpeechRange()
+    resetSpeechSession()
+    if (isAutoReplace.value) {
+      ensureSpeechRange()
+    }
     emit('speech-start')
   },
   onInterim: (transcript: string) => {
-    if (props.speechConfig?.autoReplace) {
-      insertTranscript(transcript)
+    if (isAutoReplace.value) {
+      replaceTranscript(transcript)
     }
     emit('speech-interim', transcript)
   },
   onFinal: (transcript: string) => {
-    if (!props.speechConfig?.autoReplace) {
-      insertTranscript(transcript)
+    if (isAutoReplace.value) {
+      replaceTranscript(mergeCommittedTranscript(transcript))
+    } else {
+      appendTranscript(transcript)
     }
     emit('speech-final', transcript)
   },
   onEnd: (transcript?: string) => {
-    // 结束后聚焦编辑器，确保光标可见
     if (editor.value) {
-      editor.value.commands.focus('end')
+      focusEditor()
     }
-    resetSpeechRange()
+    resetSpeechSession()
     emit('speech-end', transcript)
   },
   onError: (error: Error) => {
-    resetSpeechRange()
+    resetSpeechSession()
     emit('speech-error', error)
   },
 }
diff --git a/packages/components/src/sender-actions/voice-button/speech.types.ts b/packages/components/src/sender-actions/voice-button/speech.types.ts
index a182d1aae..17b2de995 100644
--- a/packages/components/src/sender-actions/voice-button/speech.types.ts
+++ b/packages/components/src/sender-actions/voice-button/speech.types.ts
@@ -1,4 +1,4 @@
-﻿/**
+/**
  * 语音识别相关类型定义
  */
 // 语音回调函数集合
@@ -27,7 +27,7 @@ export interface SpeechConfig {
   lang?: string // 识别语言，默认浏览器语言
   continuous?: boolean // 是否持续识别
   interimResults?: boolean // 是否返回中间结果
-  autoReplace?: boolean // 是否在本次录音期间自动替换语音插入内容
+  autoReplace?: boolean // 是否在本次录音期间仅替换语音写入的内容区间
 }
 
 // 语音识别状态
diff --git a/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts b/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts
index 39a61638a..9075133fb 100644
--- a/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts
+++ b/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts
@@ -1,5 +1,35 @@
 import type { SpeechCallbacks, SpeechHandler, SpeechConfig } from './speech.types'
 
+interface ParsedSpeechResult {
+  finalTranscript: string
+  interimTranscript: string
+}
+
+export function parseSpeechRecognitionResult(event: SpeechRecognitionEvent): ParsedSpeechResult {
+  let finalTranscript = ''
+  let interimTranscript = ''
+
+  for (let index = event.resultIndex; index < event.results.length; index++) {
+    const result = event.results[index]
+    const transcript = result[0]?.transcript ?? ''
+
+    if (!transcript) {
+      continue
+    }
+
+    if (result.isFinal) {
+      finalTranscript += transcript
+    } else {
+      interimTranscript += transcript
+    }
+  }
+
+  return {
+    finalTranscript,
+    interimTranscript,
+  }
+}
+
 /**
  * 内置 Web Speech API 处理器
  * 基于浏览器原生 Web Speech API 实现的语音识别
@@ -7,6 +37,11 @@ import type { SpeechCallbacks, SpeechHandler, SpeechConfig } from './speech.type
 export class WebSpeechHandler implements SpeechHandler {
   private recognition?: SpeechRecognition
   private options: SpeechConfig
+  private finalizedTranscript: string = ''
+
+  private resetSessionTranscript(): void {
+    this.finalizedTranscript = ''
+  }
 
   /**
    * 初始化语音识别实例
@@ -45,25 +80,33 @@ export class WebSpeechHandler implements SpeechHandler {
    */
   private setupEventHandlers(callbacks: SpeechCallbacks): void {
     if (!this.recognition || !callbacks) return
+
     this.recognition.onstart = () => {
+      this.resetSessionTranscript()
       callbacks.onStart()
     }
+
     this.recognition.onend = () => {
-      callbacks.onEnd()
+      callbacks.onEnd(this.finalizedTranscript || undefined)
+      this.resetSessionTranscript()
     }
+
     this.recognition.onresult = (event: SpeechRecognitionEvent) => {
-      const transcript = Array.from(event.results)
-        .map((result) => result[0].transcript)
-        .join('')
-      const current = event.results[event.resultIndex]
-      if (current?.isFinal) {
-        callbacks.onFinal(transcript)
-      } else {
-        callbacks.onInterim(transcript)
+      const { finalTranscript, interimTranscript } = parseSpeechRecognitionResult(event)
+
+      if (finalTranscript) {
+        this.finalizedTranscript += finalTranscript
+        callbacks.onFinal(finalTranscript)
+      }
+
+      if (interimTranscript) {
+        callbacks.onInterim(this.finalizedTranscript + interimTranscript)
       }
     }
+
     this.recognition.onerror = (event: SpeechRecognitionErrorEvent) => {
       callbacks.onError(new Error(event.error))
+      this.resetSessionTranscript()
       this.cleanup()
     }
   }
@@ -88,8 +131,10 @@ export class WebSpeechHandler implements SpeechHandler {
       callbacks.onError(new Error('浏览器不支持语音识别'))
       return
     }
-    // 绑定事件处理器
+
+    this.resetSessionTranscript()
     this.setupEventHandlers(callbacks)
+
     try {
       this.recognition.start()
     } catch (error) {
@@ -102,7 +147,10 @@ export class WebSpeechHandler implements SpeechHandler {
    */
   stop(): void {
     if (!this.recognition) return
+
     this.cleanup()
+    this.resetSessionTranscript()
+
     try {
       this.recognition.stop()
     } catch (error) {

From f0a4ca2f023dda2a97ba846615b7661bd7defe08 Mon Sep 17 00:00:00 2001
From: SonyLeo <746591437@qq.com>
Date: Wed, 15 Apr 2026 23:51:11 -0700
Subject: [PATCH 5/6] docs(sender): update voice input descriptions for clarity
 on speech modes

---
 docs/demos/sender/voice-input.vue             |  4 +-
 docs/src/components/sender.md                 | 11 ++--
 .../src/sender-actions/voice-button/index.vue | 50 ++-----------------
 .../voice-button/speech.types.ts              |  2 +-
 4 files changed, 11 insertions(+), 56 deletions(-)

diff --git a/docs/demos/sender/voice-input.vue b/docs/demos/sender/voice-input.vue
index b820a3885..48e868e0a 100644
--- a/docs/demos/sender/voice-input.vue
+++ b/docs/demos/sender/voice-input.vue
@@ -22,7 +22,7 @@ const voiceMode = ref<'append' | 'replace'>('append')
       {{
         voiceMode === 'append'
           ? '追加模式：每次语音识别结果会追加到输入框末尾，适合混合输入'
-          : '替换模式：在同一次录音会话内持续识别，并用最新结果更新本次语音输入内容'
+          : '替换模式：在录音期间使用最新识别结果直接替换整个输入框内容'
       }}
     </div>
     <tr-sender
@@ -31,7 +31,7 @@ const voiceMode = ref<'append' | 'replace'>('append')
       :placeholder="
         voiceMode === 'append'
           ? '可以打字或点击麦克风说话，语音内容会追加...'
-          : '点击麦克风连续说话，本次语音内容会持续更新...'
+          : '点击麦克风连续说话，输入框内容会被语音结果持续替换...'
       "
     >
       <template #footer-right>
diff --git a/docs/src/components/sender.md b/docs/src/components/sender.md
index f1a1f3b3d..428d93c97 100644
--- a/docs/src/components/sender.md
+++ b/docs/src/components/sender.md
@@ -1,4 +1,4 @@
-﻿---
+---
 outline: [1, 3]
 ---
 
@@ -155,9 +155,9 @@ TrSender.Suggestion.configure({ items: suggestions, filterFn: customFilter })
 
 #### 基础语音识别
 
-使用浏览器内置的语音识别功能，支持追加写入和替换写入两种体验。可通过 `speechConfig.lang` 显式指定识别语言，并结合 `speechConfig.continuous` 控制是否持续识别。
+使用浏览器内置的语音识别功能，支持追加写入和整框替换两种体验。可通过 `speechConfig.lang` 显式指定识别语言，并结合 `speechConfig.continuous` 控制是否持续识别。
 
-<demo vue="../../demos/sender/voice-input.vue" title="基础语音输入" description="使用浏览器内置语音识别，展示追加写入和连续替换两种体验。" />
+<demo vue="../../demos/sender/voice-input.vue" title="基础语音输入" description="使用浏览器内置语音识别，展示追加写入和整框替换两种体验。" />
 
 :::tip lang 语言说明
 `lang` 用于指定语音识别语言，建议显式传入，并与页面的 `html lang` 保持一致，避免页面语言和浏览器环境语言不一致时出现识别偏差。
@@ -170,7 +170,6 @@ TrSender.Suggestion.configure({ items: suggestions, filterFn: customFilter })
 | `zh` | 中文 |
 | `zh-CN` | 简体中文 |
 | `en-US` | 美式英语 |
-:::
 
 #### 自定义语音服务
 
@@ -613,7 +612,7 @@ interface SpeechConfig {
   lang?: string // 内置 Web Speech 的识别语言；未传入时使用 navigator.language
   continuous?: boolean // 内置 Web Speech 是否持续识别
   interimResults?: boolean // 内置 Web Speech 是否返回中间结果
-  autoReplace?: boolean // 是否在本次录音期间仅用最新识别结果替换语音写入的内容区间
+  autoReplace?: boolean // 是否在录音期间用识别结果替换整个输入框内容
 }
 
 // 模板项（联合类型）
@@ -801,4 +800,4 @@ Sender 组件提供了丰富的 CSS 变量用于自定义样式。
 |-------|----------|
 | startSpeech | 使用 `VoiceButton.start()` |
 | stopSpeech | 使用 `VoiceButton.stop()` |
-| activateTemplateFirstField | 自动处理，无需调用 |
\ No newline at end of file
+| activateTemplateFirstField | 自动处理，无需调用 |
diff --git a/packages/components/src/sender-actions/voice-button/index.vue b/packages/components/src/sender-actions/voice-button/index.vue
index 211d5b957..2908aeaa2 100644
--- a/packages/components/src/sender-actions/voice-button/index.vue
+++ b/packages/components/src/sender-actions/voice-button/index.vue
@@ -1,5 +1,5 @@
 <script setup lang="ts">
-import { computed, ref } from 'vue'
+import { computed, shallowRef } from 'vue'
 import { useSenderContext } from '../../sender/context'
 import { useSpeechHandler } from './useSpeechHandler'
 import ActionButton from '../action-button/index.vue'
@@ -17,41 +17,14 @@ const emit = defineEmits<VoiceButtonEmits>()
 const { editor, disabled: contextDisabled } = useSenderContext()
 const isDisabled = computed(() => props.disabled || contextDisabled.value)
 const isAutoReplace = computed(() => props.speechConfig?.autoReplace ?? false)
-const speechRange = ref<{ from: number; to: number } | null>(null)
-const committedTranscript = ref('')
-const speechPrefix = ref('')
+const committedTranscript = shallowRef('')
 
 const resetSpeechSession = () => {
-  speechRange.value = null
   committedTranscript.value = ''
-  speechPrefix.value = ''
-}
-
-const ensureSpeechRange = () => {
-  if (speechRange.value || !editor.value) {
-    return speechRange.value
-  }
-
-  const { from, to } = editor.value.state.selection
-  const previousText = from === to ? (editor.value.state.doc.resolve(from).nodeBefore?.textContent ?? '') : ''
-
-  speechPrefix.value = previousText && /\S$/.test(previousText) ? ' ' : ''
-  speechRange.value = {
-    from,
-    to,
-  }
-
-  return speechRange.value
 }
 
 const focusEditor = () => {
   if (!editor.value) return
-
-  if (isAutoReplace.value && speechRange.value) {
-    editor.value.commands.focus(speechRange.value.to)
-    return
-  }
-
   editor.value.commands.focus('end')
 }
 
@@ -65,21 +38,7 @@ const appendTranscript = (transcript: string) => {
 const replaceTranscript = (transcript: string) => {
   if (!props.autoInsert || !editor.value || !transcript) return
 
-  const range = ensureSpeechRange()
-  const nextTranscript = `${speechPrefix.value}${transcript}`
-
-  if (!range) {
-    return
-  }
-
-  const tr = editor.value.state.tr.insertText(nextTranscript, range.from, range.to)
-  editor.value.view.dispatch(tr)
-
-  speechRange.value = {
-    from: range.from,
-    to: range.from + nextTranscript.length,
-  }
-
+  editor.value.commands.setContent(transcript)
   focusEditor()
 }
 
@@ -105,9 +64,6 @@ const speechOptions = {
   ...props.speechConfig,
   onStart: () => {
     resetSpeechSession()
-    if (isAutoReplace.value) {
-      ensureSpeechRange()
-    }
     emit('speech-start')
   },
   onInterim: (transcript: string) => {
diff --git a/packages/components/src/sender-actions/voice-button/speech.types.ts b/packages/components/src/sender-actions/voice-button/speech.types.ts
index 17b2de995..1b15b4e79 100644
--- a/packages/components/src/sender-actions/voice-button/speech.types.ts
+++ b/packages/components/src/sender-actions/voice-button/speech.types.ts
@@ -27,7 +27,7 @@ export interface SpeechConfig {
   lang?: string // 识别语言，默认浏览器语言
   continuous?: boolean // 是否持续识别
   interimResults?: boolean // 是否返回中间结果
-  autoReplace?: boolean // 是否在本次录音期间仅替换语音写入的内容区间
+  autoReplace?: boolean // 是否在录音期间用识别结果替换整个输入框内容
 }
 
 // 语音识别状态

From dc9998cafd85d2029e95d03a82dbbfc5699038df Mon Sep 17 00:00:00 2001
From: SonyLeo <746591437@qq.com>
Date: Thu, 16 Apr 2026 00:34:21 -0700
Subject: [PATCH 6/6] fix: review suggestion

---
 docs/demos/sender/voice-input.vue             |  10 +-
 docs/src/components/sender.md                 |   8 +-
 .../src/sender-actions/voice-button/index.vue |   8 +-
 .../voice-button/useSpeechHandler.ts          | 132 +++++++++++++-----
 .../voice-button/webSpeechHandler.ts          |   6 +-
 5 files changed, 117 insertions(+), 47 deletions(-)

diff --git a/docs/demos/sender/voice-input.vue b/docs/demos/sender/voice-input.vue
index 48e868e0a..4e17afc99 100644
--- a/docs/demos/sender/voice-input.vue
+++ b/docs/demos/sender/voice-input.vue
@@ -22,24 +22,22 @@ const voiceMode = ref<'append' | 'replace'>('append')
       {{
         voiceMode === 'append'
           ? '追加模式：每次语音识别结果会追加到输入框末尾，适合混合输入'
-          : '替换模式：在录音期间使用最新识别结果直接替换整个输入框内容'
+          : '替换模式：在录音期间使用识别结果持续替换整个输入框内容'
       }}
     </div>
     <tr-sender
       :key="voiceMode"
       mode="multiple"
       :placeholder="
-        voiceMode === 'append'
-          ? '可以打字或点击麦克风说话，语音内容会追加...'
-          : '点击麦克风连续说话，输入框内容会被语音结果持续替换...'
+        voiceMode === 'append' ? '可以打字或点击麦克风说话，语音内容会追加...' : '点击麦克风说话，输入框内容持续替换...'
       "
     >
       <template #footer-right>
         <VoiceButton
           :speech-config="
             voiceMode === 'append'
-              ? { autoReplace: false, interimResults: true }
-              : { autoReplace: true, continuous: true, interimResults: true }
+              ? { autoReplace: false, continuous: true, interimResults: true }
+              : { autoReplace: true, interimResults: true }
           "
         />
       </template>
diff --git a/docs/src/components/sender.md b/docs/src/components/sender.md
index 428d93c97..a3d750b3a 100644
--- a/docs/src/components/sender.md
+++ b/docs/src/components/sender.md
@@ -1,4 +1,4 @@
----
+﻿---
 outline: [1, 3]
 ---
 
@@ -159,6 +159,12 @@ TrSender.Suggestion.configure({ items: suggestions, filterFn: customFilter })
 
 <demo vue="../../demos/sender/voice-input.vue" title="基础语音输入" description="使用浏览器内置语音识别，展示追加写入和整框替换两种体验。" />
 
+:::tip 替换模式说明
+当 `speechConfig.autoReplace` 为 `true` 时，输入框会被当前录音结果整框替换。
+
+如果同时开启 `speechConfig.continuous`，替换进去的是“当前录音会话的累计识别结果”，也就是后续说出的内容会和前面已确认的内容一起更新，而不是仅保留最后一句。
+:::
+
 :::tip lang 语言说明
 `lang` 用于指定语音识别语言，建议显式传入，并与页面的 `html lang` 保持一致，避免页面语言和浏览器环境语言不一致时出现识别偏差。
 
diff --git a/packages/components/src/sender-actions/voice-button/index.vue b/packages/components/src/sender-actions/voice-button/index.vue
index 2908aeaa2..b080eca72 100644
--- a/packages/components/src/sender-actions/voice-button/index.vue
+++ b/packages/components/src/sender-actions/voice-button/index.vue
@@ -5,6 +5,7 @@ import { useSpeechHandler } from './useSpeechHandler'
 import ActionButton from '../action-button/index.vue'
 import { IconVoice, IconRecordingWave } from '@opentiny/tiny-robot-svgs'
 import type { VoiceButtonProps, VoiceButtonEmits } from './index.type'
+import type { SpeechHookOptions } from './speech.types'
 
 const props = withDefaults(defineProps<VoiceButtonProps>(), {
   tooltipPlacement: 'top',
@@ -59,8 +60,7 @@ const mergeCommittedTranscript = (transcript: string) => {
   return committedTranscript.value
 }
 
-// 语音配置 - 使用普通对象而不是 computed，避免每次都创建新对象
-const speechOptions = {
+const getSpeechOptions = (): SpeechHookOptions => ({
   ...props.speechConfig,
   onStart: () => {
     resetSpeechSession()
@@ -91,10 +91,10 @@ const speechOptions = {
     resetSpeechSession()
     emit('speech-error', error)
   },
-}
+})
 
 // 使用语音 Hook
-const { speechState, start, stop } = useSpeechHandler(speechOptions)
+const { speechState, start, stop } = useSpeechHandler(getSpeechOptions)
 
 // 处理点击
 const handleClick = async () => {
diff --git a/packages/components/src/sender-actions/voice-button/useSpeechHandler.ts b/packages/components/src/sender-actions/voice-button/useSpeechHandler.ts
index 6cc28ea88..2c73434e4 100644
--- a/packages/components/src/sender-actions/voice-button/useSpeechHandler.ts
+++ b/packages/components/src/sender-actions/voice-button/useSpeechHandler.ts
@@ -1,4 +1,5 @@
-import { reactive, onUnmounted, ref } from 'vue'
+import { reactive, onUnmounted, shallowRef, toValue, watch } from 'vue'
+import type { MaybeRefOrGetter } from 'vue'
 import type {
   SpeechHookOptions,
   SpeechHandlerResult,
@@ -16,9 +17,10 @@ import { WebSpeechHandler } from './webSpeechHandler'
  * @param options 语音识别配置
  * @returns 语音识别控制器
  */
-export function useSpeechHandler(options: SpeechHookOptions): SpeechHandlerResult {
-  // 使用 ref 存储 options，确保能获取最新值
-  const optionsRef = ref(options)
+export function useSpeechHandler(options: MaybeRefOrGetter<SpeechHookOptions>): SpeechHandlerResult {
+  const handlerRef = shallowRef<SpeechHandler | null>(null)
+  const pendingRestart = shallowRef(false)
+  const suppressEndCallback = shallowRef(false)
 
   // 语音识别状态
   const speechState = reactive<SpeechState>({
@@ -27,86 +29,150 @@ export function useSpeechHandler(options: SpeechHookOptions): SpeechHandlerResul
     error: undefined,
   })
 
-  // 创建回调函数集合 - 使用函数形式，每次调用时获取最新的 options
+  const resolveOptions = () => toValue(options)
+
+  const updateSupportState = () => {
+    const currentOptions = resolveOptions()
+    speechState.isSupported = currentOptions.customHandler
+      ? currentOptions.customHandler.isSupported()
+      : WebSpeechHandler.isSupported()
+  }
+
+  const createHandler = (currentOptions: SpeechHookOptions): SpeechHandler | null => {
+    if (currentOptions.customHandler) {
+      return currentOptions.customHandler
+    }
+
+    if (!WebSpeechHandler.isSupported()) {
+      return null
+    }
+
+    return new WebSpeechHandler(currentOptions)
+  }
+
+  // 创建回调函数集合 - 每次调用时都获取最新的 options
   const callbacks: SpeechCallbacks = {
     onStart: () => {
       speechState.isRecording = true
       speechState.error = undefined
-      optionsRef.value.onStart?.()
+      resolveOptions().onStart?.()
     },
     onInterim: (transcript: string) => {
-      optionsRef.value.onInterim?.(transcript)
+      resolveOptions().onInterim?.(transcript)
     },
     onFinal: (transcript: string) => {
-      optionsRef.value.onFinal?.(transcript)
+      resolveOptions().onFinal?.(transcript)
     },
     onEnd: (transcript?: string) => {
+      const shouldEmitEnd = !suppressEndCallback.value
+      const shouldRestart = pendingRestart.value
+
+      suppressEndCallback.value = false
+      pendingRestart.value = false
+      handlerRef.value = null
+
       if (speechState.isRecording) {
         speechState.isRecording = false
-        optionsRef.value.onEnd?.(transcript)
+      }
+
+      if (shouldEmitEnd) {
+        resolveOptions().onEnd?.(transcript)
+      }
+
+      updateSupportState()
+
+      if (shouldRestart) {
+        start()
       }
     },
     onError: (error: Error) => {
       speechState.error = error
       speechState.isRecording = false
-      optionsRef.value.onError?.(error)
+      pendingRestart.value = false
+      suppressEndCallback.value = false
+      handlerRef.value = null
+      resolveOptions().onError?.(error)
+      updateSupportState()
     },
   }
 
-  // 检查是否支持（对于内置 Handler，提前检查避免无效创建）
-  const isBuiltinSupported = WebSpeechHandler.isSupported()
-  speechState.isSupported = options.customHandler ? options.customHandler.isSupported() : isBuiltinSupported
-
-  // 选择语音处理器：如果提供了 customHandler，直接使用；否则在支持的情况下创建 WebSpeechHandler
-  const handler: SpeechHandler | null =
-    options.customHandler ?? (isBuiltinSupported ? new WebSpeechHandler(options) : null)
+  watch(
+    () => resolveOptions().customHandler,
+    () => {
+      if (!speechState.isRecording) {
+        handlerRef.value = null
+      }
+      updateSupportState()
+    },
+    { immediate: true },
+  )
 
   // 开始录音
   const start = () => {
-    if (!speechState.isSupported || !handler) {
+    const currentOptions = resolveOptions()
+
+    updateSupportState()
+
+    if (!speechState.isSupported) {
       const error = new Error('语音识别不受支持')
       speechState.error = error
-      optionsRef.value.onError?.(error)
+      currentOptions.onError?.(error)
       return
     }
 
-    // 如果正在录音，先停止再重新开始
+    // 如果正在录音，等待当前会话自然结束后再重启
     if (speechState.isRecording) {
-      handler.stop()
-      speechState.isRecording = false
-      // 短暂延迟后重新开始
-      setTimeout(() => {
-        handler.start(callbacks)
-      }, 200)
+      pendingRestart.value = true
+      handlerRef.value?.stop()
       return
     }
 
+    const nextHandler = createHandler(currentOptions)
+
+    if (!nextHandler || !nextHandler.isSupported()) {
+      const error = new Error('语音识别不受支持')
+      speechState.error = error
+      currentOptions.onError?.(error)
+      updateSupportState()
+      return
+    }
+
+    handlerRef.value = nextHandler
+    pendingRestart.value = false
+    suppressEndCallback.value = false
+
     try {
-      handler.start(callbacks)
+      nextHandler.start(callbacks)
     } catch (error) {
       speechState.error = error instanceof Error ? error : new Error('启动失败')
-      optionsRef.value.onError?.(speechState.error)
+      handlerRef.value = null
+      currentOptions.onError?.(speechState.error)
     }
   }
 
   // 停止录音
   const stop = () => {
-    if (!speechState.isRecording || !handler) {
+    if (!speechState.isRecording || !handlerRef.value) {
       return
     }
 
-    handler.stop()
-    callbacks.onEnd()
+    pendingRestart.value = false
+    suppressEndCallback.value = false
+    handlerRef.value.stop()
   }
 
   // 组件卸载时清理资源
   onUnmounted(() => {
     // 如果正在录音，先停止
-    if (speechState.isRecording && handler) {
-      handler.stop()
+    if (speechState.isRecording && handlerRef.value) {
+      pendingRestart.value = false
+      suppressEndCallback.value = true
+      handlerRef.value.stop()
       // 卸载时不触发 onEnd 回调，避免不必要的副作用
       speechState.isRecording = false
     }
+
+    handlerRef.value = null
   })
 
   return {
diff --git a/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts b/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts
index 9075133fb..b24653e61 100644
--- a/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts
+++ b/packages/components/src/sender-actions/voice-button/webSpeechHandler.ts
@@ -88,6 +88,7 @@ export class WebSpeechHandler implements SpeechHandler {
 
     this.recognition.onend = () => {
       callbacks.onEnd(this.finalizedTranscript || undefined)
+      this.cleanup()
       this.resetSessionTranscript()
     }
 
@@ -148,12 +149,11 @@ export class WebSpeechHandler implements SpeechHandler {
   stop(): void {
     if (!this.recognition) return
 
-    this.cleanup()
-    this.resetSessionTranscript()
-
     try {
       this.recognition.stop()
     } catch (error) {
+      this.cleanup()
+      this.resetSessionTranscript()
       console.warn('停止语音识别时发生错误:', error)
     }
   }