Skip to content

Commit d24e438

Browse files
authored
Enhance README with installation and usage details
Added detailed installation instructions, user interface overview, video player controls, OCR module usage, tips for better OCR accuracy, export options, and keyboard shortcuts in both English and Spanish.
1 parent 4bd935e commit d24e438

1 file changed

Lines changed: 178 additions & 1 deletion

File tree

README.md

Lines changed: 178 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,2 +1,179 @@
11
# ESFV-Extract_Subtitles_From_Video
2-
ESFV is a desktop application designed to extract text from videos using OCR (Optical Character Recognition). It allows you to play videos, pause on specific frames, extract subtitles or any on-screen text, edit them, and export them in .TXT or .SRT (standard subtitle) formats.
2+
ESFV is a desktop application designed to extract text from videos using OCR (Optical Character Recognition).
3+
It allows you to play videos, pause on specific frames, extract subtitles or any on-screen text,
4+
edit them, and export them in .TXT or .SRT (standard subtitle) formats.
5+
6+
The application supports video formats MP4, MKV, AVI, and MOV.
7+
It works with light/dark themes and supports Spanish and English interfaces.
8+
9+
-INSTALLATION AND EXECUTION-
10+
11+
Download the executable file "ESFV.exe" from the link provided by the developer.
12+
No installation required: simply run the “.exe” file by double-clicking it.
13+
The window will open centered on the screen (minimum 1200x700 pixels).
14+
If you use antivirus software, make sure it allows execution (false positives are common for .exe files).
15+
Note: On the first run, EasyOCR will download language models (Spanish/English).
16+
The executable is standalone and includes all necessary dependencies.
17+
18+
-USER INTERFACE-
19+
20+
The interface is divided into two main panels:
21+
Left Panel: Video Player.
22+
Video area (black background with rounded corners).
23+
Bottom controls: progress bar, navigation buttons, volume, and fullscreen.
24+
Right Panel: OCR and Editing Module.
25+
Theme and language selectors. Themes: Dark or Light. Languages: Spanish or English.
26+
Recognition and cancel buttons.
27+
Progress bar for OCR/export.
28+
List of extracted text blocks (editable).
29+
Export buttons.
30+
31+
-VIDEO PLAYER CONTROLS-
32+
33+
📁 Open Video: Select a video file (MP4, MKV, AVI, MOV).
34+
▶️ / ⏸️ Play/Pause: Starts or stops playback.
35+
⏪ Rewind: Jumps back 2 seconds (once per click).
36+
⏩ Fast Forward: Speeds up to 5x while pressed.
37+
🔊 Volume: Toggle mute (M). Slider adjusts level (0–100%).
38+
⛶ Fullscreen: Toggles fullscreen mode.
39+
Progress Bar and Time
40+
Drag to seek position.
41+
Label shows current / total time (HH:MM:SS).
42+
OCR Module: Text Extraction
43+
Open a video.
44+
Play and pause (Space) on the desired frame.
45+
Click "🔍 Extract Text".
46+
The app captures the current frame and processes it with OCR.
47+
Result: If text is detected, a “Text Block” is created in the right panel list. A success message appears.
48+
If no text is detected: Error message (“No text detected in the image”).
49+
Cancel: “❌ Cancel Extraction” (confirmation dialog).
50+
Block Editing:
51+
Each block shows:
52+
Number: Block #1, #2, etc.
53+
Start: Capture time (HH:MM:SS, editable).
54+
End: Initially empty; use “⏹️ Set End” to record the current position.
55+
Validation: Format HH:MM:SS.
56+
Delete: Removes the selected block.
57+
Automatic scroll to the new block.
58+
59+
-TIPS-
60+
61+
Pause on clear frames with visible text to improve OCR accuracy, and manually edit if needed.
62+
The start time is set automatically,
63+
but the end time must be set manually — let the video play forward and click “Set End”.
64+
65+
-EXPORT TEXT-
66+
67+
Buttons are enabled when at least one block exists.
68+
69+
SRT
70+
Verify Start - End time formats.
71+
Errors: Dialog listing issues.
72+
73+
TXT
74+
📄 Export TXT: Saves blocks as “[HH:MM:SS] Text here”.
75+
Dialog: Choose output path (*.txt).
76+
77+
-KEYBOARD SHORTCUTS-
78+
79+
Space: Play/Pause.
80+
Left Arrow: Rewind 2s.
81+
Right Arrow: Fast forward 5x (hold).
82+
Up/Down Arrows: +10% / -10% volume.
83+
M: Mute/Unmute.
84+
F: Fullscreen.
85+
F: Exit fullscreen.
86+
87+
------------------------------------------------------------------------------------------
88+
------------------------------------------------------------------------------------------
89+
90+
ESFV es una aplicación de escritorio diseñada para extraer texto de videos
91+
utilizando OCR (Reconocimiento Óptico de Caracteres).
92+
Permite reproducir videos, pausar en frames específicos, extraer subtítulos o cualquier texto en el video,
93+
editarlos y exportarlos en formatos .TXT o .SRT (subtítulos estándar).
94+
95+
La aplicación soporta videos en formatos MP4, MKV, AVI y MOV.
96+
Funciona en temas claro/oscuro, interfaz en español/inglés.
97+
98+
-INSTALACIÓN Y EJECUCIÓN-
99+
100+
1. Descarga el archivo ejecutable "ESFV.exe" desde el enlace proporcionado por el desarrollador.
101+
2. No requiere instalación: simplemente ejecuta el archivo ".exe" haciendo doble clic.
102+
3. La ventana se abrirá centrada en pantalla (mínimo 1200x700 píxeles).
103+
4. Si usas antivirus, asegúrate de que permita la ejecución (falsos positivos comunes en .exe).
104+
105+
Nota: En la primera ejecución, EasyOCR descargará modelos de idioma (español/inglés).
106+
El ejecutable es standalone, incluye todas las dependencias necesarias.
107+
108+
-INTERFAZ DE USUARIO-
109+
110+
La interfaz se divide en dos paneles principales:
111+
112+
- Panel Izquierdo: Reproductor de video.
113+
- Área de video (fondo negro con bordes redondeados).
114+
- Controles inferiores: Barra de progreso, botones de navegación, volumen y pantalla completa.
115+
- Panel Derecho: Módulo OCR y edición.
116+
- Selectores de tema e idioma. Temas: Oscuro o Claro. Idiomas: Español o Inglés.
117+
- Botón de reconocimiento y cancelación.
118+
- Barra de progreso para OCR/exportación.
119+
- Lista de bloques de texto extraídos (editable).
120+
- Botones de exportación.
121+
122+
-CONTROLES DEL REPRODUCTOR DE VIDEO-
123+
124+
- 📁 Abrir Video: Selecciona un archivo de video (MP4, MKV, AVI, MOV).
125+
- ▶️ / ⏸️ Reproducir/Pausar: Inicia o detiene la reproducción.
126+
- ⏪ Retroceder: Salta 2 segundos hacia atrás (una vez por clic).
127+
- ⏩ Avance Rápido: Acelera a 5x mientras se mantiene presionado.
128+
- 🔊 Volumen: Alterna silencio (M). Deslizador ajusta nivel (0-100%).
129+
- ⛶ Pantalla Completa: Alterna modo fullscreen.
130+
131+
Barra de Progreso y Tiempo
132+
- Desliza para buscar posición.
133+
- Etiqueta muestra tiempo actual / total (HH:MM:SS).
134+
135+
Módulo OCR: Extracción de Texto
136+
- Abre un video.
137+
- Reproduce y pausa (Espacio) en el frame deseado.
138+
- Haz clic en "🔍 Extraer Texto".
139+
- La app captura el frame actual lo procesa con OCR.
140+
- Resultado: Si se detecta texto, se crea un "Bloque de Texto" en la lista derecha. Muestra mensaje de éxito.
141+
- Si no hay texto: Mensaje de error ("No se detectó texto en la imagen").
142+
- Cancelar: "❌ Cancelar Extracción" (confirma con diálogo).
143+
144+
Edición de Bloques:
145+
- Cada bloque muestra:
146+
- Número: Bloque #1, #2, etc.
147+
- Inicio: Tiempo de captura (HH:MM:SS, editable).
148+
- Fin: Vacío inicialmente; usa "⏹️ Establecer Fin" para usar posición actual.
149+
- Validación: Formato HH:MM:SS.
150+
- Eliminar: Elimina el bloque seleccionado.
151+
- Scroll automático al nuevo bloque.
152+
153+
-CONSEJOS-
154+
1. Pausa en frames con textos claros para mejorar la precisión OCR y edita manualmente si hay errores.
155+
2. El punto de inicio se configura automáticamente,
156+
pero el final se establece manualmente, deja avanzar el video y haz clic en "establecer fin".
157+
158+
159+
-EXPORTAR TEXTO-
160+
Los botones se habilitan con al menos un bloque.
161+
162+
SRT
163+
- Verifica formatos de tiempo de Inicio - Fin.
164+
- Errores: Diálogo con lista.
165+
166+
TXT
167+
- 📄 Exportar TXT: Guarda bloques como "[HH:MM:SS] Texto aquí".
168+
169+
Diálogo: Selecciona ruta (*.txt).
170+
171+
-ATAJOS DE TECLADO-
172+
173+
- Espacio: Reproducir/Pausar.
174+
- Flecha Izquierda: Retroceder 2s.
175+
- Flecha Derecha: Avance rápido 5x (mantén presionada).
176+
- Flecha Arriba/Abajo: +10% / -10% volumen.
177+
- M: Silenciar/Activar sonido.
178+
- F: Pantalla completa.
179+
- F: Salir de fullscreen.

0 commit comments

Comments
 (0)