Euer Werkzeug für die Nettgeflüster-Sendungsvorbereitung. Vogel der Woche, Wort-Tracker und offene Themen — alles an einem Ort.
- Automatischer Import aller Episoden via RSS-Feed
- Lokale Offline-Transkription — keine Cloud, keine Kosten
- Transkript-Viewer mit Volltextsuche
- Wer redet wie viel? Redeanteil pro Sprecher in Prozent
- Trend über alle Episoden auf einen Blick
- Sprecher-Segmente manuell korrigierbar
- Offene Themen aus Episoden automatisch erkennen (mit OpenAI)
- Status verwalten: Offen → Erledigt
- Nach Episode gruppiert oder als Liste
- Eigene Wort-Kategorien anlegen (z. B. „Peniswitze", „Hunde")
- Zählt alle Treffer über alle Episoden
- Visualisierung als Balkendiagramm
- Zufälliger Vogel aus der NABU-Datenbank
- Zeigt alle Infos zum Vorlesen direkt in der Sendung
- Verlauf: welcher Vogel kam in welcher Episode
Aktuelle Version: Releases
- macOS 12.0 (Monterey) oder neuer
- ca. 50 MB Speicherplatz (+ Whisper-Modell nach Wahl)
- Lade die aktuelle
.pkg-Datei von GitHub Releases herunter - Öffne die
.pkg-Datei und folge dem Installationsassistenten - Starte die App — macOS fragt beim ersten Start nach Erlaubnis: Systemeinstellungen → Datenschutz & Sicherheit → „Trotzdem öffnen"
- Öffne Einstellungen und stelle sicher, dass ein Whisper-Modell heruntergeladen ist
- Wechsle zu Episoden und klicke auf Synchronisieren
- Wähle eine Episode und klicke auf Transkribieren
- Wechsle zu Vogel-Randomizer
- Klicke auf Neuen Vogel ziehen
- Decke den Vogel auf und lies die NABU-Infos direkt in der Sendung vor
- Markiere ihn danach als Verwendet
- Stelle in Einstellungen → OpenAI deinen API-Schlüssel ein
- Wechsle zu Themen — Binky analysiert automatisch alle transkribierten Episoden
- Erkannte Themen erscheinen unter Offen; erledige oder stelle sie zurück
- Gehe zu Einstellungen → Wort-Tracker
- Lege Kategorien mit Varianten an (z. B. Kategorie „Hunde" mit Varianten „Hund", „Wau", „Bello")
- Die Gesamtanzahl aller Treffer siehst du unter Statistiken
- Einheitliche Pipeline: Transkription und Diarisierung starten jetzt in einem Schritt und laufen parallel (Whisper auf GPU, sherpa-rs auf CPU gleichzeitig)
- Fortschrittsbalken in der Seitenleiste zeigt den aktuellen Schritt und eine Zeitschätzung ("Transkription... noch ~22 Min.") basierend auf den letzten 10 Durchläufen
- Pipeline überspringt Whisper bei Neustart nach Unterbrechung — bereits abgeschlossene Transkriptionen werden nicht wiederholt
- Download-Timeout: hängende Verbindungen werden nach 60 Sekunden Inaktivität automatisch abgebrochen
- Diarisierer verwendet jetzt den linken Kanal (CH0) statt des gemischten Signals — besserer Sprecher-Kontrast bei Zwei-Mikrofon-Aufnahmen
- Diarisierungskonfiguration: min_duration_on/off von 0,3 s auf 0,1 s gesenkt für feinere Segment-Erkennung
- Sprechzeit in der Analytik wird aus rohen Diarisierungsfenstern berechnet (konsistenter mit AssemblyAI-Semantik)
- Suchergebnisse werden nach Episodennummer sortiert (neueste Episode zuerst)
- Sprecher-Erkennung läuft automatisch nach abgeschlossener Pipeline, sodass neue Episoden sofort korrekte Sprecher-Zuordnung haben
- Unterbrochene Pipeline-Episoden zeigen wieder den „Verarbeiten"-Button
- FTS-Einträge werden vor der Neuindizierung bereinigt, um ROWID-Kollisionen zu verhindern
- „Weitere Episoden" Abschnitt in der Themenansicht zeigt verwandte Folgen
- Suchergebnisse sind jetzt nach Episodennummer sortiert (neueste zuerst)
- Suchergebnisse zeigten Duplikate bei erneut diarisierten Episoden
- „Weitere Episoden" blieb leer aufgrund eines SQLite FTS5-Fehlers (bm25() in JOIN)
- Such-Tab — Volltextsuche über alle Episoden-Transkripte via SQLite FTS5; Ergebnisse zeigen Episodentitel, Sprecher und einen passenden Textausschnitt
- Deep-Link-Navigation — ein Klick auf ein Suchergebnis öffnet die Episode und springt direkt zur passenden Stelle im Transkript
- Speaker identification now uses a 4-wave detection strategy: intro pattern, first-person anchors ("Ich bin Philipp"), direct address ("Hey Nadine"), and positional fallback — correctly assigns speakers even when the name appears late in the episode
- Speaker detection is now idempotent: re-running "Sprecher erkennen" always produces the same result instead of flipping speakers on every run
- Added "Wie immer gegenüber" and "wunderschöne, einzigartige" as recognised intro patterns for episodes that don't use the standard intro
- Intro detection now scans the next 3 segments after the intro phrase, fixing episodes where Whisper splits the intro and the host name into separate segments
- Fixed diarization queue race condition where episodes could get stuck after a batch completed
- Reverted embedding model to wespeaker (NeMo TitaNet Large was CPU-only single-threaded: 6+ hours per episode)
- Diarisierungsmodell-Manager in den Einstellungen — Modelle herunterladen und löschen direkt in der App
- Episoden mit Status „Nicht analysiert" können jetzt in der Analyse-Ansicht angeklickt und neu diarisiert werden
- Sprecher-Erkennungsmodell gewechselt zu NeMo TitaNet Large für bessere Sprecher-Trennung
- Sprecher-Erkennung nutzt jetzt das Intro-Muster („Neue Woche, neue Folge…") statt Namens-Zählung — zuverlässiger bei Hosts, die sich gegenseitig erwähnen
- Transkript-Anzeige zeigt Sprecher-Wechsel jetzt in chronologischer Reihenfolge (Whisper-Segmente als Anzeigeeinheit)
- Doppelte Sätze im Transkript: Whisper-Segmente wurden mehreren Diarisierungs-Fenstern gleichzeitig zugewiesen
- Große Sprecher-Blöcke statt feiner Wechsel: Scoring bevorzugt jetzt Whisper-Abdeckung als primäres Kriterium
- Sprecher-Korrekturen wurden bei erneutem Öffnen der Analyse-Seite zurückgesetzt
- Fortschritts-Banner blieb nach abgeschlossener Diarisierung stehen
- Transkript zeigte veraltete Sprecher-Zuordnung nach „Sprecher erkennen" ohne Seiten-Wechsel
- Analytik: Schaltfläche „Sprecher erkennen" erkennt automatisch per Transkripttext, ob Sprecher 0 und Sprecher 1 vertauscht sind, und korrigiert alle betroffenen Episoden auf einmal
- Transkripte zeigen jetzt, wer was gesagt hat: Jeder Absatz hat ein farbiges Label mit dem Namen des Sprechers (Nadine oder Philipp)
- Aufeinanderfolgende Sätze desselben Sprechers werden automatisch zu einem Block zusammengefasst — kein Wechsel mitten im Gedanken
- Suche im Transkript funktioniert auch in der neuen Sprecher-Ansicht mit Navigation zwischen Treffern
- Themen-Seite war unter bestimmten Umständen nicht erreichbar
- Vogel-Datenbank: Fehler in Migration behoben, der Vogelnamen nicht korrekt zuordnen konnte
- Release-Seite zeigt jetzt strukturierte Versionshinweise mit Download-Tabelle und Installationsanleitung
- (none)
- Release-Pipeline stabilisiert — Builds laufen jetzt zuverlässig durch
- Nur noch
.pkg-Installer verfügbar — einfachere Installation ohne manuelles Drag & Drop - Auto-Update-Signierung korrigiert — Updates werden jetzt korrekt verifiziert und eingespielt
- Erster Release
- Episoden-Import via RSS, lokale Transkription mit Whisper
- Sprecher-Analyse mit automatischer Diarisierung
- Themen-Backlog mit OpenAI-Analyse
- Wort-Tracker mit Balkendiagramm
- Vogel-Randomizer mit NABU-Datenbank und Verlauf
- Auto-Update via GitHub Releases
Privates Projekt — Nettgeflüster Podcast.
Für Philipp & Nadine.