Vergiss "Alexa", "Hey Siri" oder "Okay Google"!
Ein hessischer Open-Source Sprachassistent! Das ist meine Vision als Enthusiast für Sprachtechnologie und Südhesse. Die passende hessische Sprachausgabe gibt es mit Thorsten-Voice bereits.
Jetzt geht es um das so genannte Aktivierungswort ("Wakeword"). Lass uns gemeinsam "Uffwache", "Ei Guude", "Hannebambel", "Blechbiggs" und mehr aufbauen.
Dazu werden möglichst vielseitige Aufnahmen benötigt. Auf diesen wird dann ein KI-Modell trainiert. Die Erkennung dieses Aktivierungswortes funktioniert dann ohne Cloud oder Internetzugang.
Projektlink:
👉 https://uffwache.thorsten-voice.de/
Kontakt für Medien / Interviews / Hintergrundgespräche:
Thorsten Müller | 📧 tm@thorsten-voice.de | 🌐 https://www.thorsten-voice.de/
Herkömmliche Wakewords wie „Hey Siri“ oder „Alexa“ kennen wir alle – aber warum nicht etwas Regionales, Offenes und Freies?
Mit Uffwache sammeln wir kurze Sprachaufnahmen typischer hessischer Gruß- und Weckwörter wie:
- „Ei Guude“
- „Uffgewacht“
- „Blechbiggs"
- "Hannebamel"
- ...
Je mehr Menschen diese kurzen Wörter aufnehmen, desto besser wird das System sich später auch von verschiedenen Menschen ansprechen lassen.
Diese Aufnahmen werden später unter CC0 veröffentlicht, damit Forschung, Bildung und Open-Source-Projekte sie ohne Einschränkungen nutzen können.
- Anzahl geplanter Aufnahmen: TBD
- Zeithorizont für erste Test: TBD
- Wakeword in der Web-App auswählen
- Mikrofonfreigabe erteilen
- Wakeword einsprechen
- Speichern (optional mit groben Angaben zu Alter / Region / Geschlecht)
- Und gleich nochmal von vorne. Je mehr Aufnahmen und Varianz desto besser.
Die Teilnahme ist freiwillig, anonym und dauert nur wenige Sekunden.
Alle Sprachaufnahmen werden öffentlich und unter CC0 bereitgestellt – d. h.:
- keine Namensnennung
- keine Beschränkungen für Nutzung, Weitergabe oder Modifikation
- frei verwendbar für Forschung, Open Source, Bildung und eigene Produkte
Hinweis:
Sprachaufnahmen sind personenbezogene Daten. Durch das Speichern stimmst du der vollständigen, unwiderruflichen Veröffentlichung unter CC0 zu. Bitte nur teilnehmen, wenn das für dich in Ordnung ist.
- Es werden keine Klarnamen erhoben.
- Optionale Angaben (Altersspanne, Region, Geschlecht) sind freiwillig.
- Die Web-App speichert ausschließlich die Audioaufnahme und Metadaten.
Jede Stimme zählt! Auch 2-3 Aufnahmen helfen schon.
Uffwache is an open crowdsourcing project to collect wakewords in the Hessian dialect (Germany).
All recordings will be released under CC0, enabling fully open research, speech models, and offline-capable voice technology.
Web app: https://uffwache.thorsten-voice.de/
Contact: tm@thorsten-voice.de
More English documentation will follow soon.