Prototypische Entwicklung einer offline-basierten Spracherkennung für den sysWORXX CTR-700
- Die vorliegende Masterarbeit untersucht Ansätze einer offline-basierten Spracherkennung. Systeme zur Sprachsteuerung basieren oftmals auf von Cloud-Anbietern bereitgestellten Diensten, welche die aufgenommenen Audiodaten serverseitig auswerten. Im industriellen Anwendungsbereich solcher Systeme besteht jedoch der Wunsch, die Kontrolle über die Verarbeitung der Daten zu behalten. Ziel dieser Arbeit ist es, Möglichkeiten für Anwendungsfälle ohne bestehende Internetverbindung, Umgebungen mit lauten Hintergrundgeräuschen und der Nutzung von fachspezifischen Sprachbefehlen zu evaluieren. Die Implementierung eines Prototyps erfolgt auf dem von der SYS TEC electronic AG entwickelten IoT-Controller sysWORXX CTR-700. Die Umsetzung beschränkt sich auf eine schlüsselwortbasierte Spracherkennung einiger weniger Sprachbefehle. Es werden klassische probabilistische Verfahren der Spracherkennung und Ansätze des Deep Learnings evaluiert. Ein Schwerpunkt der Untersuchung liegt dabei auf Möglichkeiten, den negativen Einfluss von störenden Hintergrundgeräuschen zu verringern. Dazu werden Sprachmodelle entworfen, die neben der Sprachaufnahme zusätzlich die Art des Hintergrundgeräusches als weitere Eingabe verarbeiten.
Author: | Felix Hoffmann |
---|---|
Advisor: | Sven Hellbach, Frank GrimmGND |
Document Type: | Master's Thesis |
Language: | German |
Name: | SYS TEC electronic AG Am Windrad 2, 08468 Heinsdorfergrund |
Year of first Publication: | 2019 |
Publishing Institution: | Westsächsische Hochschule Zwickau |
Tag: | (Deep Learning; Keyword Spotting; Sprachsteuerung; künstliche neuronale Netzwerke) |
Page Number: | 87 Seiten, 36 Abb., 19 Tab., 45 Lit. |
Faculty: | Westsächsische Hochschule Zwickau / Physikalische Technik, Informatik |
Release Date: | 2019/10/30 |