• Zum Inhalt springen (Accesskey 1)
  • Zur Suche springen (Accesskey 7)
FWF — Österreichischer Wissenschaftsfonds
  • Zur Übersichtsseite Entdecken

    • Forschungsradar
      • Historisches Forschungsradar 1974–1994
    • Entdeckungen
      • Emmanuelle Charpentier
      • Adrian Constantin
      • Monika Henzinger
      • Ferenc Krausz
      • Wolfgang Lutz
      • Walter Pohl
      • Christa Schleper
      • Elly Tanaka
      • Anton Zeilinger
    • Impact Stories
      • Verena Gassner
      • Wolfgang Lechner
      • Georg Winter
    • scilog-Magazin
    • Austrian Science Awards
      • FWF-Wittgenstein-Preise
      • FWF-ASTRA-Preise
      • FWF-START-Preise
      • Auszeichnungsfeier
    • excellent=austria
      • Clusters of Excellence
      • Emerging Fields
    • Im Fokus
      • 40 Jahre Erwin-Schrödinger-Programm
      • Quantum Austria
      • Spezialforschungsbereiche
    • Dialog und Diskussion
      • think.beyond Summit
      • Am Puls
      • Was die Welt zusammenhält
      • FWF Women’s Circle
      • Science Lectures
    • Wissenstransfer-Events
    • E-Book Library
  • Zur Übersichtsseite Fördern

    • Förderportfolio
      • excellent=austria
        • Clusters of Excellence
        • Emerging Fields
      • Projekte
        • Einzelprojekte
        • Einzelprojekte International
        • Klinische Forschung
        • 1000 Ideen
        • Entwicklung und Erschließung der Künste
        • FWF-Wittgenstein-Preis
      • Karrieren
        • ESPRIT
        • FWF-ASTRA-Preise
        • Erwin Schrödinger
        • doc.funds
        • doc.funds.connect
      • Kooperationen
        • Spezialforschungsgruppen
        • Spezialforschungsbereiche
        • Forschungsgruppen
        • International – Multilaterale Initiativen
        • #ConnectingMinds
      • Kommunikation
        • Top Citizen Science
        • Wissenschaftskommunikation
        • Buchpublikationen
        • Digitale Publikationen
        • Open-Access-Pauschale
      • Themenförderungen
        • AI Mission Austria
        • Belmont Forum
        • ERA-NET HERA
        • ERA-NET NORFACE
        • ERA-NET QuantERA
        • ERA-NET TRANSCAN
        • Ersatzmethoden für Tierversuche
        • Europäische Partnerschaft Biodiversa+
        • Europäische Partnerschaft BrainHealth
        • Europäische Partnerschaft ERA4Health
        • Europäische Partnerschaft ERDERA
        • Europäische Partnerschaft EUPAHW
        • Europäische Partnerschaft FutureFoodS
        • Europäische Partnerschaft OHAMR
        • Europäische Partnerschaft PerMed
        • Europäische Partnerschaft Water4All
        • Gottfried-und-Vera-Weiss-Preis
        • netidee SCIENCE
        • Projekte der Herzfelder-Stiftung
        • Quantum Austria
        • Rückenwind-Förderbonus
        • WE&ME Award
        • Zero Emissions Award
      • Länderkooperationen
        • Belgien/Flandern
        • Deutschland
        • Frankreich
        • Italien/Südtirol
        • Japan
        • Luxemburg
        • Polen
        • Schweiz
        • Slowenien
        • Taiwan
        • Tirol–Südtirol–Trentino
        • Tschechien
        • Ungarn
    • Schritt für Schritt
      • Förderung finden
      • Antrag einreichen
      • Internationales Peer-Review
      • Förderentscheidung
      • Projekt durchführen
      • Projekt beenden
      • Weitere Informationen
        • Integrität und Ethik
        • Inklusion
        • Antragstellung aus dem Ausland
        • Personalkosten
        • PROFI
        • Projektendberichte
        • Projektendberichtsumfrage
    • FAQ
      • Projektphase PROFI
      • Projektphase Ad personam
      • Auslaufende Programme
        • Elise Richter und Elise Richter PEEK
        • FWF-START-Preise
  • Zur Übersichtsseite Über uns

    • Leitbild
    • FWF-Film
    • Werte
    • Zahlen und Daten
    • Jahresbericht
    • Aufgaben und Aktivitäten
      • Forschungsförderung
        • Matching-Funds-Förderungen
      • Internationale Kooperationen
      • Studien und Publikationen
      • Chancengleichheit und Diversität
        • Ziele und Prinzipien
        • Maßnahmen
        • Bias-Sensibilisierung in der Begutachtung
        • Begriffe und Definitionen
        • Karriere in der Spitzenforschung
      • Open Science
        • Open-Access-Policy
          • Open-Access-Policy für begutachtete Publikationen
          • Open-Access-Policy für begutachtete Buchpublikationen
          • Open-Access-Policy für Forschungsdaten
        • Forschungsdatenmanagement
        • Citizen Science
        • Open-Science-Infrastrukturen
        • Open-Science-Förderung
      • Evaluierungen und Qualitätssicherung
      • Wissenschaftliche Integrität
      • Wissenschaftskommunikation
      • Philanthropie
      • Nachhaltigkeit
    • Geschichte
    • Gesetzliche Grundlagen
    • Organisation
      • Gremien
        • Präsidium
        • Aufsichtsrat
        • Delegiertenversammlung
        • Kuratorium
        • Jurys
      • Geschäftsstelle
    • Arbeiten im FWF
  • Zur Übersichtsseite Aktuelles

    • News
    • Presse
      • Logos
    • Eventkalender
      • Veranstaltung eintragen
      • FWF-Infoveranstaltungen
    • Jobbörse
      • Job eintragen
    • Newsletter
  • Entdecken, 
    worauf es
    ankommt.

    FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

    SOCIAL MEDIA

    • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
    • , externe URL, öffnet sich in einem neuen Fenster
    • Facebook, externe URL, öffnet sich in einem neuen Fenster
    • Instagram, externe URL, öffnet sich in einem neuen Fenster
    • YouTube, externe URL, öffnet sich in einem neuen Fenster

    SCILOG

    • Scilog — Das Wissenschaftsmagazin des Österreichischen Wissenschaftsfonds (FWF)
  • elane-Login, externe URL, öffnet sich in einem neuen Fenster
  • Scilog externe URL, öffnet sich in einem neuen Fenster
  • en Switch to English

  

Sprachübertragung unter Berücksichtigung der Phase

Phase-Aware Signal Processing for Speech Transmission

Pejman Mowlaee Beikzadehmahaleh (ORCID: )
  • Grant-DOI 10.55776/P28070
  • Förderprogramm Einzelprojekte
  • Status beendet
  • Projektbeginn 01.10.2015
  • Projektende 31.07.2019
  • Bewilligungssumme 338.236 €
  • Projekt-Website

Wissenschaftsdisziplinen

Elektrotechnik, Elektronik, Informationstechnik (75%); Informatik (25%)

Keywords

    Phase-aware signal processing, Speech enhancement, Perceived signal quality, Speech transmission, Signal processing, Phase spectrum estimation

Abstract Endbericht

Alltägliche Anwendungensindvielfach auf zuverlässigeSprachübertragung und Sprachkommunikation angewiesen. Beispiele dafür sind Sprachsteuerung in der Hausautomation, Freisprechanlagen für Mobiltelefonie oder Spracherkennung für Maschinen. In all diesen Anwendungenist eine hohe Robustheit gegenüber räumlich bedingtem Nachhall und Hintergrundgeräuschen notwendig. Um diese störenden Einflüsse im Sprachsignal zu minimieren, ist eine Aufbereitung des Eingangssignals in Form einer Signalverbesserung notwendig. Während sich aktuelle Technologien der Sprachübertragung hauptsächlich auf die Filterung der Amplituden im Frequenzbereich konzentrieren, versuchen wir die bisherigen Konzepte und die damit verbundenen Möglichkeiten zu erweitern, indem wir zusätzlich die Phasenanteile bei der Signalverarbeitung mit berücksichtigen. Dieser Forschungsbeitrag verfolgt dreierlei Ziele: i) Entwicklung von Methoden zur Abschätzung der Phaseninformation des ursprünglichen ungestörten Quellensignals für eine qualitativ bessere Rekonstruktion der Sprachinformation; ii) Entwicklung von Algorithmen zur Sprachverbesserung in der komplexen Domäne mittels geschätztem Phasenspektrum um die Probleme herkömmlicher Methoden zu überwinden; iii) Verwendung von phasen-basierten Konzepten anhand zweier Anwendungen: 1) Einkanalige Quellentrennung und 2) künstliche Bandbreitenerweiterung; iv) neue Gütemaße zur Abschätzung der Leistungsfähigkeit von Sprachverbesserungsmethoden, die mit der menschlichen Wahrnehmung der Sprach Qualität stark korrelieren. Dadurch können aufwändige Hörtests vermieden werden.

Alltägliche Sprachanwendungen, wie zum Beispiel Sprachsteuerung in der Hausautomation, Freisprechanlagen für Mobiltelefonie oder Spracherkennung für Maschinen, sind auf zuverlässige Sprachverarbeitung und -übertragung angewiesen. In all diese Anwendungen ist eine hohe Stabilität gegenüber räumlich bedingtem Nachhall und Hintergrundgeräuschen notwendig. Um den störenden und unerwünschten Einfluss von Hintergrundgeräuschen zu minimieren, ist eine Aufbereitung des Eingangssignals notwendig. Während sich moderne Technologien für Sprachübertragung hauptsächlich auf die Filterung der Amplituden eines Signals konzentrieren, versuchen wir über die bisherigen Möglichkeiten hinauszugehen, indem wir zusätzlich die Phasenanteile berücksichtigen. Dieser Beitrag gliedert sich in drei Teile: i) Entwicklung von Methoden zur Abschätzung der Phaseninformation des ursprünglichen sauberen Quellensignals für eine qualitativ bessere Rekonstruktion der Sprache. ii) Zweitens, die zuvor beschriebene Methode mit der Vorabinformation des Sprechers zu erweitern. Dieses Wissenüber die Identität des Anwenders kann für eine weitere Optimierung des Sprachverbesserung verwendet werden. iii) Weiters sollen neue Gütemae zur Abschätzung der Leistungsfähigkeit von Sprachverbesserungsmethoden vorgestellt werden, die mit der menschlichen Wahrnehmung der Qualität von Sprache stark korrelieren. Dadurch können aufwändige Hörtests vermieden werden.

Forschungsstätte(n)
  • Technische Universität Graz - 100%
Internationale Projektbeteiligte
  • Tim Fingscheidt, Technische Universität Braunschweig - Deutschland
  • Paavo Alku, Aalto University Helsinki - Finnland
  • Rahim Saeidi, University of Eastern Finland - Finnland
  • Gilles Degottex, Centre Georges Pompidou - Frankreich

Research Output

  • 351 Zitationen
  • 18 Publikationen
  • 1 Software
  • 2 Wissenschaftliche Auszeichnungen
Publikationen
  • 2018
    Titel Single-channel speech enhancement using inter-component phase relations
    DOI 10.1016/j.specom.2018.03.009
    Typ Journal Article
    Autor Barysenka S
    Journal Speech Communication
    Seiten 144-160
  • 2016
    Titel Fixed Points of Belief Propagation -- An Analysis via Polynomial Homotopy Continuation
    DOI 10.48550/arxiv.1605.06451
    Typ Preprint
    Autor Knoll C
  • 2016
    Titel On the Importance of Harmonic Phase Modification for Improved Speech Signal Reconstruction
    DOI 10.1109/icassp.2016.7471742
    Typ Conference Proceeding Abstract
    Autor Maly A
    Seiten 584-588
  • 2016
    Titel Phase-Processing for Voice Activity Detection: A Statistical Approach
    DOI 10.1109/eusipco.2016.7760439
    Typ Conference Proceeding Abstract
    Autor Stahl J
    Seiten 1202-1206
  • 2014
    Titel Phase Estimation in Single Channel Speech Enhancement Using Phase Decomposition
    DOI 10.1109/lsp.2014.2365040
    Typ Journal Article
    Autor Kulmer J
    Journal IEEE Signal Processing Letters
    Seiten 598-602
  • 2019
    Titel Exploiting temporal correlation in pitch-adaptive speech enhancement
    DOI 10.1016/j.specom.2019.05.001
    Typ Journal Article
    Autor Stahl J
    Journal Speech Communication
    Seiten 1-13
  • 2019
    Titel Binaural Codebook-Based Speech Enhancement With Atomic Speech Presence Probability
    DOI 10.1109/taslp.2019.2937174
    Typ Journal Article
    Autor Wood S
    Journal IEEE/ACM Transactions on Audio, Speech, and Language Processing
    Seiten 2150-2161
  • 2017
    Titel New Results in Modulation-Domain Single-Channel Speech Enhancement
    DOI 10.1109/taslp.2017.2747082
    Typ Journal Article
    Autor Mowlaee P
    Journal IEEE/ACM Transactions on Audio, Speech, and Language Processing
    Seiten 2125-2137
  • 2017
    Titel Fixed Points of Belief Propagation—An Analysis via Polynomial Homotopy Continuation
    DOI 10.1109/tpami.2017.2749575
    Typ Journal Article
    Autor Knoll C
    Journal IEEE Transactions on Pattern Analysis and Machine Intelligence
    Seiten 2124-2136
    Link Publikation
  • 2017
    Titel Impact of phase estimation on single-channel speech separation based on time-frequency masking
    DOI 10.1121/1.4986647
    Typ Journal Article
    Autor Mayer F
    Journal The Journal of the Acoustical Society of America
    Seiten 4668-4679
    Link Publikation
  • 2017
    Titel Iterative joint MAP single-channel speech enhancement given non-uniform phase prior
    DOI 10.1016/j.specom.2016.11.008
    Typ Journal Article
    Autor Mowlaee P
    Journal Speech Communication
    Seiten 85-96
  • 2020
    Titel Single-channel speech enhancement with correlated spectral components: Limits-potential
    DOI 10.1016/j.specom.2020.05.002
    Typ Journal Article
    Autor Mowlaee P
    Journal Speech Communication
    Seiten 58-69
  • 2019
    Titel Maximum a posteriori Speech Enhancement Based on Double Spectrum
    DOI 10.21437/interspeech.2019-1197
    Typ Conference Proceeding Abstract
    Autor Mowlaee P
    Seiten 2738-2742
  • 2015
    Titel Phase Estimation in Single-Channel Speech Enhancement: Limits-Potential
    DOI 10.1109/taslp.2015.2430820
    Typ Journal Article
    Autor Mowlaee P
    Journal IEEE/ACM Transactions on Audio, Speech, and Language Processing
    Seiten 1283-1294
  • 2015
    Titel Harmonic Phase Estimation in Single-Channel Speech Enhancement Using Phase Decomposition and SNR Information
    DOI 10.1109/taslp.2015.2439038
    Typ Journal Article
    Autor Mowlaee P
    Journal IEEE/ACM Transactions on Audio, Speech, and Language Processing
    Seiten 1521-1532
  • 2018
    Titel A Simple and Effective Framework for a Priori SNR Estimation
    DOI 10.1109/icassp.2018.8461787
    Typ Conference Proceeding Abstract
    Autor Stahl J
    Seiten 5644-5648
  • 2018
    Titel A Pitch-Synchronous Simultaneous Detection-Estimation Framework for Speech Enhancement
    DOI 10.1109/taslp.2017.2779405
    Typ Journal Article
    Autor Stahl J
    Journal IEEE/ACM Transactions on Audio, Speech, and Language Processing
    Seiten 436-450
  • 2016
    Titel Advances in phase-aware signal processing in speech communication
    DOI 10.1016/j.specom.2016.04.002
    Typ Journal Article
    Autor Mowlaee P
    Journal Speech Communication
    Seiten 1-29
Software
  • 2016 Link
    Titel PhaseLab Toolbox
    Link Link
Wissenschaftliche Auszeichnungen
  • 2016
    Titel Editor for special issue
    Typ Appointed as the editor/advisor to a journal or book series
    Bekanntheitsgrad Continental/International
  • 2016
    Titel IEEE Senior membership
    Typ Medal
    Bekanntheitsgrad Continental/International

Entdecken, 
worauf es
ankommt.

Newsletter

FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

Kontakt

Österreichischer Wissenschaftsfonds FWF
Georg-Coch-Platz 2
(Eingang Wiesingerstraße 4)
1010 Wien

office(at)fwf.ac.at
+43 1 505 67 40

Allgemeines

  • Jobbörse
  • Arbeiten im FWF
  • Presse
  • Philanthropie
  • scilog
  • Geschäftsstelle
  • Social Media Directory
  • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
  • , externe URL, öffnet sich in einem neuen Fenster
  • Facebook, externe URL, öffnet sich in einem neuen Fenster
  • Instagram, externe URL, öffnet sich in einem neuen Fenster
  • YouTube, externe URL, öffnet sich in einem neuen Fenster
  • Cookies
  • Hinweisgeber:innensystem
  • Barrierefreiheitserklärung
  • Datenschutz
  • Impressum
  • IFG-Formular
  • Social Media Directory
  • © Österreichischer Wissenschaftsfonds FWF
© Österreichischer Wissenschaftsfonds FWF