Übung 1


In dieser Übung geht es um die Fouriersynthese und -analyse.

Aufgabe 1 - 1.1

Sprachsynthese und Erkennung Erste Übung
Erzeugen Sie mit Matlab/Octave ein Sinusgemisch mit den folgenden Eigenschaften (f: Frequenz, A: Amplitude, phi Phasenwinkel):
f1=500Hz A1=1 phi1=0
f2=1000Hz A2=0,5 phi2=-pi/2
f3=2000Hz A3=0,25 phi3=pi
und einer Dauer von 5 s.

Zeichne das Sinusgemisch mit plot im Bereich t=0-20ms. Dabei soll auf der x-Achse die Zeit in ms abgetragen sein. Gibt die Schwingung als Wave-Datei mit wavwriteaus, und zwar mit einer Abtastfrequenz fa von 16kHz und einer Auflösung von 16bit. Dabei skalieren, um Clipping zu vermeiden.
Berechne die Fouriertransformation der Sinusschwingung mit der Funktion fft und stelle das ermittelte Amplitudenspektrum mit plot dar. Auf der x-Achse soll dabei die Frequenz in Hertz abgetragen werden dar und zwar zunächst für den Bereich zwischen 0 und Abtastfrequenz fa.

Was fällt beim Betrachten des Spektrums auf? Variiere dabei die Framelänge zwischen 50ms, 100ms, 500ms, 1 s und 5 s.
Welche Frequenzauflösung delta f erhältst du für die verschiedenen Framelängen?
Zoome nun in den Bereich 0 bis 4 kHz hinein. Was fällt beim Spektrum bei der Variation der Framelänge auf?
Wie kann man sich diesen Unterschied erklären?

Audiofile erzeugen :



Erzeugte Ton:
Der erzeugte Ton

Lösung:


Die Fouriertransformation vom erzeugten Ton bei Framelängen von 5s und 50ms:
bei 5s bei 50ms



Was fällt beim Betrachten des Spektrums auf?

Beim Betrachten des Spektrums fällt auf, dass die Ausschläge dreiecksförmig sind und wenn die Framelänge abnimmt der Ausschlag eine stärkere dreieckige Form annimmt.
Man sieht die 3 Frequenzen aus denen man das Signal erzeugt hat.


Welche Frequenzauflösung delta f erhältst du für die verschiedenen Framelängen?

50ms = 20
100ms = 10
500ms = 2
1s = 1
5s = 0.2



Wie kann man sich diesen Unterschied erklären?

Durch die Ränder der Aufnahme.


Aufgabe 1 - 1.2

Nimm nun in Praat den Vokal ‚a‘ und den Vokal ‚i‘ mit 16kHz mono auf, und zwar für jedes Gruppenmitglied. Achte darauf, dass am Anfang der Datei und am Ende keine Pausen bleiben, d.h, die Datei soll gleich mit dem Sprachsignal beginnen.

Lies die Datei mit wavreadin deinem Matlab-Programm ein. Berechne auch von diesem Signal die Fouriertransformation, diesmal mit Framebreiten von 50ms, 100ms, 500ms, 1 s. Wie unterscheiden sich die Vokale in ihrem Spektrum vom Sinusgemisch und wie unterscheiden sie sich voneinander?

Unsere aufnamen:


von Saba:
I:

A:


von Janod:
I:

A:


von Evan:
I:

A:

Lösung

Die einzelnen Fourier-Analysen der Aufzeichnungen:
Am Anfang von: Saba dann Janod. dann Evan jeweils mit I und dann A

Bei 1 Sekunde:
Bei 1 Sekunde

Bei 500 Millisekunden:
Bei 500 Millisekunden

Bei 100 Millisekunden:
Bei 100 Millisekunden

Bei 50 Millisekunden:
Bei 50 Millisekunden



Wie unterscheiden sich die Vokale in ihrem Spektrum vom Sinusgemisch und wie unterscheiden sie sich voneinander?

Im Verhältnis zur Sinusschwingung liegen hier ganze Bereiche und nicht mehr nur Auslenkungen vor.
Bei der "A" liegen die meisten Ausschläge im Bereich von
0 bis 250 Hz und von 12000 bis 15000Hz,
bei der "I" gibt es nur Ausschläge bei 250 Hz und 12500Hz,
die auch viel kleiner sind als bei der "A".
0 bis 250 Hz und von 12000 bis 15000Hz,
beim "I" gibt es nur Ausschläge bei 250 Hz
und 12500Hz die auch viel geringer ausfallen als beim "A".


Matlab Code ---> Anschauen/runterladen