Österreichisches Aussprachewörterbuch

Johannes Zmölnig
01.01.2004

Ressourcen:

adaba Info

adaba files on Sourceforge

Österreichisches Aussprachewörterbuch

Beim vorliegenden Projekt handelt es sich um ein Teilprojekt des von der ÖNB geförderten Projekts „Aussprachewörterbuch und Aussprachedatenbank des Österreichischen Deutsch - Standardaussprache und Varianten der Standardaussprache”

 

Suche im Aussprachewörterbuch

Suchmasken

 

Orthographische Suche

 

  • der Suchausdruck ist ein regulärer Ausdruck (siehe [regex])

    Beispiel:

    .ut (genau) findet sowohl "Hut" als auch "tut"

  • der Suchausdruck MUSS immer kleingeschrieben werden (siehe [kleinschreibung])

    Beispiel:

    gol (anlautend) findet sowohl "Gold" als auch "goldig" Held findet "Held" nicht!, "held" wird jedoch sehrwohl gefunden

  • die Suche nach [IPA]-Gruppen ist nicht möglich!

     

 

[phonetische] Suche

 

  • der Suchausdruck ist ein regulärer Ausdruck (siehe [regex])
  • Ausdrücke werden in Unicode (IPA) geschrieben, SAMPA wird nicht unterstützt (man kann z.B. Glyphen einer vorhandenen Transkription verwenden)
  • im Suchausdruck kann nur nach lauttragenden Glyphen gesucht werden (stumme Zeichen (z.b. ":" (Länge)) und Modifikatoren können nicht gesucht werden)
  • es können Platzhalter für ganze [IPA]-Gruppen verwendet werden

 

Boole'sche Operationen

 

  • Suchergebnisse von Orthographischer und Phonetischer Suche können über Mengenoperatoren verknüpft werden.

    Beispiel:

    Suche1 (orthographisch; auslautendes er) liefert die Liste "aber, Geber, unter"

    Suche2 (phonetisch; anlautender Vokal) liefert "Aachen, aber, Europa, Otto, unter"

    die Intersektion aus Suche1 & Suche2 liefert alle Wrter mit anlautendem Vokal und auslatendem 'er': "aber, unter"

  • die Boole'schen Operatoren können nur auf 2 Suchergebnisse angewandt werden
  • im Transcriber (erweiterte Suche) steht augenblicklich (v0.20) nur eine Suchmaske zur Verfügung, wodurch keine sinnvollen Boole'schen Operationen durchgeführt werden können

 

Lautumgebung:

 

  • anlautend

    Wörter, die mit dem Suchausdruck beginnen

  • inlautend

    Wörter, die den Suchausdruck beinhalten (jedoch nicht nur am Anfang oder Ende)

  • auslautend

    Wörter, die mit dem Suchausdruck enden

  • Kombinationen

    Mehreren Lautumgebungen können ODER-verknüpft werden

    Beispiel

    Wird anlautend und inlautend gewählt, so werden Wörter gefunden, die den Suchausdruck am Anfang oder am Ende beinhalten

    Werden alle 3 Lautumgebungen gewählt, so werden Wörter gefunden, die den Suchausdruck irgendwo beinhalten

    Wird keine Lautumgebung gewählt, so werden Wörter gefunden, auf die der Suchausdruck genau zutrifft.

 

Suchausdrücke

 

Groß-/ [kleinschreibung]

Die Suchdatenbank (Gesamtheit der zu findenden Wörter) wird "normalisiert" (d.h. in Kleinbuchstaben) gespeichert.

Großbuchstaben in der Eingabemaske werden jedoch nicht in Kleinbuchstaben umgewandelt, da Großbuchstaben als Kürzel für IPA-Gruppen vorgesehen sind (siehe 2.2)

Daher sollte der Suchausdruck immer aus Kleinbuchstaben bestehen (ausser IPA-Gruppen werden bei der [phonetische]n Suche verwendet)

[IPA]-Gruppen

über das Menü->Einstellungen können IPA-Gruppen bestimmte Zeichen zugeordnet werden.

Beispiel: in Menü->Einstellungen werden der Gruppe "Vokale" der Buchstabe V und der Gruppe "Plosive" der Buchstabe P zugeordnet

Die Phonetische Suche nach PVPV liefert die Ergebnisse "Baby, Bude, Güter, Tabu" (ein Plosiv gefolgt von einem Vokal gefolgt von einem Plosiv gefolgt von einem Vokal)

[regex]: reguläre Ausdrücke

Reguläre Ausdrücke sind ein mächtiges Werkzeug zum Definieren von Suchausdrücken

Einzelnes bestimmtes Zeichen:

(passt genau auf das angegebene Zeichen)

Beispiel:

aber passt auf "aber" aber nicht auf "Haus"

Einzelnes beliebiges Zeichen: .

 

Beispiel:

m.st passt auf "most" und "mist", aber nicht auf "meist" (da "ei" aus 2 Buchstaben besteht)

Wiederholung des letzten Zeichens: +

(das Zeichen vor dem + muss im gefunden Zeichen mindestens einmal vorkommen)

Beispiel:

bus+ passt auf "bus", "buss" und "bussssss", nicht aber auf "Busse" und "Bu"

Kann auch mit . zusammen verwendet, um mehrere beliebige Zeichen zu beschreiben

Beispiel:

m.+st passt auf "most" und "mist", "meist" und "mindest"; nicht aber auf mst (da kein zeichen zwischen "m" und "st" ist) und "murrt" (da die Endungen "st" und "rt" verschieden sind)

Wiederholung des letzten Zeichens (auch keinmal): *

 

Beispiel:

abc*d passt auf "abd", "abcd", "abccccccd", nicht aber auf "a" und "abdd"

Auswahl aus einem Satz von Zeichen: [ und ]

(irgendein Zeichen aus dem in eckigen Klammern stehenden Satz von Zeichen muss passen)

Beispiel:

h[aei]t passt auf "hat", "het" und "hit" aber nicht auf "hut"

Gruppen: ( und )

(Zeichen können zu Gruppen zusammengefasst werden, auf die andere Regeln (z.B. Wiederholung) angewandt werden können)

Beispiel:

hono(lu)+ passt auf "honolu", "honolulu" und "honolulululu" (die Gruppe "lu" muss mindestenst einmal wiederholt werden)

Wiederholung: \1, \2,...

(nicht unmittelbare Wiederholungen von Zeichen/Gruppen; die Zahl bezeichnet den Index der Gruppe (d.h. die erste Gruppe ist "\1", die zweite Gruppe ist "\2",...))

Beispiel:

(au)fb\1 passt nur auf "aufbau"

Beispiel

(..+)..\1 passt auf "aufbau", "ausbau", "emblem", "genügen" (eine beliebige Gruppe von mindestens 2 Zeichen wird wiederholt; zwischen den beiden Wiederholungen müssen genau 2 Zeichen sein)

Weiterführende Literatur zu regulären Ausdrücken:

de.wikipedia.org/wiki/Regulärer_Ausdruck

www.regular-expressions.info