Rede analysieren Muster

Luft, die durch die Glottis fließt, wenn sie als Wellenform gemessen wird, besteht aus drei Phasen: geschlossene Phase, glottale offene Phase und Rückkehrphase. Die Zeitdauer eines Glottalzyklus wird als Tonhöhenperiode bezeichnet und die Wechselzeit der Tonhöhenperiode ist die entsprechende Tonhöhe, die auch als Grundfrequenz bezeichnet wird. Der normale Tonhöhenbereich beträgt etwa 60–400 Hz. Männchen haben eine niedrigere Tonhöhe als Weibchen, da ihre Stimmfalten länger und massiver sind. F0 Jitter ist ein Phänomen, durch das Tonhöhenperioden über Perioden variieren und charakteristisch für harte Stimme sind. [6] Die Formant-Frequenz wird erstmals 1960 von Gunnar fant definiert[7], als Konzentration der akustischen Energie um eine bestimmte Frequenz in einer Sprachwelle. Es sind die spektralen Spitzen eines Schallspektrums. Die wichtigsten indirekten Methoden sind derzeit die inverse Filterung von Mikrofon- oder oralen Luftstromaufnahmen und Elektroglottographie (EGG). [Zitat erforderlich] Bei der inversen Filterung wird der Sprachton (die aus einem Mikrofon erhaltene strahlungsfreie akustische Druckwellenform) oder die orale Luftstrom-Wellenform aus einer umlaufend belüfteten (CV) Maske außerhalb des Mundes aufgezeichnet und dann nach einer mathematischen Methode gefiltert, um die Auswirkungen des Stimmtraktes zu entfernen.

Diese Methode schätzt die glottale Eingabe der Sprachproduktion durch Aufzeichnung der Ausgabe und Verwendung eines Rechenmodells, um die Auswirkungen des Stimmtraktes umzukehren. Die andere Art der nichtinvasiven indirekten Indikation der Stimmfaltbewegung ist die Elektroglottographie, bei der Elektroden, die auf beiden Seiten der Kehle des Subjekts auf der Ebene der Stimmfalten platziert werden, die Veränderungen in der Leitfähigkeit des Halses nach wie großer Teil der Stimmfalten einander berühren. Es liefert somit eindimensionale Informationen über die Kontaktfläche. Weder inverse Filterung noch EGG reichen aus, um das komplexe dreidimensionale Muster der Stimmfaltenbewegung vollständig zu beschreiben, können aber nützliche indirekte Beweise für diese Bewegung liefern. “Es gibt jetzt neuartige computergestützte Methoden, um komplexe Verhaltensweisen wie Sprache zu charakterisieren”, erklärt die Hauptautorin der Studie Cheryl Corcoran von der Mount Sinai School of Medicine. “Sprache ist einfach zu sammeln und kostengünstig zu analysieren, indem computerbasierte Analysen verwendet werden. Diese Technologie könnte in der Psychiatrie und plausibel in anderen Bereichen der Medizin angewendet werden.” Spezifische Muster wurden für Arten von Dysarthrie identifiziert, so dass dieses Software-Tool Ärzten helfen wird, die Arten von Dysarthrie auf eine bessere Weise zu identifizieren und könnte intersubjekte Variabilität verhindern. Wir bewerteten auch die Schwere der Dysarthrie durch Formant-Bereich. Gemischte Dysarthrie kann häufiger sein, als klinisch erwartet. Sprachproben sind eine reiche Quelle von Informationen über die Gesundheit einer Person, und Forscher denken, dass subtile Stimmhinweise auf zugrunde liegende Erkrankungen hinweisen oder das Krankheitsrisiko messen können.

In ein paar Jahren könnte es möglich sein, die Gesundheit einer Person aus der Ferne zu überwachen – mit Smartphones und anderen Wearables – indem kurze Sprachproben aufgezeichnet und auf Krankheitsbiomarker analysiert werden. Sprachanalyse ist das Studium von Sprachgeräuschen zu anderen Zwecken als sprachlichen Inhalten, wie z. B. bei der Spracherkennung. Solche Studien umfassen vor allem medizinische Analyse der Stimme (Phoniatrics), aber auch Lautsprecher-Identifikation. [1] Umstrittener ist, dass einige glauben, dass die Wahrhaftigkeit oder der emotionale Zustand von Sprechern mithilfe von Sprachstressanalyse oder mehrschichtiger Sprachanalyse bestimmt werden kann. Das System untersuchte Transkripte von Interviews mit Probanden, die als anfällig für die Entwicklung einer Psychose identifiziert wurden, von denen etwa ein Viertel in den folgenden zwei Jahren eine psychotische Störung entwickelte. Die Probanden wurden gebeten zu erklären, wie gut sie eine kurzleige Geschichte verstanden, die ihnen zum Lesen gegeben wurde, und der Algorithmus, der die Sprachmuster der Probanden untersuchte, konnte mit 83 Prozent Genauigkeit feststellen, ob eine Person eine Psychose entwickeln würde. In unserer Studie wurde festgestellt, dass Formant-Bereich und F2/F1-Bereich abnehmen, wenn der Schweregrad zunimmt [Abbildung 4].