In: Introduction to MPEG-7: Multimedia Content Description Language, Eds.: B. S. Manjunath and P. Salembier and T. Sikora, John Wiley & Son, West Sussex, England, ISBN: 0-471-48678-7, 309–323p. (2002)

Sound Classification and Similarity Tools

M. A. Casey

General audio consists of a wide range of sound phenomena such as music, sound effects, environmental sounds, speech and nonspeech utterances. The sound recognition tools provide a means for classifying and querying such diverse audio content using probabilistic models. This chapter gives an overview of the tools and discusses applications to automatic content classification and content-based searching.

The sound classification and indexing tools are organized into low-level descriptors (LLD), AudioSpectrumBasis and AudioSpectrumProjection, and high-level description schemes (DSs), SoundModel and SoundClassificationModel, which are based on the ContinuousHiddenMarkovModel and ProbabilityClassificationModel DSs defined in the Multimedia Description Schemes (MDS) document. The tools provide for two broad types of sound description; text-based description by class labels and quantitative description using probabilistic models. Class labels are called terms and they provide qualitative information about sound content. Terms are organized into classification schemes, or taxonomies, such as music genres or sound effects. Descriptions in this form are suitable for text-based query applications, such as Internet search engines, or any processing tool that uses text fields. In contrast, the quantitative descriptors consist of compact mathematical information about an audio segment and may be used for numerical evaluation of sound similarity. These latter descriptors are used for audio query-by-example (QBE) applications. They can be applied to many different sound types because of the generality of the low-level features. We start by discussing these LLD.

back


Creative Commons License © 2017 SOME RIGHTS RESERVED
The content of this web site is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.0 Germany License.

Please note: The abstracts of the bibliography database may underly other copyrights.

Ihr Browser versucht gerade eine Seite aus dem sogenannten Internet auszudrucken. Das Internet ist ein weltweites Netzwerk von Computern, das den Menschen ganz neue Möglichkeiten der Kommunikation bietet.

Da Politiker im Regelfall von neuen Dingen nichts verstehen, halten wir es für notwendig, sie davor zu schützen. Dies ist im beidseitigen Interesse, da unnötige Angstzustände bei Ihnen verhindert werden, ebenso wie es uns vor profilierungs- und machtsüchtigen Politikern schützt.

Sollten Sie der Meinung sein, dass Sie diese Internetseite dennoch sehen sollten, so können Sie jederzeit durch normalen Gebrauch eines Internetbrowsers darauf zugreifen. Dazu sind aber minimale Computerkenntnisse erforderlich. Sollten Sie diese nicht haben, vergessen Sie einfach dieses Internet und lassen uns in Ruhe.

Die Umgehung dieser Ausdrucksperre ist nach §95a UrhG verboten.

Mehr Informationen unter www.politiker-stopp.de.