Laden...

Projektvorschlag: Ähliminator gesucht

Erstellt von herbivore vor 16 Jahren Letzter Beitrag vor 8 Jahren 6.871 Views
herbivore Themenstarter:in
49.485 Beiträge seit 2005
vor 16 Jahren
Projektvorschlag: Ähliminator gesucht

Hallo Community,

der ComputerClub 2 (CC2) - das Technikmagazin mit Wolfgang Back und Wolfgang Rudolph - sucht einen Ähliminator, also ein Programm, dass Ähs aus Audiodateien eliminieren kann:

Wir suchen ein Programm, dass per Mustererkennung "Ähs" herausfindet und automatisch aus der WAV-Datei schneidet. Die Punkte, an denen Ähs eliminiert werden, sollten durch einen Cue-Point gekennzeichnet werden. [...]

Wir freuen uns über jeden Programm-Vorschlag. Da wir ihn auch veröffentlichen wollen, solltet Ihr Eure Programme unter die GPL stellen.

Vielleicht hat ja der eine oder andere von euch Interesse an dem Thema und schreibt so ein Programm. Oder es finden sich mehrere Interessenten, die gemeinsam an diesem Projekt arbeiten wollen.

Mehr Informationen unter:

cczwei.de: Mit dem Ähliminator meinen wir es ernst
cczwei-forum.de: Ähliminator

Ich selbst habe zwar nicht vor mitzuarbeiten, finde ich Idee aber sehr interessant und wollte deshalb nicht versäumen, sie hier vorzustellen.

herbivore

2.921 Beiträge seit 2005
vor 9 Jahren

Auch wenn der Beitrag jetzt sieben Jahre alt ist, gibt es denn inzwischen so ein Programm das so was kann? Weiss da jemand was? Ausser dem untenstehenden Link habe ich dazu bisher nichts konkretes gefunden.

Möglicherweise ist es ja auch damit möglich:

Microsoft Patent: "Automatische Audio Sprachdaten Zensur"

Seit der Erkenntnis, dass der Mensch eine Nachricht ist, erweist sich seine körperliche Existenzform als überflüssig.

herbivore Themenstarter:in
49.485 Beiträge seit 2005
vor 9 Jahren

Hallo dr4g0n76,

ich habe mal bei Google nach "Automatic censorship of audio data for broadcast", nach patent 7437290 und nach Ähliminator gesucht, jeweils begrenzt auf das letzte Jahr. Da findet man quasi nichts. Insofern würde ich mal behaupten, da gibt es wohl auch nichts (wesentlich) neues.

Wenn trotzdem jemand was dazu weiß, immer her damit.

herbivore

60 Beiträge seit 2010
vor 9 Jahren
GapStop

Adobe hat so etwas für videos, die nennen das GapStop und es funktioniert hervorragend:

https://www.youtube.com/watch?v=xi2lYi8qil4

Für Audio weiss ich auch nichts. Könnte schwierig werden ein kurzes "Ähm" von einem "Etwas" zu unterscheiden je nach Dialekt. Für manuell gibt es jau audacity.

**:::

herbivore Themenstarter:in
49.485 Beiträge seit 2005
vor 9 Jahren

Hallo AyrA,

ich finde, aus dem Video geht nicht hervor, dass die Ähs automatisch eliminiert wurden. Ich finde im Gegenteil, dass es - nach dem was gesagt wurde - eher den Eindruck macht, als wären die Ähs manuell herausgeschnitten worden. So wie ich es verstehe, ist die Leistung der Software, die Bildsprünge im Video, die sich durch diesen Schnitt ergeben haben, zu glätten.

Der gesuchte Ähliminator soll aber die Ähs automatisch (aus reinen Audiodateien) schneiden. Ein Glätten ist dabei vermutlich eher nicht nötig, denn in allen Beispielen, die man im allerersten Link sieht, sind die Ähs durch sehr leiste Stellen vom eigentlichen Text abgrenzt. Der Ähliminator müsste also vermutlich nur darauf achten, an Nulldurchgängen (gleicher Richtung) zu schneiden.

herbivore

W
872 Beiträge seit 2005
vor 9 Jahren

Ich benutze auf meinem IPhone Overcast für Podcast. Das Programm ist recht erfolgreich im Anpassen der Wiedergabegeschwindigkeit, um Leerpausen herauszuschneiden, damit man einen Podcast schneller hören kann. Die Ähs sind ein ähnliches Problem - ich habe auch in einem Podcast eine mal wage Beschreibung des Algorithmuses durch den Autor gehört, müßte aber nach der Quelle schauen.

2.921 Beiträge seit 2005
vor 9 Jahren

Vielleicht hilft dieses Framework, um damit etwas anzustellen (nicht evaluiert ob kostenlos oder nicht bisher, aber anscheinend schon: fork on github):

http://accord-framework.net/

Auszug:

Machine learning made in a minute

The Accord.NET Framework is a .NET machine learning framework combined with audio and image processing libraries completely written in C#. It is a complete framework for building production-grade computer vision, computer audition, signal processing and statistics applications even for commercial use. A comprehensive set of sample applications provide a fast start to get up and running quickly, and an extensive online documentation helps fill in the details.

Klingt sehr gut. Sobald ich Zeit habe will ich damit unbedingt mal herumspielen.
Jetzt brauche ich nur noch ähs. ^^ 😉

Seit der Erkenntnis, dass der Mensch eine Nachricht ist, erweist sich seine körperliche Existenzform als überflüssig.

T
708 Beiträge seit 2008
vor 9 Jahren

Jetzt brauche ich nur noch ähs. ^^ 😉

Nichts leichter als das:
Edmund Stoiber - Transrapid

Anschließend müsste die Tonspur nur noch etwa 15 Sekunden umfassen 😁

2.921 Beiträge seit 2005
vor 9 Jahren

Hahaha Trib. An den dachte ich ehrlich gesagt dabei auch. 😄

Seit der Erkenntnis, dass der Mensch eine Nachricht ist, erweist sich seine körperliche Existenzform als überflüssig.

P
52 Beiträge seit 2015
vor 8 Jahren

Und hat sich inzwischen schon etwas getan oder schon zum Testen?

Gruß Padman