Newsticker

Mozilla macht riesigen Datensatz menschlicher Stimmen verfügbar

28 Feb. 2019 18:44 Uhr

Der Hersteller des Firefox-Browsers hat den größten Datensatz menschlicher Stimmen verfügbar gemacht, der komplett von Freiwilligen eingesprochen wurde. Mit dem Projekt "Common Voice" soll der weltweit vielfältigste Sprachdatensatz erstellt werden. Das Unternehmen Mozilla mit Sitz in San Francisco will damit vor allem kleineren Herstellern und Crowdfunding-Projekten ohne Lizenzgebühren ermöglichen, eigene Spracherkennungssysteme zu entwickeln.

Mozilla macht riesigen Datensatz menschlicher Stimmen verfügbar

Der Datensatz von Mozilla umfasst nach Angaben des Unternehmens 18 verschiedene Sprachen, darunter Englisch, Französisch, Deutsch und Mandarin, aber auch beispielsweise Walisisch und Kabyle, eine algerische Berbersprache. Der Datensatz summiert sich zu fast 1.400 Stunden aufgezeichneter Sprachdaten von mehr als 42.000 Mitwirkenden. Die von Mozilla eingesammelten Daten stehen unter der "CC0"-Lizenz zur Verfügung. Das ist die freizügigste Variante der Creative-Commons-Lizenzen. Die Projekt-Teilnehmer haben dabei freiwillig auch Metadaten wie Alter, Geschlecht und Akzent angegeben. "Damit werden gemeinsam mit ihren Aufzeichnungen weitere Informationen gespeichert, mit denen Sprach-Engines noch besser trainiert werden können", heißt es in dem Blog-Eintrag von Mozilla.

Mehr zum Thema - Aufstand der Maschinen pünktlich zum Frühstück? Amazons "Alexa" verweigert europaweit Dienst

Bislang dominieren die großen Internetkonzerne wie Google, Microsoft, IBM, Amazon und Apple den Markt für Spracherkennung. Wichtiger Akteur ist außerdem das Unternehmen Nuance, dessen Technik hinter der Spracherkennung von Apples Siri steckt. (dpa)

Durch die Sperrung von RT zielt die EU darauf ab, eine kritische, nicht prowestliche Informationsquelle zum Schweigen zu bringen. Und dies nicht nur hinsichtlich des Ukraine-Kriegs. Der Zugang zu unserer Website wurde erschwert, mehrere Soziale Medien haben unsere Accounts blockiert. Es liegt nun an uns allen, ob in Deutschland und der EU auch weiterhin ein Journalismus jenseits der Mainstream-Narrative betrieben werden kann. Wenn Euch unsere Artikel gefallen, teilt sie gern überall, wo Ihr aktiv seid. Das ist möglich, denn die EU hat weder unsere Arbeit noch das Lesen und Teilen unserer Artikel verboten. Anmerkung: Allerdings hat Österreich mit der Änderung des "Audiovisuellen Mediendienst-Gesetzes" am 13. April diesbezüglich eine Änderung eingeführt, die möglicherweise auch Privatpersonen betrifft. Deswegen bitten wir Euch bis zur Klärung des Sachverhalts, in Österreich unsere Beiträge vorerst nicht in den Sozialen Medien zu teilen.

Top-Artikel

Liveticker Ukraine-Krieg: Ukrainisches Militär setzt Storm Shadow-Marschflugkörper gegen Donezk ein

Aktualisiert vor einer Stunde

Misstrauensvotum gegen von der Leyen im EU-Parlament

Aktualisiert gestern

Analyse

Estland fordert einen Atomwaffenschlag heraus

Aktualisiert vor 8 Stunden

Serjosha S., zehn Jahre alt – Der jüngste Held Russlands

Aktualisiert gestern

Meinung

Trumps 30-Milliarden-Dollar-Angebot an Iran?

Aktualisiert gestern

Mozilla macht riesigen Datensatz menschlicher Stimmen verfügbar

Top-Artikel

Newsletter abonnieren