Das gleiche Prinzip kennt man aber auch von Zeitungen, Zeitschriften, Personen, etc. Da hat man auch über weiteste Strecken das Gefühl eine gute Einschätzung zu bekommen (sag ich mal), bis sie über ein Thema schreiben über das man selbst mehr Ahnung hat, dann wirken die Ergüsse plötzlich völlig daneben, sie werden aber üblicherweise in der gleichen autoritativen Selbstverständlichkeit wie alles andere auch vorgetragen. Die Schlussfolgerung ist natürlich, dass alles immer im Grunde falsch ist, es aber auch gut genug ist, um für die meisten Leute für die meisten Felder zu funktionieren.
blumenau mit leicht alberner these, dass im netz qua perso filter jede/r in eigener realtität lebt was furchtbar ist weil alle in ind. parallel/scheinwelten leben und dem kann abgeholfen werden wenn man sich wie mb für drei versch. sachen interessiert also fußball, popmusik und falter oder so
Today, speech technology is only available for a small fraction of the thousands of languages spoken around the world because traditional systems need to be trained on large amounts of annotated speech audio with transcriptions. Obtaining that kind of data for every human language and dialect is almost impossible.
Wav2vec works around this limitation by requiring little to no transcribed data. The model uses self-supervision to push the boundaries by learning from unlabeled training data. This enables speech recognition systems for many more languages and dialects, such as Kyrgyz and Swahili, which don’t have a lot of transcribed speech audio. Self-supervision is the key to leveraging unannotated data and building better systems.