W tym odcinku Business Toolbox pokażę Ci niezwykle prostą metodę zamiany nagrania audio na tekst.
Prowadząc podcasty i wywiady, często chcę zamienić je również na formę tekstową, np. artykuł na blogu.
Mój podcast to ponad 150 godzin nagrań i mam sporą pokusę, aby przynajmniej część pojawiła się w formie artykułów na moim blogu.
Jedna godzina podcastu to ok 40 tys znaków tekstu, czyli ok 10-12 stron A4. Średnia długość artykułu na moim blogu to ok 10 tys znaków. Zatem szybko licząc, gdybym zamienił wszystkie podcasty na tekst, to mógłbym wybenerować ok 400 artykułów! Brzmi kusząco muszę przyznać 🙂
Niestety wymaga to sporo pracy. Dlatego od jakiegoś czasu eksperymentowałem z usługami speech-to-text Google i Microsoft, ale nie były wystarczająco dokładne lub nie pozwalały na konwertowanie długich nagrań.
Niedawno przetestowałem nową funkcję zapisywania audio jako tekst dostępną w aplikacji mobilnej Microsoft Office i byłem zaskoczony tym, jak dokładne jest rozpoznawanie głosu. Dodatkowo aplikacja wykrywa różnych rozmówców i oznacza ich wypowiedzi, co oszczędza ogromną ilość czasu. System rozpoznaje wiele skrótów i nazw własnych np. RODO. Taki zapis możesz szybko wyeksportować do pliku Word i dodatkowo poprawić, ale większość pracy aplikacja wykonuje samodzielnie.
Testowałem też rozpoznawanie głosu i zamianę na tekst podczas konferencji, siedząc kilka metrów od głośnika i aplikacja radziła sobie bardzo dobrze.
Na ten moment (połowa stycznia 2022) ta funkcja jest dostępna w smartfonach z systemem Android, ale zapewne niedługo pojawi się na innych platformach.
Spis treści:
00:00 – Wprowadzenie
00:20 – Jak szybko zamienić audio na tekst?
01:40 – Przykład zamiany audio na tekst w aplikacji mobilnej pakietu office
03:06 – Działanie aplikacji – wykrycie rozmówców, korekty, interpunkcja
04:46 – Edycja, udostępnianie i eksport wygenerowanej notatki
06:23 – Podsumowanie