Każdy użytkownik komputera może spotkać się z sytuacją, w której konieczne jest głosowe wprowadzenie dowolnego tekstu na komputerze. Oprócz standardowych rozwiązań systemu Windows istnieją aplikacje innych firm, które pozwalają to zrobić. Proponujemy rozważyć najlepsze z nich.
MSpeech
Przede wszystkim przyjrzyjmy się darmowemu narzędziu MSpeech od niezależnego programisty Michaiła Grigorieva, który dystrybuuje swój produkt za darmo z otwartym kodem źródłowym. Rozwiązanie oparte jest o technologię Google Voice API, zaprojektowaną do rozpoznawania ludzkiej mowy i dalszego przekształcania jej w tekst. Rozpoznany tekst jest wprowadzany do specjalnego okna, skąd można go łatwo przenieść do innych aplikacji na różne sposoby. Obsługiwanych jest około 50 różnych języków, w tym rosyjski. Dostępne są skróty klawiszowe umożliwiające łatwą aktywację i zakończenie nagrywania.
Dostępny jest prosty edytor tekstu, w którym można dokonać wstępnej korekty otrzymanego tekstu: zamienić określone słowa na inne lub zamienić pierwsze litery zdań na duże. Jako źródło dźwięku może służyć dowolne urządzenie podłączone do komputera. Jeśli jest ich kilka, MSpeech zaproponuje wybór odpowiedniego. Menu programu obsługuje język rosyjski. Ponadto jest kompatybilny z następującymi interfejsami: Microsoft SAPI, Google Text-to-Speech, iSpeech Text-to-Speech, Yandex Text-to-Speech itp.
Pobierz ostatnią wersję MSpeech z oficjalnej strony internetowej
Przeczytaj także: Pisanie głosowe na komputerze
Lossplay
Następna w kolejce jest kolejna prosta aplikacja do transkrypcji, która została pierwotnie stworzona przez zespół programistów z różnych krajów. Teraz twórca jest niezależnym programistą, który nadal go rozwija. LossPlay może służyć nie tylko do tłumaczenia głosu na tekst, ale także jako zwykły odtwarzacz do słuchania muzyki i innych plików audio. Rozwiązanie obsługuje wszystkie aktualne rozszerzenia z MP3 na WMA. Odtwarzaniem steruje się za pomocą dostosowywalnych klawiszy skrótu.
LossPlay jest zoptymalizowany do pracy z dokumentami tekstowymi Microsoft Word... Rozpoznany tekst jest wprowadzany do programu bez interwencji użytkownika. Dodatkowo istnieje funkcja automatycznego wstawiania kodów czasowych dla wszystkich fraz. Interfejs rozważanego rozwiązania przedstawiony jest w postaci znajomego odtwarzacza z dodatkowymi funkcjami. W tym samym czasie nawet początkujący użytkownik poradzi sobie z menu. LossPlay jest dystrybuowany bezpłatnie w języku rosyjskim.
Pobierz ostatnią wersję LossPlay z oficjalnej strony internetowej
Przeczytaj także: Pisanie głosowe w Dokumentach Google
Transcriber-Pro
Transcriber-Pro to program rosyjskich programistów przeznaczony do ręcznego dekodowania plików audio i wideo na tekst. Posiada wbudowany edytor tekstu ze wszystkimi niezbędnymi funkcjami do wysokiej jakości transkrypcji: wstawianie znaczników czasu i spikerów, prosta nawigacja po nagraniu, korekta bez ponownego odsłuchiwania, tworzenie profesjonalnej transkrypcji itp. Zarządzanie odbywa się za pomocą dostosowywalnych klawiszy skrótu, co sprawia, że rozwiązanie jest wygodniejsze.
Omawiana aplikacja umożliwia pracę w zespole nad jednym projektem. Wsparcie techniczne online jest dostępne dla posiadaczy płatnej licencji. Abonament jest na rok. Na oficjalnej stronie możesz zapoznać się z wymaganiami systemowymi, obejrzeć wizualny film dotyczący pracy z Transcriber-Pro oraz zapoznać się ze szczegółową instrukcją obsługi.
Pobierz ostatnią wersję Transcriber-Pro z oficjalnej strony internetowej
Przeczytaj także: Tekstowe programy głosowe
Ekspresowy pisarz
Express Scribe to wielofunkcyjne narzędzie do ręcznej transkrypcji nagrań audio, przedstawione w postaci wygodnego odtwarzacza z dodatkowymi funkcjami. Moduł dźwiękowy i tekstowy jest skoncentrowany w jednym interfejsie, co eliminuje konieczność przełączania się między oknami.Godne uwagi funkcje obejmują możliwość przełączania się między ścieżkami audio, przeskakiwania do określonych jej części i dodawania notatek z kodami czasowymi.
Do otwarcia pliku można użyć katalogu komputera, serwera FTP, dysku CD, poczty e-mail lub dysków zewnętrznych. Ponadto Express Scribe obsługuje przenośny sprzęt do nagrywania dźwięku. Rozważane rozwiązanie działa z ogromną liczbą formatów audio: WAV, MP3, WMA, VOX, AU, DSS, itp. Obsługiwane rozszerzenia dyktafonów Philips Digital Recorder, GSM 6.10, ALaw, DSP itp. Należy zauważyć, że niektóre formaty nie są dostępne w wersji demonstracyjnej -wersja, a język rosyjski nie jest tutaj w ogóle dostępny.
Pobierz ostatnią wersję Express Scribe z oficjalnej strony internetowej
Voco
Voco to proste narzędzie do automatycznego rozpoznawania mowy ludzkiej i konwersji na tekst. Działa w tle, a odpowiednią ikonę można znaleźć w zasobniku. Mikrofon uruchamia się poprzez naciśnięcie kombinacji klawiszy skrótu, po czym użytkownik wypowiada żądane słowa i po kilku sekundach pojawiają się one na ekranie. Dzięki wyrafinowanym algorytmom system praktycznie nie popełnia błędów, a jego szybkość przewyższa prędkość doświadczonych stenografów.
Silnik Voco umożliwia głosowe ustawianie znaków interpunkcyjnych i przenoszenie kursora do nowej linii lub akapitu. Ponadto istnieje funkcja odszyfrowania pliku audio lub wideo, ale jest dostępna tylko w wersji płatnej. Narzędzie ma rozwijające się słownictwo, które każdy użytkownik może uzupełniać. Baza zawiera już ponad 85 tysięcy słów. Aby otrzymać wersję demo, należy wypełnić specjalny formularz. Jest rosyjska lokalizacja.
Pobierz ostatnią wersję Voco z oficjalnej strony internetowej
Były to najbardziej niezawodne i popularne narzędzia zamiany głosu na tekst. Niektóre z nich działają w trybie automatycznym, w którym wystarczy wgrać plik audio lub skorzystać z mikrofonu, a inne są tylko narzędziem pomocniczym, które znacznie upraszcza ręczną transkrypcję.