搜尋結果
2020年3月18日 · 郭家宏. 2020-03-18. 分享本文. 開完會議,聽完演講後,有時候會需要將錄音檔轉成文字,但如果是英文音檔轉中文,那個過程會很「搞剛」。 近期 Google 翻譯推出即時轉錄(real-time transcription)功能,可以即時將音檔轉成翻譯後的文字。 點選 Transcribe 圖樣,就能夠將音檔轉成翻譯後的文字. 根據《Android Authority》的 描述 ,即時轉錄功能會在這週上線,支援英文、法文、德文、印度文、葡萄牙文、俄文、西班牙文、泰文等語言,可惜還沒有支援中文。 此外,即時轉錄只支援 Android 系統,但 Google 會再開發 iOS 系統的版本。
2024年2月21日 · 1. Whisper 是 OpenAI 推出的自動語音辨識系統(Automatic Speech Recognition,ASR)。 OpenAI 以 68 萬小時的音檔訓練 Whisper,因此它可以快速又準確地將語音轉換為文字,為用戶省下打逐字稿或是上字幕的時間。 2. Buzz. 另外一款語音轉文字軟體 Buzz 也非常好用,相較 Whisper,Buzz 的操作介面更直覺、好上手! 而且它還支援 Windows、 Mac、 Linux 等不同作業系統,讓所有用戶都有機會使用這項工具。 3. MacWhisper 是基於 OpenAI 開發的自動語音辨識系統 Whisper 打造的,僅供 macOS 作業系統使用,可以辨識超過 100 種語言,且免費版本的準確度就很高!
2018年3月6日 · 楊采翎. 2018-03-06. 分享本文. 身為媒體、文字工作者,編譯上千字逐字稿是勞心勞神的家常便飯,但語音轉文字 APP「Otter」的誕生,大大提高了英文語音轉文字檔的精準度。 (終於可以提早下班了! 由前 Google 員工 Sam Liang 及軟體公司 Nuance,共同開發的 APP「 Otter 」,採用 AI 語音辨識系統,其高度的轉譯準確性,造就其與其他語音轉文字軟體的不同之處。 只要先設定聲紋,即可聽音自動輸入文字與標點符號,不過,目前僅限於英語。 「Otter」採 AI 語音辨識系統,提高轉換準確度。 (圖:擷取自 Otter 網站) 同樣主打 AI 語音辨識的百度語音網頁應用程式 SwiftScribe ,號稱具有高達 97% 的準確率。
其他人也問了
google翻譯可以轉文字嗎?
google 怎麼用語音輸入?
語音轉文字軟體有哪些?
2024年4月1日 · 事實上,OpenAI 在 2022 年就首次開發了語音引擎,並用來支援 OpenAI 文字轉語音 API,以及 ChatGPT 朗讀功能的預設語音。 OpenAI 表示,他們 意識到合成語音濫用的可能性,因此採取謹慎和知情的方式先和一小部分合作夥伴測試這項功能 ,探索語音引擎技術的 ...
2020年8月6日 · 2020-08-06. 分享本文. 聲音也能像在 Google Doc 上編輯文字一樣修改自如嗎? AI 語音編輯軟體 Descript,利用語音轉文字(voice-to-text)技術,將語音內容轉成文字,使用者只要修改這些文字,就能直接「修改音檔」。 近日,Descript 將一個更加強大的功能 Overdub 加入付費版 Descript Pro 中,Overdub 是一更加強大的「聲音深偽」功能,可以利用 AI 學習使用者的聲音,並且自動生成語句。 讓 AI 學習你的聲音,說出你不曾講過的話.
2020年11月10日 · 2020-11-10. 分享本文. 現在不只聲音,就連影片也能像在 Google Doc 上編輯文字一樣修改自如嗎? 過去 AI 語音編輯軟體 Descript 以語音轉文字(voice-to-text)技術,提供使用者透過剪輯、黏貼和刪除文字檔的直觀使用方式,同步修改相對應音訊。 今(2020)年 10 月底,Descript 發表了他們新的 AI 剪片技術進展。 只須將影片上傳,Descript 會將音訊轉為文字. https://blog.descript.com/introducing-descript-video-and-screen-recording/ 對 Descript 的操作方式有興趣的朋友,可以先看一下上方提供的影片。
2017年9月20日 · 要啟用,請在 Google 文件上方的「工具」中,啟用「語音輸入」功能。 啟用之後,在文件上方就會飄著一個語音輸入指示窗,第一次使用的時候系統會問你是否要給予 Google 文件麥克風的權限,記得要同意。 當語音輸入法啟動時,麥克風的顏色會變成紅色,這時就對著麥克風說話,Google 文件便會開始語音輸入文字,可以參照下方的影片範例: 經過實測,如果一次以一個句子為單位的話,辨識準確率其實是很高的,當然這邊在念的時候咬字要清晰,不過講話的速度可以控制在一般說話速度就好,不必過度放慢,就可以有很高的辨識率了,這個功能對於有時需要將腦中的想法快速整理成大量文字文件的人而言或許會有所幫助。 不知道未來用這個功能來做會議紀錄會不會省下很多時間XD? 各種格式超連結看了心煩? 快速鍵一秒去格式.