語音轉文字 相關
廣告
搜尋結果
2017年3月19日 · 百度宣布推出一款能將音訊檔案轉化為文字的網路應用程式,可仰賴AI來改變現在人工逐字稿的現狀,比人類快上1.67倍,且「準確率高達97%」。 《騰訊科技》報導,百度首席科學家吳恩達指出,這款網頁應用程式SwiftScribe將改變採訪和影片字幕生成,非常適合將長語音轉化為文本的人士,AI將實現1+1大於2的效果。 只要在SwiftScribe選取wav或mp3的檔案,上傳至此網站,就能馬上處理,長約1分鐘的文件可在30秒內完成,而目前可處理1小時內的檔案。 在這之後,用戶只需人工調整大小寫、添加標點符號以及一些細節,就能完成將音訊轉化為文字的工作。 報導指出,利用此系統,可以縮短40%的工作時間。 說到字幕生成,當然不能忘了YouTube。
2019年9月8日 · RetroArch開發團隊說明,在新功能中藉由OCR文字識別技術、文字轉語音技術,讓轉譯後的文字內容能透過語音方式呈現。 開發團隊也解釋,其實這個翻譯功能是將畫面擷取下來,再透過圖像識別方式轉換成文字部分,進而完成翻譯。 以近日公布的更新內容,暫時還只能將日文遊戲轉換成英文,或是把英文內容轉換成日文,而且目前還沒計畫加入更多與嚴選項。 不過,如果目前已經能夠完成把遊戲中的文字進行日文、英文交換,也代表著要實現更多語言互換也並非太困難的事情,最多就是像中文有不少用語需要配合前後內容才可以正確表達,而藉由人工智慧加入翻譯工作的設計,近期也開始讓中文在內的語言相互翻譯變得更加通順、正確。 但這個功能目前有個缺點,就是在文字轉譯過程中得讓遊戲暫停,直到玩家暫停翻譯功能才能繼續玩遊戲。
2024年1月8日 · GPT-5將具備更多參數、更多數據,能夠生成更準確、多樣化和有創造力的文字。 語音模式是ChatGPT的一大特色,允許用戶使用語音命令與機器人互動。 Altman承諾2024年將對語音模式進行改進,提供更高的品質、速度和可靠性,並增強其表達能力,能夠適應 ...
2024年3月31日 · CNEWS匯流新聞網記者王佐銘/綜合報導. 美國人工智慧(AI)領先開發公司OpenAI宣布推出一項名為Voice Engine的創新語音複製工具,以在應對語音造假詐騙等挑戰。 該公司透露,Voice Engine能夠根據僅15秒的聲音樣本,複製出一個人的聲音,為解決可能帶來的潛在風險,OpenAI強調將實施嚴格的管制措施。 根據法新社報導,OpenAI表示,Voice Engine的開發是出於對日益增長的語音造假問題的關注。 認識到這種技術可能被惡意使用,尤其在關鍵的選舉年,OpenAI已經與政府、媒體、娛樂、教育和公民社會等各界合作,確保在開發過程中充分納入各方意見,以確保工具的負面影響最小化。
2024年4月2日 · 除了ChatGPT,OpenAI還提供了一系列其他的人工智慧產品,如Voice Engine語音複製工具和文字生成影片AI模型Sora等,但這些產品仍然需要付費和註冊方可使用。
2020年2月26日 · 該AI語音辨識系統,採台灣優先的本地國語發音優化開發,可辨識檢察機關相關術語及法律專業用語,並於檢察署內完成語音辨識,以符合偵查不公開。 並克服偵查庭同時多人發言之環境,同時建立法律專用語音(意)庫,作為後續法務業務結合語音辨識應用或研究之基礎建設。 不過由於坊間對語音辨識軟體早已開發多年,當前最流行的APP「雅婷逐字稿」由於錯誤率仍相當高,事後修改幅度不小,因此普及性並不佳,加上法律用語與一般人落差頗大,開庭時律師與當事人兩種說話模式不同,能增進多少效率還待觀察,法界一般對此多抱持保留意見。 照片來源:資料照片. 更多匯流新聞網報導: 最新/黃偉哲宣布古都馬拉松延至10月 大甲媽祖遶境改精簡版舉行. 分析/環團群起反對政院擬修《國土計畫法》 癥結在哪? 【匯流筆陣】
2023年10月1日 · 聊天機器人ChatGPT的開發業者OpenAI日前宣布,長期以來僅限於輸入文字提示的生成式人工智慧(AI)平台,將在ChatGPT中推出新的語音和圖片功能,換言之,OpenAI已把視覺、聽覺和說話的能力都賦予ChatGPT。 接下來,這些功能將會陸續開放給付費版(ChatGPT Plus)和企業版(ChatGPT Enterprise)用戶。 法新社報導,根據OpenAI說法,付費服務版本中新增的功能可讓用戶與AI對話,甚至「秀出」談論的相關內容。 除了語音功能以外,ChatGPT 也加入了圖像辨識功能。 OpenAI提到,語音和影像為大家提供更多在生活中使用ChatGPT的方式。 譬如,在旅行時拍下一張地標照片,就能即時討論其中有趣之處。 又如,拍照問ChatGPT怎麼把腳踏車座椅調低?