line語音轉文字 相關
廣告
搜尋結果
2023年5月23日 · 〔記者徐子苓/台北報導〕世界上許多語言正面臨消失的危機,Meta今(23日)發表一系列的AI模型,可轉換超過1100種語言成語音或文字,Meta還透露訓練模型的秘訣是使用《聖經》資料,未來將開源這項技術的原始碼及模型。 Meta的大規模多語言語音(Massively Multilingual Speech,MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,還能夠辨識超過4000種口語語言。 Meta表示,這項技術已有許多應用案例,從VR、AR至訊息服務,不僅能夠使用偏好的語言操作,更可理解每個人的聲音。 Meta將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們之間的距離。
2022年10月20日 · 〔記者徐子苓/台北報導〕Meta創辦人祖克柏今天在臉書發布影片宣布,Meta打造一個AI翻譯系統,可以將閩南語(Hokkien)轉換為英語,讓說閩南語的民眾可直接和英語人士對話! 該翻譯系統參考自台灣的語音語料庫,藉此建立一個語音翻譯資料集,未來將開放資料集的原始碼,鼓勵更多人進行閩南語翻譯。 一般翻譯工具主要是將文字轉換為文字,而這套翻譯系統特別的是支援語音轉語音,能夠將沒有標準書寫文字系統、通常以口語表達的語言,轉換為另一種語言。 Meta表示,這個翻譯系統是Meta Universal Speech Translator(UST,通用語音翻譯工具)專案的一部分,該專案致力於開發新的AI方法,希望最終能為所有現存語言進行即時語音翻譯。
2024年2月28日 · 井琪說,日前已透過遠傳核心電信網路,結合微軟生成式AI語音辨識服務,連接至微軟位於北美的測試環境,成功完成全台第一個「中文對多國語言的行動通訊雙向語音即時翻譯」、「中文詐騙對話內容即時辨識攔截」兩項關鍵服務測試。 微軟在MWC 2024上宣布了一項全新服務「Azure Operator Call Protection」,使用AI來保護消費者免受電話詐騙侵害。 Azure Operator Call Protection透過對語音內容進行即時分析,當通話中出現可疑行為時,會向消費者發出警報。 Operator Call Protection適用於所有終端裝置(包含手機及有線電話機),並且完全基於網路運作,無需下載應用程式,因此可以作為進階功能或套裝服務的一部分進行銷售。
2023年11月22日 · 〔記者王憶紅/台北報導〕宏正自動科技(6277) 看準虛擬主播熱潮,今日宣布旗下的文字轉語音技術服務-「宏正優聲學」強勢進攻虛擬主播應用市場,與國內知名廣播產品設備代理商民陞(Men Shing)公司合作,在今(22)日舉行的「2023 DATE SUMMIT數位商務大趨勢|國際匯壇」展出共同打造超級AI虛擬主持人。 宏正表示,宏正優聲學以及民陞的3D擬真人像技術,開創全新感官體驗,未來將會持續進攻AI虛擬新聞主播、廣告配音及電話行銷等市場,並將持續開發創新應用。 宏正消費產品中心及研發中心協理張教勇指出,宏正優聲學整合AI深度學習與聲學技術,提供最自然的台灣口音語音合成,其線上服務可快速為大量影片、有聲書或教材配上媲美真人的專業台灣口音配音,且無需額外軟體。
2023年5月14日 · 目前該程是有IOS及網頁板,且視訊通話功能只支援iPhone 12或以後機種,其餘僅能透過聲音與Annie對談,Call Annie開發人員也向Reddit透露,該程式會儲存任何聲音,但語音內容會轉成文字傳送到ChatGPT,用戶也可將對話刪除,預期未來能有記憶性且支援
2023年10月16日 · 除了外貌,聲音在新聞播報中也扮演重要角色,微軟Azure AI語音服務的 TTS(文字轉語音)及Viseme技術實現了「敏熙」自然且順暢人聲的關鍵。 這2個技術相輔相成,不僅能生成嘴型與聲音吻合的AI臉部影像,也能進一步實現多國語系主播的可能,「敏熙」現在已可以進行綜合中文及英文的播報內容。 微軟指出,不同於傳統如機械音般的文字轉語音服務,Azure AI語音服務擁有豐富模型,提供140種語系以上、超過400個近似真人發音的預建神經語音模型供選擇;除了預建模型,Azure AI語音服務還支援自訂模型,可根據需求調整語音的風格、速度、音調等參數,進而生成貼近真人主播具備情緒及抑揚頓挫的語音。
2024年3月2日 · 《日經亞洲》引述高通業務總經理馬拉迪(Durga Malladi)指出,繼大型語言模型(LLM)之後,大型多模態模型(Large Multimodal Model;LMM)是人工智慧的下1個關鍵戰場,後者支撐著ChatGPT等生成應用程式。 馬拉迪表示,雖然大多數人工智慧聊天機器人僅限於基於文字的對話,但LMM將能夠接受和產生不同類型的信息,包括語音、圖像,甚至視訊。 日前 Open AI所發布的Sora,就是能夠根據文字提示產生場景,這標誌著人工智慧能力向前邁出了重要一步。 馬拉迪強調,「下一步是文字到影片的生成」。 今日我們談論靜態圖像以及語音、語言,明天我們將開始看到動態圖像和視訊。 高通運用AI人工智慧領域,包括智慧型手機、筆記型電腦,甚至汽車領域。