Yahoo奇摩 網頁搜尋

  1. 相關搜尋:

搜尋結果

  1. 2024年5月15日 · GPT-4o能同时输入和输出文本、音频和图像信息,反应速度最短达到了232毫秒,完全可做到与人类在正常对话中同频。 腾讯新闻评价,GPT-4o的发布,使得ChatGPT进入实时互动纪元。 图片来源:机器之心. 最近,专业人士曾对所有的大模型做了评分测试,结果发现, GPT-4o的得分高达1310,性能远超GPT-4 Turbo、GPT-4、Gemini等模型,刷新业界水平。 怪不得OpenAI创始人、CEO山姆·奥特曼说:“(GPT)对我来说就像魔法一样”。 在发布会上,为了展现GPT-4o的魅力,OpenAI的三位高管米拉·穆拉蒂(Mira Murati)、陈马克(Marc Chen)和巴雷特·琐法(Barret Zoph)在台上做起了演示,向观众展示了五大应用场景。

  2. 2024年5月14日 · 它成功地把文本、视觉、音频全部打通了,这意味着 GPT-4o 可以接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。 这对多模态大模型来说,是一个重大改变。 拿此前 ChatGPT 的语音模式为例,它要用到三个独立模型组成的管道,一个模型负责将音频转录为文本,第二个模型是 GPT-4 ,它负责接收文本并输出文本,第三个模型则将该文本转换回音频。 这个过程意味最中间的主角 GPT-4 收到的信息其实是二手的 —— 它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感等等。 而在最新的 GPT-4o 模型中,所有输入和输出,都由同一神经网络处理,也就是说,新的 GPT-4o 是一个原生的多模态模型,而非之前的组合模型,它解决了上述的所有缺点。

  3. 2024年5月14日 · 作者|苑桢 袁博. 来源 | AI先锋官. 今日凌晨1点,OpenAI举办春季线上直播,宣布将推出桌面版ChatGPT,并发布全新旗舰AI模型GPT-4o。 1、GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出。 2、GPT-4o向所有人免费开放,且其响应速度达到GPT-4 Turbo的2倍,而API定价却只有GPT-4 Turbo的一半。 3、GPT-4o响应速度达到GPT-4 Turbo的2倍。 其能够以快至232毫秒的速度对音频输入做出反应,平均响应时间约为320毫秒。 4、与现有模型相比,GPT-4o在视觉和音频理解方面非常出色。 特别是具备了“看”世界的能力。

  4. 2024年5月14日 · 北京时间5月14日凌晨,OpenAI在一场26分钟的直播中发布了新一代旗舰生成模型GPT-4o,展示了可以毫秒级反应、识别人类情绪进行音视频交互,可多模态输入/输出等一系列新能力。 伴随这些能力的还有一个新的桌面版的ChatGPT以及新的用户界面,首席技术官米拉(Mira Murati)表示,这是为了让更多人更方便地使用,她宣布了OpenAI的产品理念:免费优先。 发布会结束后,OpenAI首席执行官山姆·奥特曼在个人社交平台发布了一个单词:她(her)。 在科幻电影《她》里,AI助理爱上了人类,而今天,具备新功能、接入GPT-4o的ChatGPT语音助手产品,似乎真的有望让科幻电影的桥段走入现实。 识别表情语气、可随时打断 GPT-4o展示“真”语音助手.

  5. 2024年5月13日 · 5月14日凌晨,OpenAI在官网正式发布了新旗舰模型GPT-4o,可跨视频、音频、文本进行实时推理,全球生成式AI领域再次迎来历史性时刻。 OpenAI通过GPT-4o打造的语音版ChatGPT助手,可以与用户跨音频、视频进行交流,例如,让GPT-4o进行实时翻译、唱歌、做数学题、讲笑话等。 简单点说吧,以后家教、翻译、秘书的饭碗都不保了。 2013年曾获得奥斯卡最佳原创剧本的电影《Her》,为我们呈现了一场人与AI的“恋情”,Her的无所不能展现出了AI强大和恐怖的一面。 11年后,GPT-4o将这部电影变成了现实,人人都可以拥有一个Her。 GPT-4o功能展示. OpenAI对GPT-4o的功能进行了大量展示,这里「AIGC开放社区」就选几个有代表性的吧。

  6. 2024年5月14日 · GPT-4o 模型的所有升级,其实都可以总结为原生多模态能力的全面提升,不仅是文本、音频和图像任意组合的输入、输出,同时各自的理解能力也有明显的进步。 尤其是图像理解。 在这张图片中,有被部分遮挡的书本,还有一台正在运行游戏的手机,GPT-4o 不仅能准确识别书本上文字,根据知识库或者联网正确地识别出完整的书名, 最让人惊艳的是能直接看出手机正在运行的游戏——《原神》。 图/ ChatGPT. 坦白讲,熟悉《原神》这款游戏的玩家大概都能一眼看出本体,但仅凭这张图片,很多没玩过游戏、不了解游戏角色的人基本都认不出《原神》。 当小雷询问 ta 怎么看出是《原神》时,GPT-4o 的回答也符合逻辑:无非就是画面内容、游戏界面以及视觉风格。 图/ ChatGPT.

  7. 2024年5月16日 · 美国当地时间5月13日OpenAI发布了旗舰模型GPT-4o该模型新增了语音对话情感感知和图像识别等功能意味着通用大模型的能力边界再次得到大幅提升。 自去年十月我们举办生成式人工智能论坛并发布相关调研报告至今,已过去半年有余。 在这段期间,生成式人工智能以超乎所有人预期的速度迭代发展,其技术路线和实际应用场景得到了进一步的探索与挖掘,引起了一波又一波的讨论热潮。 那么,在这半年多的时间里,生成式人工智能展现了哪些值得我们关注的新发展趋势? 我们将在本文讨论。 一、开源大模型持续演进,开源与闭源的争论加剧. 在去年发布的调研报告中,我们曾讨论过关于大模型开源与闭源的利与弊。 半年多的时间过去,两个阵营都取得了不俗的进展,但关于开源还是闭源的争论却变得愈发激烈。

  1. 其他人也搜尋了