Yahoo奇摩 網頁搜尋

搜尋結果

  1. 2024年3月28日 · AI 大模型正在加强与各行各业的融合,这篇文章里,作者就分析了 Hippocratic AI 这款专注于开发高度专业化的 AI 代理、专注于为患者提供情绪价值的健康通用人工智能(HGI)产品,不妨来看一下。. Hippocratic AI 是一家致力于为医疗保健行业构建大语言模型 ...

  2. 2024年5月20日 · 针里寻针(Needle in a Needlestack,NIAN)是最近非常流行的开源基准测试,用于评估大模型关注上下文内容的能力。 做了8年产品经理后,我是这么看产品经理的. 我个人是从非常初级的产品经理做起,再到负责一个大产品的项目管理,现在有幸跳出了日常基础的工作更多的去看产品的PMF,product strategy... 查看详情 > 大语言模型的进展导致曾经流行的基准测试「大海捞针」已经过时,在此基础上,更具挑战性的「针里寻针」测试诞生了。 https://github.com/llmonpy/needle-in-a-needlestack.

  3. 2024年4月28日 · 自媒体人必备:文心一言、Kimi等4款AI大模型测评对比及推荐. 现在,国内已经有海量大模型诞生,那么,哪款大模型的表现会更好?. 这篇文章里,作者站在自媒体人的角度,对四款大模型做了评估和对比,一起来看一下。. 说到AI,很多人会想到ChatGPT ...

  4. 2023年7月20日 · 蔡格尼克效应(Zeigarnik effect)是心理学家Β.Β.蔡格尼克在在一项记忆实验中发现的心理现象。 她让被试者做22件简单的工作,如写下一首你喜欢的诗,从55倒数到17,把一些颜色和形状不同的珠子按一定的模式用线穿起来,等等。 完成每件工作所需要的时间大体相等,一般为几分钟。 在这些工作中,只有一半允许做完,另一半在没有做完时就受到阻止。 允许做完和不允许做完的工作出现的顺序是随机排列的。 做完实验后,在出乎被试意料的情况下,立刻让他回忆做了22件什么工作。 结果是未完成的工作平均可回忆68%,而已完成的工作只能回忆43%。 在上述条件下,未完成的工作的记忆比已完成的工作保持得较好,这种现象就叫蔡格尼克效应。

  5. 2024年3月11日 · 一、性能看齐 GPT-4,算力只需40% 具体来看,初代Inflection-1通过使用GPT-4的4%训练FLOPs,达到了GPT-4性能的72%。 而刚发布的Inflection-2.5,仅使用了GPT-4训练FLOPs的40%,就在平均性能上实现显著提升,超过了GPT-4水平的94%,其中STEM(科学、技术、工程、数学)领域的增益最大。 官方测试了升级版对匈牙利数学考试以及物理学研究生入学GRE考试的表现。 发现Inflection-2.5在maj@8中能排到人类考生的前15%,在maj@32中几乎可以跻身前5%,接近GPT-4的前3%。 MBPP+和HumanEval+两个编程测试上模型能力也较Inflection-1显著跃升。

  6. 2024年4月29日 · 凹凸电波是一档两性杂谈类脱口秀节目,在全音频平台有158W+粉丝,获得了2022首届中文播客奖年度情感类MVP。. 我家人还是凹凸的puls付费会员,我家客厅经常回荡他们几位主播的笑声。. 尽管他们的创始人TAKO一直说他们是个“草台班子”,说他们成为 ...

  7. 2024年5月5日 · 01. 到底什么是AI agent? 它是怎么工作的呢? 先来看一个词:“agent”,中文意思是代理人。 代理人,你可以理解成有人帮你去做某件事。 那么,AI agent是什么? 简单来说,一个由AI技术加持的代理人,它变得更聪明了,可以感知周围的环境,并且能够独立地思考和行动。 你有没有用过对话式的大模型(LLM),比如:文心一言、Kimi Chat、或者智谱AI? AI agent和对话式模型区别在于,你不用一直告诉它要做什么,只要给它一个目标,就能想办法自动帮你完成。 所以,大模型(LLM)要很多各种各样的数据,数据帮助它,学习的和人一样具备交流、学习、思考和推理的能力。