什么是全双工?字节跳动的Seeduplex模型意味着什么?以及SOLO新功能猜想!

对于4月9日字节跳动发布的全球首个落地的全双工模型Seeduplex并没有引起TRAE友们热议,其主要原因是它和AI编程相关性并不大,另一个原因是“全双工是啥?”,目前字节跳动的Seeduplex已经内置豆包中,相信有部分人已经体验过了,有些人也并没有感知到上线。

为什么今天提出这件事呢,在昨天,TRAE&影石Insta360联名产品的公众号文章中提到了未来SOLO将要上线的功能——实时问答互动


信息源自:SOLO 桌面端+网页端语音输入功能上线,TRAE × 影石 Insta360 限定 Mic Air 正式发布!
我在第一时间就想到了全双工模型Seeduplex(如果猜错,就当猜错!),秉持着热心分享知识的理念,在这里向大家通俗的介绍一下单工、半双工和全双工!内容源自网络+自身理解+MTC润色,经过人工审核!

:satellite_antenna: 一句话版本

模式 解释 类比
单工 只能单向输出 :radio: 收音机
半双工 你说完我再说 :tractor: 对讲机
全双工 同时说,互不干扰 :telephone_receiver: 打电话

:one: 单工(Simplex)—— “我说话,你听着”

信息只能单向流动,像单行道 :motorway:。发送方只管发,接收方只管收。

AI 中的表现:

  • 早期文本生成模型就是典型单工
  • 你给一个 prompt,模型噼里啪啦输出一大段,过程中你没法打断
  • 就像点了一份外卖 :steaming_bowl:,厨房开始做了,你只能等
你:帮我写一首关于春天的诗
AI:(疯狂输出中……)
    春风拂面花满枝,燕子归来柳色新……
你:(想喊"我要七言绝句!"——喊不出来 😭)

:white_check_mark: 实现简单 :cross_mark: 没法实时纠偏


:two: 半双工(Half-Duplex)—— “你先说完,我再接”

双方都能收发,但不能同时。同一时刻只有一方在说话,像打乒乓球 :ping_pong:

AI 中的表现:

  • 这就是咱们熟悉的 ChatGPT 式对话
  • 你发一条 → AI 回一条 → 你再发,一来一回交替进行
  • AI 生成回复时,你没法同时给它发新消息
你:今天天气怎么样?
AI:今天北京晴,25°C,适合出门~
你:那穿什么好?
AI:建议薄外套或长袖……

:white_check_mark: 交互体验不错 :cross_mark: 遇到理解偏差要等它说完才能纠正


:three: 全双工(Full-Duplex)—— “咱俩一起说!”

双方可以同时收发,像面对面聊天 :busts_in_silhouette:。不需要等对方说完就能开口。

AI 中的表现:

  • 目前 AI 交互的前沿方向 :fire:
  • 代表产品:GPT-4o 语音模式Gemini Live
  • 可以随时打断 AI,就像跟真人聊天
  • AI 能同时"听"和"说",甚至感知语气情绪
你:帮我讲讲量子力学——
AI:量子力学是研究微观粒子行为的——
你:(打断)太复杂了,用小学生能懂的话说!
AI:(立刻切换)好的!想象你有一个魔法硬币……

:white_check_mark: 体验最自然,实时纠偏 :cross_mark: 技术难度大,对算力和网络要求高


:ice: 对比总览

      单工            半双工           全双工
     ──────>         <──────>         <====>
   单向流动         交替双向         同时双向

   📻 收音机        🚜 对讲机        📞 电话

   早期文本生成      ChatGPT 对话     豆包 语音/视频
单工 半双工 全双工
方向 单向 交替双向 同时双向
打断 :cross_mark: :cross_mark: :white_check_mark: 随时
技术难度 :star: :star::star::star: :star::star::star::star::star:
体验感 :neutral_face: :blush: :star_struck:

口诀:单工单向不回头,半双轮流你和我,全双同时一起说!

结尾

那么这个模型出现意味着什么,它将和你的朋友、家人等交谈一样,无需对方全部说完,你随时打断插话,并且对认知理解更加精准,成为真正意义上的赛博伙伴

1 个赞