百万量级的多模态对话数据集来了,153万张图片4000多主题( 二 )
简单来说 , 该模型包括一个回复模态意图预测模块和一个回复排序模块 , 它们具有相似的模型结构 , 并利用CLIP分别编码对话历史U以及回复候选集C中的文本和图像 。
在模态意图预测模块做出下一个元素的模态预测后 , 排序模块会从C中选择与其相关性最高的作为多模态回复的组成部分 , 直到模态意图预测模块判定已被完整检索回为止 。

文章图片
研究团队本篇论文的研究团队来自北大和微软 。

文章图片
其中一作冯家展 , 是北京大学智能学院的博士生 , 在MSRA实习期间完成本次研究 。
论文和GitHub链接附在文末 , 如果你是硕士生/博士生/博士后/教职员工/研究型员工等 , 可以点击申请访问权限~
GitHub链接:
https://github.com/victorsungo/MMDialog论文链接:
https://arxiv.org/abs/2211.05719参考链接:
https://mp.weixin.qq.com/s/SArX84T1CDW6p2jWGxPc8A—完—
【百万量级的多模态对话数据集来了,153万张图片4000多主题】量子位QbitAI·头条号签约
- 手机同质化一直非常的严重|小米13系列好评满满,骁龙8gen2比苹果a16更强
- 买七彩虹RTX30显卡、整机送大礼了!CF限定礼包快抢来自买七彩虹的消息|买七彩虹rtx30显卡、整机送大礼了!cf限定礼包快抢
- 12月13日消息|苹果appletv4k搭载的a15处理器为5核心
- AMD的RX7900系列显卡昨晚解禁了|RX 7900赢回一波 4K视频生产力终于超越RTX4090
- 月球是哪儿来的?同样是内太阳系行星的水星、金星和火星|月球身世之谜是怎么形成的?
- 当代超级计算机的局限性|量子计算的现在与未来
- 坐在隔壁工位的哔哥最近感慨很深|盘点qq下架的衍生品
- 13代酷睿目前还没有65WTDP型号的主流产品|绝配12代酷睿华擎迷你准系统到手1279元(1.92L体积)
- 12月14日|oppo第二颗自研芯片将到来,网友猜测可能是手环一类的
- 对于最近想要购买手机的小伙伴而言|骁龙8gen2的新旗舰一加acepro值得入手吗?
