AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行( 二 )
有了这么庞大的数据集之后 , 那接下来便面临两个问题 。
第一个问题是如何管理这些高质量的数据集 , 实现这点 , GAL用了两步:
所有数据都以一种通用的标记格式进行处理 , 打通各种来源数据之间的壁垒 。
预训练中包含用于特定任务的数据集 , 这就能保证在处理特定任务时能够更加专业 。
还有一个问题是:如何设计界面交互?
首先就像上文提到的那样 , GAL能够支持不同类型的任务 。
因此在设计界面交互时便对各种任务进行分类 , 不同的分类会支持不同的类型的数据 。

文章图片
既然GAL拥有高度管理和高质量的科学数据集 , 那和其他模型相比效果如何?
直接上数据!
推理方面 , GAL的优势脱颖而出 , 在数学MMLU(大规模多任务语言理解)上 , 表现要优于Chinchilla , 数学方面 , 表现也优于PalM540B和GPT-3175B 。

文章图片

文章图片
尽管 , GAL并没有经过一般数据集的训练 , 但它在BIG-bench上的表现仍旧优于BLOOM和OPT-175B 。

文章图片
看完之后是不是也心痒痒了 , 先码住再说!
- 2022年12月6-7日|领军·杰出|锦江之星品牌白玉兰品牌再度斩获行业大奖
- 要干掉谷歌的ChatGPT,将成为下一代搜索引擎?
- 小爱同学|进化了!小爱同学6.0正式发布:小米13系列首批升级
- Hunt Good 周报|智商 83 的 ChatGPT,不想只做搜索引擎
- 芯片|顶级芯片+一英寸超大底 vivo X90 Pro+全面进化
- 一生以船为家,巴瑶族被科学家认为在“进化”?会成“新人种”吗
- 关闭ChatGPT与搜索引擎合体,谷歌都不香了,LeCun转发|在线可玩
- 折叠屏|张老板再度官宣,OPPO Find N2系列终于来了,亮点都在视频里
- 超实用的影视搜索引擎!一键搜罗N个蓝光播放源,比爱优腾都好用
- 电池|6000mAh+44W闪充+5000万!发布三个月跌至939元,再度沦为百元机
