AI考高数,“卷死”了一大帮计算机博士( 三 )
文章图片
在机器学习方面 , 它通过解释“分布外样本检测”的具体含义 , 从而正确了给出这个名词的另一种说法 。

文章图片
……
不过 , Minerva有时也会犯一些低级错误 , 比如把等式两边的√给消了 。

文章图片
除此之外 , Minerva会出现的推理过程错误但结果对的“假阳性”情况 , 比如下面这种 , 有8%的可能性 。

文章图片
经过分析之后 , 团队发现主要的错误形式来自计算错误和推理错误 , 只有小部分来自题意理解错误和在步骤中使用了错误的事实等其他情况 。
其中计算错误可以轻易通过访问外部计算器或Python解释器解决 , 但其他种类的错误因为神经网络规模太大就不太好调整了 。

文章图片
总的来看 , Minerva的表现让很多人感到惊艳 , 纷纷在评论区求API(可惜谷歌目前并没有公开计划) 。

文章图片
有的网友想到 , 加上前几日让GPT-3解题正确率暴涨61%的“哄一哄”大法 , 它的准确率或许还可以再提高?

文章图片
不过作者的回应是 , 哄一哄方法属于零样本学习 , 再强恐怕也比不上带4个例子的少样本学习 。

文章图片
还有网友提出 , 既然它可以做题 , 那么能不能反过来出题?

文章图片
事实上用AI给大学生出题这件事 , MIT已经联合OpenAI在做了 。
他们把人类出的题和AI出的题混在一起 , 找学生来做问卷调查 , 大家也很难分清一道题是不是AI出的 。

文章图片
总之现在的情况 , 除了搞AI的在忙着读这篇论文以外 。
学生们盼着有一天能用AI做作业 。

文章图片
老师们也盼着有一天能用AI出卷子 。

文章图片
论文地址:
https://storage.googleapis.com/minerva-paper/minerva_paper.pdf
Demo地址:
https://minerva-demo.github.io/
相关论文:
ChainofThought
https://arxiv.org/abs/2201.11903
Scrathpads
https://arxiv.org/abs/2112.00114
MajorityVoting
https://arxiv.org/abs/2203.11171
参考链接:
https://ai.googleblog.com/2022/06/minerva-solving-quantitative-reasoning.html
https://twitter.com/bneyshabur/status/1542563148334596098
【AI考高数,“卷死”了一大帮计算机博士】https://twitter.com/alewkowycz/status/1542559176483823622
- 腾讯云智能打法首揭秘!4条快速路让AI“开箱即用”
- 一加|一加11R参数曝光:6.7寸120Hz屏、搭载红外传感器
- 小米|插头“打架”问题终于解决:小米插线板8位总控版上架开售
- 12月13日消息|微软参展2022印度动漫展,win11“喧宾夺主”成为主角
- “通信行程卡”12月13日下线!中国信通院、三大运营商同步删除用户数据
- 垮塌|女子下班回家发现2千万豪宅“塌了”:科普何为毛细管网
- 12月13日消息|极狐gitlab与微软、神州数码达成合作
- 唉|这么又“杀”我微信了?
- 最近我们经常遇到这样的购机需求:工作为主|价格真香表现全面的“工作站级设计本”!惠普战99测评
- 食品安全|实时数据分析,亚略特边缘计算单元TrustBox赋能数字监管新模式建设
