对于很多人来说,学数学就像是一场噩梦。数学难,高数更是难!前段时间,百度AI虚拟人度晓晓挑战高考作文得分48分一度冲上热搜,今天#AI考高数仅得81分#又冲上热搜!从人工智能技术发展至今,科学家一直尝试让AI机器人挑战数学考试,但连年不及格,甚至低到20多分。

2011年,日本让机器人挑战考上东京大学,却连续6年落榜
2015年,全国各地上千支AI队伍挑战8年级科学题目,但最高准确率仅有59%
2020年,强如CPT-3,在9-12岁的小学数学上仅得了20多分,经过重新训练后才勉强拿到55分
因此,人们普遍认为人工智能无法挑战高数。然而近日,麻省理工的科学家基于OpenAI Codex预训练模型在高数上通过few-shot learning的正确率达到了81%!相关研究已经被ArXiv收录。

研究者发现,让AI解决数学问题存在多种方案。首先利用最新的GPT-3语言模型通过文本预训练,使用小样本学习仅能达到18.8%的准确率,其次研究者尝试使用小样本学习和最新的思维连提示,正确率上升到了30.8%。最后,研究者对代码进行微调,使用Codex进行少量学习的方式,让AI挑战麻省理工学院六门数学课程中210道问题,正确率提升到了81.1%,研究团队的解决思路是先在文本上做预训练,再用代码进行微调,把数学问题转换成等价的编程问题。
通过让AI自动生成补充题干的上下文,将题目自动生成适合模型运行的文本后,再生成对应的代码并运行。最终解决数学问题!
热门活动
车型识别可识别车辆的具体车型,以小汽车为主,输出图片中主体车辆的品牌、型号、年份、颜色、百科词条信息;可识别三千款常见车型,准确率90%以上。...
条形码ocr识别api可检测识别图片中的条形码(包括CODE_128、UPC_A、EAN_13、ITF、CODABAR等9类),且自动返回存储的内容。...
百度OCR增值税发票识别服务,已支持普票、专票、卷票、区块链发票、全电发票(即新版全国统一电子发票,专票/普票)的所有关键字段识别,“加料不加价”,单次调用低至0.017元;增值税发票验真服务,已覆盖全部12类增值税发票的信息核验,包括专票......
欢聚时代成立于2005年4月,国内首家富集通讯业务运营商,致力于打造最酷的网络直播公司,为全球用户提供团队语音服务,是当前国内领先的互联网语音视频平台提供商之一。欢聚时代怀揣着年轻的激情,运用创新的技术,缔造覆盖全球的富集通讯服务。...
银行汇票识别支持对普通商业承兑汇票、普通银行承兑汇票、电子商业承兑汇票等多类汇票的21个关键字段进行结构化识别,可应用于企业记账及财务核算等场景,能够有效控制业务风险,提升财务核算效率,实现财税报销的自动化。...
天行车享是天行用车科技(深圳)有限公司推出的电动汽车分时租赁平台,专注于新能源汽车共享经济领域,定位城市新能源出行运营商,为用户提供环保、便捷、舒适的都市智能出行服务。...
医疗检验报告单识别可用于在线问诊,用户上传各项检验报告单,自动识别提取关键字段信息,提升医生解读效率,为用户提供更加快捷、全面的个性化健康指导。...
专题推荐