乔治亚大学的一项新研究旨在通过结合人类评分和人工智能技术,提升对儿童创造力评估的准确性。
玛丽弗朗西斯早期教育学院的研究团队正在开发一种人工智能系统,以便更精确地对小学生在创造力评估中的开放式回答进行评分。
该研究的作者、教育心理学副教授丹尼斯·杜马斯表示:“就像医院需要准确的病人数据,教育系统同样需要可靠的学生数据,以便做出有效的决策。”他补充道:“创造力评估与政策和课程密切相关,缺乏评估数据,我们无法全面支持学校的创造力发展。”
这些测试通常用于识别有天赋的学生,以便为他们提供额外的教学资源。然而,由于评估过程耗时较长——大多数开放式回答需要由多位训练有素的评委打分——因此它们的使用频率远不及数学、阅读或智商测试。通过构建人工智能系统,创造力评估有望成为学校更易于使用的工具。
为了提升人工智能的评分能力,杜马斯和他的团队分析了超过1万份个人在30分钟创造力评估中的回答。他们发现,某些学生类别和回答类型导致评委对创造力的评分不一致。所有可识别的学生信息都被从评估中移除,评委仅接收到学生的回答。
“我们的评委并不知道这些孩子的身份或具体的人口特征,”杜马斯说。“虽然没有明显的偏见,但一些学生的回答方式使得我们的团队难以对其进行可靠评分。”
评委们被要求在1分(最缺乏独创性)和5分(最具独创性)之间进行评分,当回答的独创性较低或来自年龄较小的孩子或男学生时,他们更可能出现评分不一致的情况。
杜马斯表示:“我原以为评分者在独创性方面会有更多的分歧,但我们发现,由于评委们重视独创性,当答案显得不同寻常、令人惊讶和聪明时,他们更容易达成一致。”他补充道:“然而,当一个答案在原创性方面得分较低时,分歧就会增多。”
例如,当被问及帽子的奇特用途时,一名三年级学生回答:“你把遮阳的部分剪掉,看起来会很傻。”对此回答的评分范围从1到4,研究强调了这一例子,表明年龄较小的学生的回答难以评价。一些评委认为这不是原创,因为帽子仍然是可穿戴的物品,而其他人则认为帽子的外观变化有趣且令人惊讶,符合一个有创造力的三年级学生的年龄特点。
天赋异禀的学生的原创回答也表现出更大的评分差异,拉丁裔学生被视为英语学习者,而亚裔学生在任务上花费了更多时间。这些因素导致了更多的评分分歧。
“会说两种语言的孩子,他们的回答方式与只会说一种语言的孩子不同。”杜马斯指出:“尽管我们的许多读者也会说两种语言,但在评分时应用起来却很困难。我们一次又一次发现,那些更可能会说两种语言的学生也更难被评价。”
杜马斯表示,了解评分分歧的来源有助于重新训练人工智能系统,使其更加准确,从而减少评估结果的误差范围。他指出,这些误差范围是学校常用的评估标准,但在创造力评估中,误差范围可能比数学或阅读测试更大。误差范围越小,学校在根据分数做出决策时就越有信心。
杜马斯表示,这项研究是提高这些评估准确性、增强信心的一步。
“学校评估的内容往往反映了教师在教学中的关注点。因此,可以通过他们选择的评估观察到学校系统的价值和优先事项。”他希望能够在学校心理学家的工具包中更多地引入创造力评估,以便他们有机会观察幼儿的创造潜力,并将其视为一种优势。
这项研究发表在《创造性行为杂志》上。
本文来自作者[东郭爱娜]投稿,不代表八木号立场,如若转载,请注明出处:https://jaxi.cnbmelink.com/wdcf/202412-5331.html
评论列表(4条)
我是八木号的签约作者“东郭爱娜”!
希望本篇文章《人工智能可以改善对儿童创造力的评估》能对你有所帮助!
本站[八木号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:乔治亚大学的一项新研究旨在通过结合人类评分和人工智能技术,提升对儿童创造力评估的准确性。玛丽弗朗西斯早期教育学院的研究团队正在开发一种人工智能系统,以便更精确地对小学生在创造力...