建模:知识点掌握度

我们将提供真实的应试数据,用来训练学生知识点掌握模型,并最终预测学生的做题正确率。

I. 示例数据:

uid:6751 @ 用户id

eid:2303 @题目id

atag:1      @对错结果,1 为正确,0为错误

time:2014-11-20 05:33:14 @做题时间

length:17224 @做题时长,以毫秒计

etype:pattern#图片与单词或词组连线 @题目类型

eklist:word#bird;word#panda;word#door; @知识点

数据将以tab limited 的dat文件传播。绿色部分为本文注释,将不会出现在真正数据中。

数据量级为65万条记录。时间跨度为1个月。

 

II.Tips:

1. 内部专家指出,学生能力可能会分级。例如,可以分为识记和语用两个级别。如果要做对简单的选择和连线,学生可能只需要识记水平;如果要做对较难的短文阅读,学生则需要语用水平。因此,题型对于正确率会有影响。

2. 知识点标注可能存在冗余。以示例数据为例,可能主考点是bird和panda,door并非真正考点。

3.部分学生在面对难题时会出现随意乱作的情况。比如一道较复杂的填空题,学生可能会提交空答案。这可能可以从做题时长中判断。因为题目保密考虑,我们暂时无法提供具体的解答。

 

III.如何获取数据:

 

请发送邮件到hcraeser@17zuoye.com【逆转账户名】索取数据

虽然我们不对于数据索取费用,也不妨碍您用该数据发表论文;但是我们希望您能将研究成果与我们分享。

根据对于您研究的内部评审,您可能会得到数目可观的现金奖励。

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

一起作业的R&D窗口