Convolutional Knowledge Tracing: Modeling Individualization in Student Learning Process
Shuanghong Shen Enhong Chen University of Science and Technology of China sigir-20
Motivation
忽略了学生先验知识和个性化学习能力的KT及其不合理的,而在之前的工作中忽略了先验知识和学习能力对KT的重要性
Modele
文中提出了CKT(convolution knowledeg tracing)的方法在于如何更好的利用学生的先验知识和个性化的学习能力
Embedding
在输入上略有不同的是,在练习题的编码上使用的不是独热码,而是随机初始化,然后加上做作对与否的向量
将其看作是\(LIS\in \mathbb{R}^{N\times 2k}\)
Individualized Prior Knowledge.
作者在获取学生的先验知识的过程叫做为HRP(历史相关知识表现),HRP的计算公式如下所示
\[ \left\{ \begin{aligned} r_t(i)=Masking(e_i\cdot e_t ) & & i \in (t,N) \\ w_t(i)=Softmax(r_t(i)) & & i \in (1,N) \\ \end{aligned} \right.\] \[HRP_t(t)=\sum_{i=1}^{t-1}w_t(i)x_i \](其实所谓的利用先验知识在以前DKT中也有体现就是利用前面的做题记录而已)
\[CPC_t(m)=\frac{\sum_{i=0}^{t-1}a_i^m==1}{count(e^m)} \]对于知识点\(m\)答对占有的比例,最后将三部分矩阵相加的到新的矩阵\(H\in \mathbb{R}^{(2k+2k+m)\times k}\)
\[ \left\{ \begin{aligned} H = LIS+HRP+CPC\\ Q = (H\times W_1 +b_1)\times \sigma(H\times W_2 + b_2) \\ \end{aligned} \right.\]Individualized Prior Knowledge.
得到\(Q\)之后,通过卷积(超过边界部分用0填充)得到的向量再加上残差机制得到知识状态\(Z\),然后通过点乘得到预测结果,如下面公式所示
\[ \left\{ \begin{aligned} y_{t+1}=z_t\cdot e_{t+1}\\ p = \sigma(y_{t+1}) \\ \end{aligned} \right.\]Modele
在几个数据集上都有较好的实验结果
知识状态的改变情况也精准
相同知识点的相关性较强
结论
其实论文中所说的先验知识和个性化的学习能力也就是之前论文中说的历史信息,作者换了个说法而已,但是这些信息的使用方式上还是有很大的创新性。