我试图强调IMDB数据集中的重要词汇,这最终有助于情绪分析预测。
数据集类似于:
x_train-作为字符串的评论。
Y_系列-0或1
现在,在使用手套嵌入来嵌入x列值之后,我可以将其输入神经网络。
现在我的问题是,我如何强调最重要的词概率的意义?就像Deepmoji.mit.edu?
我试过什么:
-
我试着把输入的句子分成两个句子,然后用1dcn来训练它。稍后,当我们想找到x_检验的重要词时,我们只需将x_检验拆分成两个大公数,并找出它们的概率。它起作用,但不准确。
-
我尝试使用预先构建的分级关注网络并成功了。我得到了我想要的,但我不能从代码中找出每一行和每一个概念,对我来说就像一个黑匣子。
我知道神经网络是如何工作的,我可以用numpy和手工从头开始的反向传播对其进行编码。我对LSTM的工作原理以及忘记、更新和输出门实际输出有详细的了解。但是我仍然不知道如何提取注意力权重以及如何将数据作为一个三维数组(我们的二维数据中的时间步长是什么?)
所以,欢迎任何形式的指导