Alic-yuan · chenny3 · Aug 20, 2020 · Aug 20, 2020 · Aug 20, 2020 · Aug 20, 2020
diff --git a/task2/torch_model.py b/task2/torch_model.py
@@ -4,7 +4,6 @@
 import torch
 from torch import nn
 import numpy as np
-from torch.autograd import Variable
 import torch.nn.functional as F
 
 
@@ -18,7 +17,7 @@ def __init__(self):
         self.rnn = nn.LSTM(input_size=64, hidden_size=128, bidirectional=True)
         # self.rnn = nn.GRU(input_size=64, hidden_size=128, num_layers=2, bidirectional=True)
         self.f1 = nn.Sequential(nn.Linear(256, 10),
-                                nn.Softmax())
+                                nn.Softmax(-1))   # 新版pytorch使用softmax时应指定维度，否则会抛出use_warning
 
     def forward(self, x):
         x = self.embedding(x) # batch_size x text_len x embedding_size 64*600*64

diff --git a/task2/torch_test.py b/task2/torch_test.py
@@ -8,7 +8,6 @@
 from torch import nn
 from cnews_loader import read_category, read_vocab
 from torch_model import TextCNN,TextRNN
-from torch.autograd import Variable
 import numpy as np
 
 try:

diff --git a/task2/torch_train.py b/task2/torch_train.py
@@ -4,7 +4,6 @@
 import torch
 from torch import nn
 from torch import optim
-from torch.autograd import Variable
 import os
 
 import numpy as np
@@ -17,25 +16,28 @@ def evaluate(model, Loss, x_val, y_val):
     batch_val = batch_iter(x_val, y_val, 64)
     acc = 0
     los = 0
-    for x_batch, y_batch in batch_val:
-        size = len(x_batch)
-        x = np.array(x_batch)
-        y = np.array(y_batch)
-        x = torch.LongTensor(x)
-        y = torch.Tensor(y)
-        # y = torch.LongTensor(y)
-        # x = Variable(x)
-        # y = Variable(y)
-        out = model(x)
-        loss = Loss(out, y)
-        # optimizer.zero_grad()
-        # loss.backward()
-        # optimizer.step()
-        loss_value = np.mean(loss.detach().numpy())
-        accracy = np.mean((torch.argmax(out, 1) == torch.argmax(y, 1)).numpy())
-        acc +=accracy*size
-        los +=loss_value*size
-    return los/len(x_val), acc/len(x_val)
+    model.eval()   
+    with torch.no_grad():
+        for x_batch, y_batch in batch_val:
+            size = len(x_batch)
+            x = np.array(x_batch)
+            y = np.array(y_batch)
+            x = torch.LongTensor(x)
+            y = torch.Tensor(y)
+            # y = torch.LongTensor(y)
+            # x = Variable(x)
+            # y = Variable(y)
+            out = model(x)
+            loss = Loss(out, y)
+            # optimizer.zero_grad()
+            # loss.backward()
+            # optimizer.step()
+            loss_value = np.mean(loss.numpy())
+            accracy = np.mean((torch.argmax(out, 1) == torch.argmax(y, 1)).numpy())
+            acc +=accracy*size
+            los +=loss_value*size
+        model.train()  
+        return los/len(x_val), acc/len(x_val)
 
 
 base_dir = 'cnews'
@@ -49,6 +51,7 @@ def train():
     x_val, y_val = process_file(val_dir, word_to_id, cat_to_id,600)
     #使用LSTM或者CNN
     model = TextRNN()
+    model.train()
     # model = TextCNN()
     #选择损失函数
     Loss = nn.MultiLabelSoftMarginLoss()
@@ -78,7 +81,7 @@ def train():
 
             # 对模型进行验证
             if i % 90 == 0:
-                los, accracy = evaluate(model, Loss, optimizer, x_val, y_val)
+                los, accracy = evaluate(model, Loss,  x_val, y_val)  # 此处不需要优化器参数
                 print('loss:{},accracy:{}'.format(los, accracy))
                 if accracy > best_val_acc:
                     torch.save(model.state_dict(), 'model_params.pkl')