init.py

import multiprocessing
import os
import queue
import torch
import threading
import copy
import torch.nn as nn
import torch.optim as optim
import pandas as pd
import time
import glob
import numpy as np
import dill
from torch.cuda.amp import autocast, GradScaler
from torch.utils.data import Dataset, DataLoader
from tqdm import tqdm
from transformers import BertModel,BertPreTrainedModel,BertForSequenceClassification,BertTokenizer,AutoTokenizer,AutoModelForSequenceClassification

TRAIN_WEIGHT=0.9
SEQ_LEN=5  # 5
LEARNING_RATE=0.00001   # 0.00001
WEIGHT_DECAY=0.05   # 0.05
BATCH_SIZE=4
EPOCH=1
SAVE_NUM_ITER=10
SAVE_NUM_EPOCH=1
# GET_DATA=True
TEST_NUM=25
SAVE_INTERVAL=300
TEST_INTERVAL=-1  # 100
OUTPUT_DIMENSION=4
INPUT_DIMENSION=30   ## max input dimension
TQDM_NCOLS = 150
NUM_WORKERS = 1
PKL = True
BUFFER_SIZE = 10
D_MODEL = 512
NHEAD = 8
WARMUP_STEPS = 60000
# checkpoint = "bert-base-uncased"
checkpoint = 'bert-base-chinese'
symbol = 'Generic.Data'
# symbol = '000001.SZ'

loss_list=[]
data_list=[]
mean_list=[]
std_list=[]
test_mean_list = []
test_std_list = []
safe_save = False
# data_queue=multiprocessing.Queue()
data_queue=queue.Queue()
test_queue=queue.Queue()
stock_data_queue=queue.Queue()
stock_list_queue = queue.Queue()
csv_queue=queue.Queue()
df_queue=queue.Queue()

NoneDataFrame = pd.DataFrame(columns=["ts_code"])
NoneDataFrame["ts_code"] = ["None"]

## tushare data list
# name_list = ["open", "high", "low", "close", "change", "pct_chg", "vol", "amount"]
# use_list = [1,1,1,1,0,0,0,0]
# show_list = [1,1,1,1,0,0,0,0]


## akshare data list
name_list = ["open","close","high","low","vol","amount","amplitude","pct_change","change","exchange_rate"]
use_list = [1,1,1,1,0,0,0,0,0,0]
show_list = [1,1,1,1,0,0,0,0,0,0]

## yfinance data list
# name_list = ["open","close","high","low","vol"]
# use_list = [1,1,1,1,0]
# show_list = [1,1,1,1,0]

OUTPUT_DIMENSION = sum(use_list)
# INPUT_DIMENSION = 20+OUTPUT_DIMENSION

assert OUTPUT_DIMENSION > 0

device=torch.device("cuda" if torch.cuda.is_available() else "cpu")
if device.type == "cuda":
    torch.backends.cudnn.benchmark = True

def check_exist(address):
    if os.path.exists(address) == False:
        os.mkdir(address)
root_path="."
train_path=root_path+"/stock_handle/stock_train.csv"
test_path=root_path+"/stock_handle/stock_test.csv"
train_pkl_path=root_path+"/pkl_handle/train.pkl"
png_path=root_path+"/png"
daily_path=root_path+"/stock_daily"
handle_path=root_path+"/stock_handle"
pkl_path=root_path+"/pkl_handle"
bert_data_path=root_path+"/bert_data"
data_path=root_path+"/stock_data"

cnname = ""
for item in symbol.split("."):
    cnname += item
lstm_path=root_path+"/"+cnname+"/LSTM"
transformer_path=root_path+"/"+cnname+"/TRANSFORMER"
cnnlstm_path=root_path+"/"+cnname+"/CNNLSTM"
save_path=lstm_path

check_exist(root_path+"/" + cnname)
check_exist(handle_path)
check_exist(daily_path)
check_exist(pkl_path)
check_exist(png_path)
check_exist(png_path+"/train_loss/")
check_exist(png_path+"/predict/")
check_exist(png_path+"/test/")
check_exist(bert_data_path)
check_exist(bert_data_path+'/model/')
check_exist(bert_data_path+'/data/')