RECON/linear-universal.py at main · for0nething/RECON · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
import argparse
import numpy as np
from warnings import simplefilter
simplefilter(action='ignore', category=FutureWarning)
np.seterr(all='ignore')
from MLModel.optimizer import *
from MLModel.LoadData import *
from MLModel.MLmodel.linearRegression import *
from MLModel.paramRange import *
from MLModel.LoadCoreset import *
from MLModel.hidden import *

def test(method='sgd', data='movieLen1M', exp_decay=1, subset_size=1., greedy=1, shuffle=0, g_cnt=-1.,
         b_cnt=-1., num_runs=10, metric='', reg=1e-5, rand='', ne=-1, from_all=0,coreset_from='scratch', batch=1, sampleSize=0):
    train_data, train_target, val_data, val_target, test_data, test_target = load_dataset(data, regression=True)
    print("Dataset Loaded")

    g_range, b_range = get_param_range(subset_size, exp_decay, method, data)
    best_f_list = []
    best_MAE_list = []
    best_MSE_list = []
    best_MSLE_list = []

    train_time_list = []

    for itr in range(num_runs):
        f_best, acc_best, b_f, g_f, b_a, g_a = 1e10, 0, 0, 0, 0, 0

        print("Cur itr is ", itr)
        if ne == -1:
            ne = 20 + int(np.ceil((1. / subset_size) * 5)) + 5 if subset_size < 1 else 20
        else:
            rand += f'_e{ne}'
        if ne > 100:
            ne = 100
        # assert greedy == 1
        if greedy == 1:
            order, weights, total_ordering_time = LoadCoreset(coreset_from, data, subset_size, batch=batch,sampleSize=sampleSize)
        else:
            print('Selecting a random subset')
            order = np.arange(0, len(train_data))
            random.shuffle(order)
            order = order[:int(subset_size * len(train_data))]
            print(' 【Random subset size】 is ', int(subset_size * len(train_data)))
            weights = np.ones(int(subset_size * len(train_data)), dtype=np.float)
        print(f'--------------- run number: {itr}, rand: {rand}, '
              f'subset: {subset_size}, subset size: {len(order)}')

        best_test_f = 0
        best_test_MAE = 0
        best_test_MSE = 0
        best_test_MSLE = 0

        print("g_range is ", g_range)
        print("b_range is ", b_range)
        for gamma in g_range:
            for b in b_range:
                dim = len(train_data[0])

                model = LinearRegression(dim)
                lr = gamma * np.power(b, np.arange(ne)) if exp_decay else gamma / (1 + b * np.arange(ne))

                st_time = time.time()
                x_s, t_s = Optimizer().optimize(
                    method, model, train_data[order, :], train_target[order], weights, ne, shuffle, lr, reg)
                en_time = time.time()
                print("Train time is ", en_time - st_time)
                train_time_list.append(en_time - st_time)

                f_s = model.loss(val_data, val_target, l2_reg=reg)

                print(f'data: {data}, method: {method}, run: {itr}, exp_decay: {exp_decay}, size: {subset_size} {rand} '
                      f'--> f: {f_s}, b: {b}, g: {gamma}')

                if f_s < f_best:
                    x_a, g_a, b_a, t_a =  x_s, gamma, b, t_s

                    f_best = f_s

                    best_test_f = model.loss(test_data, test_target)
                    best_test_MAE, best_test_MSE, best_test_MSLE = model.MASLE(test_data, test_target)
                    print("Current best f is   ", f_best)
                    print("Current best MAE is ", best_test_MAE)
                    print("Current best MSE is ", best_test_MSE)
                    print("Current best MSLE is ", best_test_MSLE)


            print(f'Best solution is => f: {f_best}, a: {acc_best}, b_f: {b_f}, g_f: {g_f}, b_a: {b_a}, g_a: {g_a}')


        best_f_list.append(f_best)
        best_MAE_list.append(best_test_MAE)
        best_MSE_list.append(best_test_MSE)
        best_MSLE_list.append(best_test_MSLE)

        print("   Current best f_list")
        print(best_f_list)
        print("Mean ", np.mean(best_f_list), "Max ", np.max(best_f_list), "Min ", np.min(best_f_list),
              "Median ", np.median(best_f_list))

        print("   Current best MAE_list")
        print(best_MAE_list)
        print("Mean ", np.mean(best_MAE_list), "Max ", np.max(best_MAE_list), "Min ", np.min(best_MAE_list),
              "Median ", np.median(best_MAE_list))


        print("   Current best MSE_list")
        print(best_MSE_list)
        print("Mean ", np.mean(best_MSE_list), "Max ", np.max(best_MSE_list), "Min ", np.min(best_MSE_list),
              "Median ", np.median(best_MSE_list))

        print("   Current best MSLE_list")
        print(best_MSLE_list)
        print("Mean ", np.mean(best_MSLE_list), "Max ", np.max(best_MSLE_list), "Min ", np.min(best_MSLE_list),
              "Median ", np.median(best_MSLE_list))


        print("Train time list(one hyper-param)")
        print(train_time_list)
        print("Mean ", np.mean(train_time_list), "Max ", np.max(train_time_list), "Min ", np.min(train_time_list), "Median ", np.median(train_time_list))
    print('Finish')
    return best_MSE_list, train_time_list, best_f_list


if __name__ == '__main__':
    p = argparse.ArgumentParser(description='Faster Training.')
    p.add_argument('--data', type=str, required=False, default='IMDB',
                   choices=['IMDBCLinear','IMDBLargeCLinear','stackLinear', 'taxi', 'stackn'], help='name of dataset')
    p.add_argument('--greedy', type=int, required=False, default=1,
                   help='greedy ordering')
    p.add_argument('--reg', type=float, required=False, default=1e-5,
                   help='L2 regularization constant')
    p.add_argument('--method', type=str, required=False, default='sgd',
                   choices=['sgd', 'svrg', 'saga', 'BGD'], help='sgd, svrg, saga, BGD')
    p.add_argument('--subset_size', '-s', type=float, required=False,
                   help='size of the subset')
    p.add_argument('--shuffle', type=int, default=2,
                   choices=[0, 1, 2, 3],
                   help='0: not shuffling, 1: random permutation, 2: with replacement, 3: fixed permutation')
    p.add_argument('--exp_decay', type=int, required=False, default=1,
                   choices=[0, 1], help='exponentially decaying learning rate')
    p.add_argument('--num_runs', type=int, required=False, default=10,
                   help='number of runs')
    p.add_argument('--metric', type=str, required=False, default='l2',
                   help='distance metric')
    p.add_argument('--b', type=float, required=False, default=-1,
                   help='learning rate parameter b')
    p.add_argument('--g', type=float, required=False, default=-1,
                   help='learning rate parameter g')
    p.add_argument('--ne', type=int, required=False, default=-1,
                   help='number of epochs')
    p.add_argument('--grad_diff', type=int, required=False, default=0,
                   help='number of epochs')
    p.add_argument('--from_all', type=int, required=False, default=0)
    p.add_argument('--coreset_from', type=str, required=False, default='diskOurs',
                   choices=['diskOurs'], help='Where to load coreset')
    args = p.parse_args()

    if args.greedy == 0:
        rand = 'rand_nw'
    elif args.greedy == 1 and args.shuffle == 1:
        rand = 'grd_shuff'
    elif args.greedy == 1 and args.shuffle == 2:
        rand = 'grd_rand'
    elif args.greedy == 1 and args.shuffle == 0:
        rand = 'grd_ord'
    elif args.greedy == 1 and args.shuffle > 2:
        rand = 'grd_fix_perm'
    else:
        rand = ''

    print("Start test time", time.asctime( time.localtime(time.time()) ))
    test(method=args.method, data=args.data, exp_decay=args.exp_decay, subset_size=args.subset_size,
         greedy=args.greedy, shuffle=args.shuffle, b_cnt=args.b, g_cnt=args.g, num_runs=args.num_runs,
         metric=args.metric, rand=rand, ne=-1, from_all=args.from_all,
         coreset_from=args.coreset_from, reg=args.reg, batch=0)
    print("Finished test time", time.asctime(time.localtime(time.time()) ))