from Time_Series_Sieve import *
from tqdm import trange


def series_generator_example(n):
    np.random.seed(2020)
    x = list(np.random.randn(2))
    for i in range(2, n):
        x.append(0.6 * math.sin(2 * np.pi * (i + 1) / n) * x[-1] + 0.4 * math.cos(2 * np.pi * (i + 1) / n) * x[-2] + np.random.normal())
    return x


n = 1000
b = 2
c = 5
true_series = [[0.6 * math.sin(2 * np.pi * (i + 1) / n) for i in range(b, n)], [0.4 * math.cos(2 * np.pi * (i + 1) / n) for i in range(b, n)]]
series = np.array(series_generator_example(n))


sieve_obj = SieveOLS(series, 'legendre', b, c)


sieve_obj.choose_b_intuitive()


sieve_obj.cross_validation_bc()


b = 2
c = 4
sieve_obj = SieveOLS(series, 'legendre', b, c)


sieve_obj.versus_plot_true(true_series)


b = 2
c = 5
sieve_obj = SieveOLS(series, 'legendre', b, c)


sieve_obj.versus_plot_true(true_series)


c = 5
sieve_obj = SieveOLS(series, 'triangle', b, c)


sieve_obj.choose_b_intuitive()


sieve_obj.cross_validation_bc()


c = 3
sieve_obj = SieveOLS(series, 'triangle', b, c)


sieve_obj.versus_plot_true(true_series)


c = 2
sieve_obj = SieveOLS(series, 'db14', b, c)


sieve_obj.choose_b_intuitive()


sieve_obj.cross_validation_bc()


c = 2
sieve_obj = SieveOLS(series, 'db14', b, c)


sieve_obj.versus_plot_true(true_series)


sieve_obj = SieveOLS(series, 'sym14', b, c)


sieve_obj.choose_b_intuitive()


sieve_obj.cross_validation_bc()


c = 1
sieve_obj = SieveOLS(series, 'db14', b, c)


sieve_obj.versus_plot_true(true_series)


c = 2
sieve_obj = SieveOLS(series, 'db14', b, c)


sieve_obj.versus_plot_true(true_series)


sieve_obj = SieveOLS(series, 'coif5', b, c)


sieve_obj.choose_b_intuitive()


sieve_obj.cross_validation_bc()


c = 1
sieve_obj = SieveOLS(series, 'db14', b, c)


sieve_obj.versus_plot_true(true_series)


c = 2
sieve_obj = SieveOLS(series, 'db14', b, c)


sieve_obj.versus_plot_true(true_series)


def series_generator_example2(n):
    np.random.seed(2023)
    x = list(np.random.randn(2))
    for i in range(2, n):
        x.append(0.3 * x[-1] + 0.1 * x[-2] + np.random.normal())
    return x


true_series2 = [[0.3 for i in range(b, n)], [0.1 for i in range(b, n)]]
series2 = np.array(series_generator_example2(n))


c = 5
sieve_obj2 = SieveOLS(series2, 'triangle', b, c)


sieve_obj2.stability_test(b, c)

('not reject', 0.992)


sieve_obj2 = SieveOLS(series2, 'legendre', b, c)


sieve_obj2.stability_test(b, c)

('not reject', 0.984)


c = 2
sieve_obj2 = SieveOLS(series2, 'db16', b, c)


sieve_obj2.stability_test(b, c)

('not reject', 0.995)


def series_generator_single(data, n):
    x_1, x_2 = data[0], data[1]
    yield x_1
    yield x_2
    for i in range(2, n):
        x_1, x_2 = x_2, 0.3 * x_2 + 0.1 * x_1 + data[i]
        yield x_2
        
def series_generator_matrix(n, m):
    np.random.seed(2022)
    x = np.random.randn(m, n)
    return np.array([list(series_generator_single(x[i], n)) for i in range(m)])


n = 1000
m = 1000
series_matrix = series_generator_matrix(n, m)


def bootstrap_trial(data, func_type, b, c, alpha=0.05):
    test_list = []
    with trange(len(data)) as pbar:
        for i in pbar:
            test_list.append(SieveOLS(data[i], func_type, b, c).stability_test(b, c))
            simulated_type_I_error = sum([_[0] == 'reject' for _ in test_list]) / len(test_list)
            pbar.set_description("Simulated Type I Error={}".format(simulated_type_I_error))
    return test_list


c = 5
test_list1 = bootstrap_trial(series_matrix, 'legendre', b, c)

Simulated Type I Error=0.066: 100%|██████████████████████████████████████████████| 1000/1000 [1:04:57<00:00,  3.90s/it]


test_list2 = bootstrap_trial(series_matrix, 'triangle', b, c)

Simulated Type I Error=0.048: 100%|██████████████████████████████████████████████| 1000/1000 [4:27:14<00:00, 16.03s/it]


c = 2
test_list3 = bootstrap_trial(series_matrix, 'db16', b, c)

Simulated Type I Error=0.043: 100%|██████████████████████████████████████████████| 1000/1000 [5:53:34<00:00, 21.21s/it]


def series_generator_example(n):
    np.random.seed(2022)
    x = list(np.random.randn(1))
    for i in range(1, n):
        x.append((math.sin(2 * np.pi * (i + 1) / n)) * math.exp(- x[-1] ** 2) + np.random.normal())
    return x


def true_function_series(t, x):
    return (math.sin(2 * np.pi * t)) * math.exp(- x ** 2)


n = 4000
series = np.array(series_generator_example(n))


b = 1
c1 = 5
c2 = 4


sieve_obj = SieveOLS2D(series, series, 'legendre', 'legendre', 'algebraic', b, c1, c2)


flexible_sequence_time = np.arange(1, n) / n
flexible_sequence_series = np.arange(1, 5 * n) / n
b_index = 1


for fixed_value in np.arange(1, 10) / 10:
    sieve_obj.mimic_function_compara(true_function_series, 'time', fixed_value, flexible_sequence_series, b_index)
    sieve_obj.mimic_function_compara(true_function_series, 'series', fixed_value, flexible_sequence_time, b_index)


sieve_obj.mimic_function_compara_3d(true_function_series, 1, np.arange(0, 1.001, 0.01), np.arange(0, 3.001, 0.01))


sieve_obj.cross_validation()


def null_function_1(t, x):
    return (math.sin(2 * np.pi * t)) * math.exp(- x ** 2)


def null_function_2(t, x):
    return (math.sin(2 * np.pi * t) + 1) * math.exp(- x ** 2)


for fixed_value in np.arange(1, 10) / 10:
    sieve_obj.simultaneous_confidence_region_compara(null_function_1, 'time', fixed_value, flexible_sequence_series, b_index)
    sieve_obj.simultaneous_confidence_region_compara(null_function_1, 'series', fixed_value, flexible_sequence_time, b_index)

index of split i=99: 100%|███████████████████████████████████████████████████████████| 100/100 [00:17<00:00,  5.84it/s]
index of Tau list k=999: 100%|█████████████████████████████████████████████████████| 1000/1000 [00:15<00:00, 64.48it/s]


for fixed_value in np.arange(1, 10) / 10:
    sieve_obj.time_homogeneity_compara(flexible_sequence_series, any_time = fixed_value)


def series_generator_example2(n):
    np.random.seed(2022)
    x = list(np.random.randn(1))
    for i in range(1, n):
        x.append(math.exp(- x[-1] ** 2) + np.random.normal())
    return x


n = 4000
series2 = np.array(series_generator_example2(n))


sieve_obj2 = SieveOLS2D(series2, series2, 'legendre', 'legendre', 'algebraic', b, c1, c2)


for fixed_value in np.arange(1, 10) / 10:
    sieve_obj2.time_homogeneity_compara(flexible_sequence_series, any_time = fixed_value)

index of split i=99: 100%|███████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 20.04it/s]
index of Tau list k=999: 100%|█████████████████████████████████████████████████████| 1000/1000 [00:14<00:00, 69.34it/s]


def series_generator_example3(n):
    np.random.seed(1)
    x = list(np.random.randn(1))
    for i in range(1, n):
        x.append((math.sin(2 * np.pi * (i + 1) / n) + 2) * math.exp(- x[-1] ** 2) + np.random.normal())
    return x


series3 = np.array(series_generator_example3(n))


fixed_value_sequence = np.arange(1, 10) / 10
sequence_time = np.arange(1, 100) / 100
sequence_series = np.arange(1, 500) / 100


sieve_obj3 = SieveOLS2D(series3, series3, 'legendre', 'legendre', 'algebraic', b, c1, c2)


sieve_obj3.separablity(fixed_value_sequence, sequence_time, sequence_series)

index of split i=99: 100%|███████████████████████████████████████████████████████████| 100/100 [00:05<00:00, 17.02it/s]
index of Tau list k=999: 100%|█████████████████████████████████████████████████████| 1000/1000 [00:15<00:00, 63.57it/s]


sieve_obj.exact_form_test(null_function_1, 1)

('not reject', 0.18999999999999995)


sieve_obj.exact_form_test(null_function_2, 1)

('reject', 0.0)


def series_generator_single(data, n):
    x_1 = data[0]
    yield x_1
    for i in range(1, n):
        x_1 = (math.sin(2 * np.pi * (i + 1) / n)) * math.exp(- x_1 ** 2) + data[i]
        yield x_1
        
def series_generator_matrix(n, m):
    np.random.seed(1)
    x = np.random.randn(m, n)
    return np.array([list(series_generator_single(x[i], n)) for i in range(m)])


n = 1000
m = 1000
series_matrix = series_generator_matrix(n, m)


def bootstrap_trial(data, func_type_time, func_type_series, mapping_type, alpha=0.05):
    test_list = []
    with trange(len(data)) as pbar:
        for i in pbar:
            sieve_obj2 = SieveOLS2D(data[i], data[i], func_type_time, func_type_series, mapping_type, b, c1, c2)
            test_list.append(sieve_obj2.exact_form_test(null_function_1, 1, alpha))
            simulated_type_I_error = sum([_[0] == 'reject' for _ in test_list]) / len(test_list)
            pbar.set_description("Simulated Type I Error={}".format(simulated_type_I_error))
    return test_list


test_list1 = bootstrap_trial(series_matrix, 'triangle', 'legendre', 'algebraic', alpha=0.1)

Simulated Type I Error=0.154: 100%|████████████████████████████████████████████████| 1000/1000 [40:06<00:00,  2.41s/it]


sum([_[1] < 0.05 for _ in test_list1])

75


ABML_df = pd.read_csv('series-250822.csv')
ABML_time_series = ABML_df[ABML_df.columns[1]][81: 304].to_numpy().astype(float)
ABML_second_diff = np.diff(np.diff(ABML_time_series))


plt.plot(np.arange(len(ABML_time_series)), ABML_time_series)
plt.title('ABML time series')
plt.show()


plt.plot(np.arange(len(ABML_second_diff)), ABML_second_diff)
plt.title('ABML second order diff')
plt.show()


for c_index in range(2, 6):
    ABML_obj = SieveOLS(ABML_second_diff, 'legendre', 2, c_index)
    ABML_obj.choose_b_intuitive()


for c_index in range(2, 7):
    ABML_obj = SieveOLS(ABML_second_diff, 'triangle', 2, c_index)
    ABML_obj.choose_b_intuitive()


for c_index in range(1, 5):
    ABML_obj = SieveOLS(ABML_second_diff, 'db16', 2, c_index)
    ABML_obj.choose_b_intuitive()


with open('PEAS.txt') as f:
    lines = f.readlines()
    PEAS_time_series = np.array([_.split() for _ in lines[1:]]).astype(float).flatten()


plt.plot(np.arange(len(PEAS_time_series)), PEAS_time_series)
plt.title('PEAS time series')
plt.show()


for c_index in range(2, 7):
    PEAS_obj = SieveOLS(PEAS_time_series, 'legendre', 2, c_index)
    PEAS_obj.choose_b_intuitive()


for c_index in range(2, 7):
    PEAS_obj = SieveOLS(PEAS_time_series, 'triangle', 2, c_index)
    PEAS_obj.choose_b_intuitive()


for c_index in range(1, 6):
    PEAS_obj = SieveOLS(PEAS_time_series, 'db16', 2, c_index)
    PEAS_obj.choose_b_intuitive()


exchange_df = pd.read_csv('ei_mfrt_m.tsv', sep='\t', header=0)
Euro_Dollar_time_series = exchange_df.iloc[37,58:].to_numpy().astype(float)[::-1]
Euro_Dollar_time_series_log = np.diff(np.log(Euro_Dollar_time_series))


plt.plot(np.arange(len(Euro_Dollar_time_series_log)), Euro_Dollar_time_series_log)
plt.title('Eu-USD-log time series')
plt.show()


for c_index in range(2, 7):
    EuDO_obj = SieveOLS(Euro_Dollar_time_series_log, 'legendre', 2, c_index)
    EuDO_obj.choose_b_intuitive()


for c_index in range(2, 7):
    EuDO_obj = SieveOLS(Euro_Dollar_time_series_log, 'triangle', 2, c_index)
    EuDO_obj.choose_b_intuitive()


for c_index in range(1, 6):
    EuDO_obj = SieveOLS(Euro_Dollar_time_series_log, 'db16', 2, c_index)
    EuDO_obj.choose_b_intuitive()

Introduction¶

AR approximation and its applications¶

Cholesky decomposition and Estimation¶

Choose b¶

Choose c¶

Inference on Structure: Stability Test¶

choose parameter m¶

Simulation for estimation¶

Simulation for inference¶

Non-Linear and non-stationary time series regression model¶

Model Description and Estimation¶

Choose c, d¶

Inference on Structure: Simultaneous Confidence Region(SCR) and Exact Form Test¶

Choose Parameter m¶

Application of SCR: Time-homogeneity Test and Separability Test¶

Simulation for Estimation¶

Simulation for Inference¶

Simulation for Simultaneous Confidence Region(SCR)¶

Simulation for Time-homogeneity Test¶

Simulation for Separability Test¶

Simulation for Exact Form Test¶

Real Dataset¶

ABML Time Series¶

Precipitation in Eastport¶

Euro-Dollar exchange rate¶