#!/usr/bin/env python3
'''
Name: subseasonal_stats_grid2grid_create_weekly_avg.py
Contact(s): Shannon Shields
Abstract: This script is run by subseasonal_stats_grid2grid_create_job_
          scripts.py in ush/subseasonal.
          This script is used to create weekly averages
          for variable from netCDF output.
'''

import os
import sys
import numpy as np
import glob
import netCDF4 as netcdf
import datetime
import subseasonal_util as sub_util

print("BEGIN: "+os.path.basename(__file__))

# Read in environment variables
DATA = os.environ['DATA']
RUN = os.environ['RUN']
NET = os.environ['NET']
VERIF_CASE = os.environ['VERIF_CASE']
STEP = os.environ['STEP']
COMPONENT = os.environ['COMPONENT']
VERIF_TYPE = os.environ['VERIF_TYPE']
job_name = os.environ['job_name']
MODEL = os.environ['MODEL']
WEEKLYSTART = os.environ['WEEKLYSTART']
DATE = os.environ['DATE']
valid_hr_start = os.environ['valid_hr_start']
valid_hr_end = os.environ['valid_hr_end'] 
valid_hr_inc = os.environ['valid_hr_inc']
fhr_list = os.environ['fhr_list'].split(',')
fhr_inc = '12'

# Process run time arguments
if len(sys.argv) != 4:
    print("FATAL ERROR: Not given correct number of run time arguments..."
          +os.path.basename(__file__)+" VARNAME_VARLEVEL DATAROOT_FILE_FORMAT "
          +"COMIN_FILE_FORMAT")
    sys.exit(1)
else:
    if '_' not in sys.argv[1]:
        print("FATAL ERROR: variable and level runtime argument formatted "
              +"incorrectly, be sure to separate variable and level with "
              +"an underscore (_), example HGT_P500")
        sys.exit(1)
    else:
        var_level = sys.argv[1]
        print("Using var_level = "+var_level)
    DATAROOT_file_format = sys.argv[2]
    COMIN_file_format = sys.argv[3]

# Set input and output directories
output_dir = os.path.join(DATA, VERIF_CASE+'_'+STEP, 'METplus_output',
                          RUN+'.'+DATE)

# Create weekly average files
print("\nCreating weekly average files")
valid_hr = int(valid_hr_start)
while valid_hr <= int(valid_hr_end):
    weekly_avg_valid_end = datetime.datetime.strptime(DATE+str(valid_hr),
                                                      '%Y%m%d%H')
    weekly_avg_valid_start = datetime.datetime.strptime(WEEKLYSTART
                                                        +str(valid_hr),
                                                        '%Y%m%d%H')
    weekly_avg_day_end = int(fhr_list[-1])/24
    weekly_avg_day_start = 7
    weekly_avg_day = weekly_avg_day_start
    while weekly_avg_day <= weekly_avg_day_end:
        weekly_avg_day_fhr_end = int(weekly_avg_day * 24)
        weekly_avg_file_list = []
        weekly_avg_day_fhr_start = weekly_avg_day_fhr_end - 168
        weekly_avg_day_init = (weekly_avg_valid_end
                              - datetime.timedelta(days=weekly_avg_day))
        weekly_avg_day_fhr = weekly_avg_day_fhr_start
        output_file = os.path.join(output_dir, MODEL,
                                   VERIF_CASE,
                                   'weekly_avg_'
                                   +VERIF_TYPE+'_'+job_name+'_init'
                                   +weekly_avg_day_init.strftime('%Y%m%d%H')
                                   +'_valid'
                                   +weekly_avg_valid_start\
                                   .strftime('%Y%m%d%H')+'to'
                                   +weekly_avg_valid_end\
                                   .strftime('%Y%m%d%H')+'.nc')
        if os.path.exists(output_file):
            os.remove(output_file)
        weekly_avg_fcst_sum = 0
        weekly_avg_fcst_file_list = []
        weekly_avg_obs_sum = 0
        weekly_avg_obs_file_list = []
        while weekly_avg_day_fhr <= weekly_avg_day_fhr_end:
            weekly_avg_day_fhr_valid = (
                weekly_avg_day_init
                + datetime.timedelta(hours=weekly_avg_day_fhr)
            )
            weekly_avg_day_fhr_DATAROOT_input_file = sub_util.format_filler(
                    DATAROOT_file_format, weekly_avg_day_fhr_valid,
                    weekly_avg_day_init, 
                    str(weekly_avg_day_fhr), {}
            )
            weekly_avg_day_fhr_COMIN_input_file = sub_util.format_filler(
                    COMIN_file_format, weekly_avg_day_fhr_valid,
                    weekly_avg_day_init,
                    str(weekly_avg_day_fhr), {}
            )
            if os.path.exists(weekly_avg_day_fhr_COMIN_input_file):
                weekly_avg_day_fhr_input_file = (
                    weekly_avg_day_fhr_COMIN_input_file)
            else:
                weekly_avg_day_fhr_input_file = (
                    weekly_avg_day_fhr_DATAROOT_input_file
                )
            if os.path.exists(weekly_avg_day_fhr_input_file):
                print("Input file for forecast hour "+str(weekly_avg_day_fhr)
                      +', valid '+str(weekly_avg_day_fhr_valid)
                      +', init '+str(weekly_avg_day_init)+": "
                      +weekly_avg_day_fhr_input_file)
                input_file_data = netcdf.Dataset(weekly_avg_day_fhr_input_file)
                input_file_data_var_list = list(input_file_data.variables.keys())
                fcst_var_level = 'fcst_var_hold'
                obs_var_level = 'obs_var_hold'
                for input_var in input_file_data_var_list:
                    if 'FCST_'+var_level in input_var:
                        fcst_var_level = input_var
                    if 'OBS_'+var_level in input_var:
                        obs_var_level = input_var
                if fcst_var_level in input_file_data_var_list:
                    weekly_avg_fcst_sum = (weekly_avg_fcst_sum +
                                          input_file_data.variables[
                                              fcst_var_level
                                          ][:])
                    weekly_avg_fcst_file_list.append(weekly_avg_day_fhr_input_file)
                if obs_var_level in input_file_data_var_list:
                    weekly_avg_obs_sum = (weekly_avg_obs_sum +
                                         input_file_data.variables[
                                             obs_var_level
                                         ][:])
                    weekly_avg_obs_file_list.append(weekly_avg_day_fhr_input_file)
            else:
                print("No input file for forecast hour "+str(weekly_avg_day_fhr)
                      +', valid '+str(weekly_avg_day_fhr_valid)
                      +', init '+str(weekly_avg_day_init)+" "
                      +weekly_avg_day_fhr_DATAROOT_input_file+" or "
                      +weekly_avg_day_fhr_COMIN_input_file)
            weekly_avg_day_fhr+=int(fhr_inc)
        if len(weekly_avg_fcst_file_list) >= 12:
            weekly_avg_fcst = (
                weekly_avg_fcst_sum/len(weekly_avg_fcst_file_list)
            )
        if len(weekly_avg_obs_file_list) >= 12:
            weekly_avg_obs = (
                weekly_avg_obs_sum/len(weekly_avg_obs_file_list)
            )
        if fhr_inc == '12':
            expected_nfiles = 12
        if len(weekly_avg_fcst_file_list) >= expected_nfiles \
                and len(weekly_avg_obs_file_list) >= expected_nfiles:
            print("Output File: "+output_file)
            output_file_data = netcdf.Dataset(output_file, 'w',
                                              format='NETCDF3_CLASSIC')
            for attr in input_file_data.ncattrs():
                if attr == 'FileOrigins':
                    output_file_data.setncattr(
                        attr, 'Weekly Fcst Mean from '
                        +','.join(weekly_avg_fcst_file_list)+';'
                        +'Weekly Obs Mean from '
                        +','.join(weekly_avg_obs_file_list)
                    )
                else:
                    output_file_data.setncattr(
                        attr, input_file_data.getncattr(attr)
                    )
            for dim in list(input_file_data.dimensions.keys()):
                output_file_data.createDimension(
                    dim,
                    len(input_file_data.dimensions[dim])
                )
            for data_name in ['FCST', 'OBS']:
                for input_var in input_file_data_var_list:
                    if data_name+'_'+var_level in input_var:
                        input_var_level = input_var
                write_data_name_var = output_file_data.createVariable(
                    data_name+'_'+var_level+'_WEEKLYAVG',
                    input_file_data.variables[input_var_level]\
                    .datatype,
                    input_file_data.variables[input_var_level]\
                    .dimensions
                )
                k_valid_time = weekly_avg_valid_end.strftime('%Y%m%d_%H%M%S')
                k_valid_time_ut = int(
                    (weekly_avg_valid_end
                     -datetime.datetime.strptime('19700101','%Y%m%d'))\
                    .total_seconds()
                )
                k_init_time = weekly_avg_day_init.strftime('%Y%m%d_%H%M%S')
                k_init_time_ut = int(
                    (weekly_avg_day_init
                     -datetime.datetime.strptime('19700101','%Y%m%d'))\
                    .total_seconds()
                )
                for k \
                        in input_file_data.variables[
                            input_var_level
                        ].ncattrs():
                    if k == 'valid_time':
                        write_data_name_var.setncatts(
                            {k: k_valid_time}
                        )
                    elif k == 'valid_time_ut':
                        write_data_name_var.setncatts(
                            {k: k_valid_time_ut}
                        )
                    elif k == 'init_time' and data_name == 'FCST':
                        write_data_name_var.setncatts(
                            {k: k_init_time}
                        )
                    elif k == 'init_time_ut' and data_name == 'FCST':
                        write_data_name_var.setncatts(
                            {k: k_init_time_ut}
                        )
                    elif k == 'init_time' and data_name == 'OBS':
                        write_data_name_var.setncatts(
                            {k: k_valid_time}
                        )
                    elif k == 'init_time_ut' and data_name == 'OBS':
                        write_data_name_var.setncatts(
                            {k: k_valid_time_ut}
                        )
                    else:
                        write_data_name_var.setncatts(
                            {k: input_file_data.variables[
                                 input_var_level
                             ].getncattr(k)}
                        )
                if data_name == 'FCST':
                    write_data_name_var[:] = weekly_avg_fcst
                elif data_name == 'OBS':
                    write_data_name_var[:] = weekly_avg_obs
            if len(list(output_file_data.variables.keys())) == 0:
                print("No variables in "+output_file+", removing")
                output_file_data.close()
                os.remove(output_file)
            else:
                output_file_data.close()
            input_file_data.close()
        else:
            print("WARNING: Cannot create weekly average file "+output_file+" "
                  +"; need at least "+str(expected_nfiles)+" input files")
        weekly_avg_day+=7
        print("")
    valid_hr+=int(valid_hr_inc)
    
print("END: "+os.path.basename(__file__))