You are viewing a plain text version of this content. The canonical link for it is here.

Posted to commits@climate.apache.org by hu...@apache.org on 2015/09/25 17:52:49 UTC

[1/2] climate git commit: CLIMATE-671 - Inappropriate spatial subset for datasets on curvilinear grids

Repository: climate
Updated Branches:
  refs/heads/master d2861dea4 -> 4ad37eb93


CLIMATE-671 - Inappropriate spatial subset for datasets on curvilinear grids

- ocw.dataset_processsor.subset now handles target_datasets on curvilinear grids where target_datasets.lats and target_datasets.lons are two dimensional variables


Project: http://git-wip-us.apache.org/repos/asf/climate/repo
Commit: http://git-wip-us.apache.org/repos/asf/climate/commit/9eac1f67
Tree: http://git-wip-us.apache.org/repos/asf/climate/tree/9eac1f67
Diff: http://git-wip-us.apache.org/repos/asf/climate/diff/9eac1f67

Branch: refs/heads/master
Commit: 9eac1f67ac661acd912aaf6b4111de57d3da142c
Parents: 7f34fc3
Author: huikyole <hu...@argo.jpl.nasa.gov>
Authored: Mon Sep 21 16:29:04 2015 -0700
Committer: huikyole <hu...@argo.jpl.nasa.gov>
Committed: Mon Sep 21 16:29:04 2015 -0700

----------------------------------------------------------------------
 ocw/dataset_processor.py | 147 ++++++++++++++++++++++++++----------------
 1 file changed, 93 insertions(+), 54 deletions(-)
----------------------------------------------------------------------


http://git-wip-us.apache.org/repos/asf/climate/blob/9eac1f67/ocw/dataset_processor.py
----------------------------------------------------------------------
diff --git a/ocw/dataset_processor.py b/ocw/dataset_processor.py
index d7b1a3f..cb92171 100755
--- a/ocw/dataset_processor.py
+++ b/ocw/dataset_processor.py
@@ -257,48 +257,75 @@ def subset(subregion, target_dataset, subregion_name=None):
         subregion_name = target_dataset.name
 
    # Slice the values array with our calculated slice indices
-    if target_dataset.values.ndim == 2:
-        subset_values = ma.zeros([len(target_dataset.values[
-            dataset_slices["lat_start"]:dataset_slices["lat_end"]]), 
-            len(target_dataset.values[
-                dataset_slices["lon_start"]:dataset_slices["lon_end"]])])
-
-        subset_values = target_dataset.values[
-            dataset_slices["lat_start"]:dataset_slices["lat_end"] + 1,
-            dataset_slices["lon_start"]:dataset_slices["lon_end"] + 1]
-
-    elif target_dataset.values.ndim == 3:
-        subset_values = ma.zeros([len(target_dataset.values[
-            dataset_slices["time_start"]:dataset_slices["time_end"]]),
-            len(target_dataset.values[
+    if target_dataset.lats.ndim ==1 and target_dataset.lons.ndim ==1:
+        if target_dataset.values.ndim == 2:
+            subset_values = ma.zeros([len(target_dataset.values[
                 dataset_slices["lat_start"]:dataset_slices["lat_end"]]), 
-            len(target_dataset.values[
-                dataset_slices["lon_start"]:dataset_slices["lon_end"]])])
+                len(target_dataset.values[
+                    dataset_slices["lon_start"]:dataset_slices["lon_end"]])])
+
+            subset_values = target_dataset.values[
+                dataset_slices["lat_start"]:dataset_slices["lat_end"] + 1,
+                dataset_slices["lon_start"]:dataset_slices["lon_end"] + 1]
+
+        elif target_dataset.values.ndim == 3:
+            subset_values = ma.zeros([len(target_dataset.values[
+                dataset_slices["time_start"]:dataset_slices["time_end"]]),
+                len(target_dataset.values[
+                    dataset_slices["lat_start"]:dataset_slices["lat_end"]]), 
+                len(target_dataset.values[
+                    dataset_slices["lon_start"]:dataset_slices["lon_end"]])])
         
-        subset_values = target_dataset.values[
-            dataset_slices["time_start"]:dataset_slices["time_end"] + 1,
-            dataset_slices["lat_start"]:dataset_slices["lat_end"] + 1,
-            dataset_slices["lon_start"]:dataset_slices["lon_end"] + 1]
+            subset_values = target_dataset.values[
+                dataset_slices["time_start"]:dataset_slices["time_end"] + 1,
+                dataset_slices["lat_start"]:dataset_slices["lat_end"] + 1,
+                dataset_slices["lon_start"]:dataset_slices["lon_end"] + 1]
+            
+        # Build new dataset with subset information
+        return ds.Dataset(
+            # Slice the lats array with our calculated slice indices
+            target_dataset.lats[dataset_slices["lat_start"]: 
+                                dataset_slices["lat_end"] + 1],
+            # Slice the lons array with our calculated slice indices
+            target_dataset.lons[dataset_slices["lon_start"]: 
+                                dataset_slices["lon_end"] + 1],
+            # Slice the times array with our calculated slice indices
+            target_dataset.times[dataset_slices["time_start"]: 
+                                dataset_slices["time_end"]+ 1],
+            # Slice the values array with our calculated slice indices
+            subset_values,
+            variable=target_dataset.variable,
+            units=target_dataset.units,
+            name=subregion_name,
+            origin=target_dataset.origin
+        )
+    elif target_dataset.lats.ndim ==2 and target_dataset.lons.ndim ==2:        
+        y_index = dataset_slices["y_index"]
+        x_index = dataset_slices["x_index"]
+        if target_dataset.values.ndim == 2:
+            subset_values = target_dataset.values[y_index, x_index]
+        
+        elif target_dataset.values.ndim == 3:
+            nt = dataset_slices["time_end"] - dataset_slices["time_start"] +1
+            subset_values = ma.zeros([nt, len(y_index)])
+            for it in np.arange(nt):
+                subset_values[it,:] = target_dataset.values[dataset_slices["time_start"]+it, y_index, x_index]
+        return ds.Dataset(
+            # Slice the lats array with our calculated slice indices
+            target_dataset.lats[y_index, x_index],
+            # Slice the lons array with our calculated slice indices
+            target_dataset.lons[y_index, x_index],
+            # Slice the times array with our calculated slice indices
+            target_dataset.times[dataset_slices["time_start"]:
+                                dataset_slices["time_end"]+ 1],
+            # Slice the values array with our calculated slice indices
+            subset_values,
+            variable=target_dataset.variable,
+            units=target_dataset.units,
+            name=subregion_name,
+            origin=target_dataset.origin
+        )    
             
-    # Build new dataset with subset information
-    return ds.Dataset(
-        # Slice the lats array with our calculated slice indices
-        target_dataset.lats[dataset_slices["lat_start"]: 
-                            dataset_slices["lat_end"] + 1],
-        # Slice the lons array with our calculated slice indices
-        target_dataset.lons[dataset_slices["lon_start"]: 
-                            dataset_slices["lon_end"] + 1],
-        # Slice the times array with our calculated slice indices
-        target_dataset.times[dataset_slices["time_start"]: 
-                            dataset_slices["time_end"]+ 1],
-        # Slice the values array with our calculated slice indices
-        subset_values,
-        variable=target_dataset.variable,
-        units=target_dataset.units,
-        name=subregion_name,
-        origin=target_dataset.origin
-    )
-
 
 def safe_subset(subregion, target_dataset, subregion_name=None):
     '''Safely subset given dataset with subregion information
@@ -1092,22 +1119,34 @@ def _get_subregion_slice_indices(subregion, target_dataset):
 
     :returns: The indices to slice the Datasets arrays as a Dictionary.
     '''
-    latStart = min(np.nonzero(target_dataset.lats >= subregion.lat_min)[0])
-    latEnd = max(np.nonzero(target_dataset.lats <= subregion.lat_max)[0])
-
-    lonStart = min(np.nonzero(target_dataset.lons >= subregion.lon_min)[0])
-    lonEnd = max(np.nonzero(target_dataset.lons <= subregion.lon_max)[0])
-
-
     timeStart = min(np.nonzero(target_dataset.times >= subregion.start)[0])
     timeEnd = max(np.nonzero(target_dataset.times <= subregion.end)[0])
 
-    return {
-        "lat_start"  : latStart,
-        "lat_end"    : latEnd,
-        "lon_start"  : lonStart,
-        "lon_end"    : lonEnd,
-        "time_start" : timeStart,
-        "time_end"   : timeEnd
-    }
+    if target_dataset.lats.ndim ==1 and target_dataset.lons.ndim ==1:
+        latStart = min(np.nonzero(target_dataset.lats >= subregion.lat_min)[0])
+        latEnd = max(np.nonzero(target_dataset.lats <= subregion.lat_max)[0])
+
+        lonStart = min(np.nonzero(target_dataset.lons >= subregion.lon_min)[0])
+        lonEnd = max(np.nonzero(target_dataset.lons <= subregion.lon_max)[0])
+
+
+        return {
+            "lat_start"  : latStart,
+            "lat_end"    : latEnd,
+            "lon_start"  : lonStart,
+            "lon_end"    : lonEnd,
+            "time_start" : timeStart,
+            "time_end"   : timeEnd
+        }
+    elif target_dataset.lats.ndim ==2 and target_dataset.lons.ndim ==2:    
+        y_index, x_index = np.where((target_dataset.lats >= subregion.lat_min) & 
+                                    (target_dataset.lats <= subregion.lat_max) &
+                                    (target_dataset.lons >= subregion.lon_min) &
+                                    (target_dataset.lons <= subregion.lon_max))
+        return {
+            "y_index"    : y_index,
+            "x_index"    : x_index,
+            "time_start" : timeStart,
+            "time_end"   : timeEnd
+        }

[2/2] climate git commit: CLIMATE-671 - Inappropriate spatial subset for datasets on curvilinear grids

Posted by hu...@apache.org.

CLIMATE-671 - Inappropriate spatial subset for datasets on curvilinear grids


Project: http://git-wip-us.apache.org/repos/asf/climate/repo
Commit: http://git-wip-us.apache.org/repos/asf/climate/commit/4ad37eb9
Tree: http://git-wip-us.apache.org/repos/asf/climate/tree/4ad37eb9
Diff: http://git-wip-us.apache.org/repos/asf/climate/diff/4ad37eb9

Branch: refs/heads/master
Commit: 4ad37eb93aa7a8d3adc6a2af78f160188539f99f
Parents: d2861de 9eac1f6
Author: huikyole <hu...@argo.jpl.nasa.gov>
Authored: Fri Sep 25 08:52:24 2015 -0700
Committer: huikyole <hu...@argo.jpl.nasa.gov>
Committed: Fri Sep 25 08:52:24 2015 -0700

----------------------------------------------------------------------
 ocw/dataset_processor.py | 147 ++++++++++++++++++++++++++----------------
 1 file changed, 93 insertions(+), 54 deletions(-)
----------------------------------------------------------------------